MySQL集群服务器故障测试与恢复步骤解析

栏目:技术文章 发布时间:2026-04-18 09:25
通过断开网线或终止ndbd进程模拟故障,验证MySQL集群服务器自动切换能力,最终通过重启服务恢复集群功能,确保系统稳定性与数据一致性。

一、介绍

=================================

=====================================

=============================

================

==============

将Server1或Server2的网线拔掉,观察另外一台集群服务器工作是否正常(可以使用SELECT查询测试)。测试完毕后,重新插入网线即可。

如果你接触不到物理服务器,也就是说不能拔掉网线,那也可以这样测试:

在Server1或Server2上:

# ps aux | grep ndbd

将会看到所有ndbd进程信息:

MySQL集群服务器故障测试与恢复步骤解析(图1)

root      5578  0.0  0.3  6220 1964         S    03:14   0:00 ndbd

root      5579  0.0 20.4 492072 102828      R    03:14   0:04 ndbd

root     23532  0.0  0.1  3680  684 pts/1    S    07:59   0:00 grep ndbd

然后杀掉一个ndbd进程以达到破坏MySQL集群服务器的目的:

# kill -9 5578 5579

之后在另一台集群服务器上使用SELECT查询测试。并且在管理节点服务器的管理终端中执行show命令会看到被破坏的那台服务器的状态。

测试完成后,只需要重新启动被破坏服务器的ndbd进程即可:

# ndbd

注意!前面说过了,此时是不用加--initial参数的!

至此,MySQL集群就配置完成了!