failover 的音标为英 /feɪl'əʊvər/、美 /feɪl'oʊvər/,中文译为“故障转移”,是计算机系统中当主组件(如服务器、网络设备)失效时,自动将功能转移到备份组件的机制,核心是“有主有备,主故障时备接管”,以保障服务连续性和数据完整性。
作为名词,它描述系统从故障主节点切换到备用节点的过程或能力,广泛应用于数据库集群、服务器冗余、云计算等场景。实现方式分自动和手动,现代系统多采用自动化,通过心跳检测、集群管理工具(如 Pacemaker、Keepalived)完成切换,常与“failback(故障恢复)”配合,即在主节点恢复后移回资源组。
Hitless Failover:无中断切换
Failover Cluster:故障转移集群
Failover Resource:故障转移资源
Failover Time:故障转移时间
Instance Resource Redundancy Failover:实例资源冗余故障转移
发生故障转移的情况有两种:一是系统管理员指示集群中的节点执行故障转移;二是出现灾难性应用程序或服务器故障迫使资源组转移。
这一行为称为故障转移。
要解决这个问题,一定要保证资源消耗等于或小于临界值,并且采用了实例资源冗余故障恢复措施。
应用程序故障转移大约需要45秒。
故障转移对于共享内存分区是透明的。
水平克隆可以提供更大的吞吐量和故障转移能力。
故障转移也可用于维护网络应用程序的连通性。
为获得更快的故障转移性能,文件系统越小越好。
进程未能将故障切换模式设置为“排队”。
成功将故障转移模式设置为“排队”。
故障转移是保障系统高可用性的关键,虽需额外软硬件支持且可能有数据同步延迟,但能显著降低宕机风险。在数字化依赖日益加深的今天,你觉得哪些场景最需要优先部署故障转移机制?