VMware vSphere 6.0提供的Fault Tolerance(FT)功能,正是为了满足这一需求而设计的强大工具
本文将深入探讨VMware vSphere 6.0 FT的配置与管理,展示其如何为虚拟机提供不间断的服务保障
一、Fault Tolerance概述 Fault Tolerance,即容错技术,是VMware vSphere提供的一项高级功能
它通过创建和维护一个与主虚拟机(Primary VM)完全相同的辅助虚拟机(Secondary VM),在主虚拟机发生故障时,能够无缝接管其工作,从而确保业务的连续运行
这种机制的核心在于,辅助虚拟机与主虚拟机实时同步状态,确保在任何时刻都能无缝切换,对用户而言几乎感知不到任何中断
二、VMware vSphere 6.0 FT的技术基础 在VMware vSphere 6.0中,FT功能得到了显著增强,引入了Fast Checkpointing技术,取代了之前的vLockstep技术
这一变化不仅提高了容错效率,还降低了对网络带宽的占用
1.Fast Checkpointing技术 -工作原理:Fast Checkpointing技术通过定期捕获主虚拟机的状态快照,并将其传输到辅助虚拟机,从而实现状态同步
这些快照(或称为检查点)的捕获和传输间隔非常短,通常在2毫秒至500毫秒之间,确保了状态的高度一致性
-性能优化:与vLockstep技术相比,Fast Checkpointing技术减少了主虚拟机与辅助虚拟机之间的数据同步量,从而降低了对网络和存储资源的占用
此外,它还支持更高的虚拟机配置,如最多4个vCPU和64GB内存
2.网络要求 -专用10GB网络:为了实现高效的状态同步,VMware vSphere 6.0 FT强烈推荐使用专用的10GB网络
虽然理论上在1GB网络上也能运行FT,但可能会遇到性能瓶颈和同步错误
-网络带宽监控:Fast Checkpointing技术还内置了网络带宽监控功能,能够动态调整检查点的传输频率,以适应网络条件的变化,确保同步过程的稳定性和效率
三、配置虚拟机FT的基础条件 在群集中配置使用虚拟机FT之前,需要满足一系列基础条件,以确保FT功能的顺利启用和高效运行
1.ESXi主机要求 -CPU支持:虚拟机FT技术的启用与ESXi主机所使用的CPU有很大关系
目前市面上主流服务器CPU几乎都支持FT技术,如Intel Sandy Bridge或更高版本(注意:Intel Avoton系统不支持FT技术),以及AMD Bulldozer或更高版本
-EVC启用:为了确保群集中所有主机的CPU兼容性,建议启用Enhanced vMotion Compatibility(EVC)功能
EVC能够屏蔽不同CPU之间的细微差异,确保虚拟机在所有主机上都能无缝迁移和容错
2.存储要求 -分开存储:虽然VMware vSphere 6.0 FT不强制要求使用分开的存储,但为了提高容错效率和可靠性,建议将主虚拟机和辅助虚拟机的VMDK文件存放在不同的数据存储上
-存储性能:确保存储系统具有足够的IOPS和吞吐量,以支持快速的状态同步和检查点传输
3.群集配置 -主机数量:为确保冗余和最大FT保护,群集中应至少有三台主机
这样,在发生故障切换时,总有主机可容纳新创建的辅助虚拟机
-资源限制:在已配置为使用FT的群集中,有两个重要的资源限制需要强制执行:一是群集中允许的最大容错虚拟机数量(主虚拟机和辅助虚拟机计入此限制,默认值为4);二是跨主机上所有容错虚拟机聚合的最大vCPU数量(主虚拟机和辅助虚拟机中的vCPU均计入此限制,默认值为8)
这些限制可以通过vSphere Client或PowerCLI进行修改
4.vSphere版本与许可 -版本影响:vSphere版本直接影响虚拟机使用FT技术后的vCPU数量
例如,vSphere Standard和Enterprise版本最多可支持2个vCPU的容错虚拟机,而EnterprisePlus版本则最多可运行4个vCPU的容错虚拟机
-许可要求:启用FT功能需要购买相应的vSphere许可
请确保您的许可能够覆盖您计划启用的容错虚拟机数量
四、配置使用虚拟机FT的步骤 配置使用虚拟机FT的过程相对复杂,但遵循以下步骤可以确保顺利完成
1.准备阶段 -检查基础条件:确保所有ESXi主机满足FT的CPU、网络和存储要求
-启用EVC:在群集级别启用EVC功能,以确保CPU兼容性
-配置存储:根据需要配置分开的存储以存放主虚拟机和辅助虚拟机的VMDK文件
2.配置FT功能 -创建FT vmkernel:在每个ESXi主机上创建用于FT的专用vmkernel适配器,并确保其连接到专用的10GB网络
-选择虚拟机:选择要启用FT功能的虚拟机,并确保其处于关机状态
注意,FT不支持已启用快照、Storage vMotion或链接克隆的虚拟机
-启用FT:在vSphere Client中,右键点击选中的虚拟机,选择“启用Fault Tolerance”选项,并按照向导完成配置
在配置过程中,系统会在后台复制一份源虚拟机到目标存储上,以创建辅助虚拟机
3.验证与监控 -验证配置:启用FT后,通过vSphere Client验证主虚拟机和辅助虚拟机的状态同步情况
确保它们之间的同步延迟保持在可接受范围内
-监控性能:使用vSphere的性能监控工具持续监控主虚拟机和辅助虚拟机的CPU、内存、网络和存储使用情况
确保它们没有超出资源限制,并及时调整群集配置以应对潜在的性能瓶颈
五、FT的局限性与最佳实践 尽管VMware vSphere 6.0 FT功能强大,但它也有一些局限性需要注意
同时,遵循一些最佳实践可以进一步提高FT的可靠性和效率
1.局限性 -不支持某些vSphere功能:如快照、Storage vMotion和链接克隆等
这些功能可能会干扰FT的状态同步过程
-网络要求严格:虽然FT可以在1GB网络上运行,但为了达到最佳性能,强烈推荐使用专用的10GB网络
-资源占用高:启用FT功能会占用额外的CPU、内存、网络和存储资源
因此,在规划群集容量时,需要充分考虑这些额外资源的需求
2.最佳实践 -合理规划群集:在规划群集时,尽量选择CPU和内存相同的主机编成一组,并确保它们具有足够的资源来支持容错虚拟机的运行
-定期监控与调整:定期监控群集的性能和资源使用情况,并根据需要进行调整
例如,增加主机、扩展存储或调整资源限制等
-测试故障切换:定期进行故障切换测试,以确保FT功能在关键时刻能够正常工作
这有助于发现潜在的问题并及时解决
六、结论 VMware vSphere 6.0 FT功能为企业提供了强大的虚拟机容错解决方案
通过创建和维护与主虚拟机完全相同的辅助虚拟机,并在主虚拟机发生故障时无缝接管其工作,FT确保了业务的连续运行和数据完整性
然而,启用和管理FT功能需要满足一系列基础条件,并遵循一定的步骤和最佳实践
只有这样,才能充分发挥FT的优势,为企业创造更大的价值