为了满足企业对业务持续可用的追求,降低年故障停机时间,系统、网络、存储各大厂商都引入了“集群”的概念
而Windows Server 2012 R2作为新一代的Cloud OS,其Hyper-V角色在集群技术方面有着出色的表现
本文将深入探讨Hyper-V 2012集群技术,揭示其如何为企业带来更高的业务可用性和管理灵活性
集群技术的基本概念与重要性 “集群”的作用是通过多台硬件同时运行来实现的,当故障发生时,通过快速且自动化的切换故障服务器,从而实现业务的持续运行
与传统的硬件故障或网络故障发生后需要人为参与排障不同,集群技术不需要人为参与,可以做到全自动运行
当故障发生时,第一时间转移故障节点,从而极大限度地提升业务持续可用的能力
在Windows Server下,这种集群技术被称为“故障转移集群”(Failover Cluster)
故障转移集群指的是一组协同工作的独立服务器,通过物理链路和软件进行连接,以相应的技术手段来实现更好的服务可用性
当集群内某一台物理服务器出现故障时,另一台服务器开始接管故障服务器的服务(此转移的过程被称为故障转移过程)
集群角色会主动监测集群内的主机工作是否正常,通过故障转移,最终用户所能感知到的停机时间将会非常短暂
Hyper-V 2012集群的核心功能 Windows Server 2012 R2中的Hyper-V角色自然拥有集群的能力
Hyper-V故障转移集群的目的很明确:当集群内某一台Hyper-V主机出现故障无法提供服务时,可由集群内的其他主机快速接管任务,继续为用户提供持续可用的服务
1. 动态迁移功能 私有云的一大关键优势是轻松地将工作负载在主机之间进行迁移
在Windows Server 2012 R2中,微软提升了Hyper-V动态迁移功能,缓解了迁移过程中的系统压力,简化了整个过程
虚拟机的虚拟内存经过压缩,然后通过网线发送,将在网络上传输的数据减少了一半甚至更多
通过SMB 3.0,使用R2迁移到R2的速度比之前的版本快很多
此外,SMB Direct是SANs的功能之一,它和网络附加存储功能通常需要专门的硬件——绕过主机的CPU,利用远程直接内存访问直接写入存储,实现进一步加快传输速度
2. 共享的虚拟硬盘 在Windows Server 2012 R2中,可以使用单个VHDX文件作为构建故障转移集群所需的共享存储
集群需要共享磁盘来实现所有节点之间的通信
通过共享一个VHDX文件,而不是为集群中的虚拟机创建多个虚拟硬盘,大大简化了存储管理
VHDX文件甚至可以存放在共享存储、集群共享卷或通过SMB共享
3. 自动激活虚拟机 在Windows Server 2012 R2中,微软放弃了对运行在主机上的虚拟机的复杂产品密钥要求
这些虚拟机通过与主机通信,自动激活许可,不再需要密钥
这一改变打破了只有当所有虚拟机完全授权以后并为工作负载做好准备之后的激活需求,简化了许可管理
4. 高可用性 故障转移集群不仅提升了Hyper-V的服务可用性,还可以将多个重要角色添加到故障转移集群中,如DFS命名空间服务器、DHCP服务器、虚拟机、Hyper-V副本代理、文件服务器、通用服务、脚本、应用程序和Exchange服务器等
通过故障转移集群,这些服务可以在一台服务器出现故障时,由其他服务器快速接管,确保业务连续性
Hyper-V 2012集群的实践应用 在实际应用中,Hyper-V 2012集群技术带来了诸多优势
1. 主动迁移虚拟机 服务器集群的最大优点是它可以主动将虚拟机(VM)从一个主机迁移到另外一个主机
当内存不足、CPU负载偏高或者虚拟主机遇到较高的I/O压力时,管理员会收到警报
如果不能确定真正的原因或者系统需要重启,就可以主动将VM迁移到集群内的其他主机
这样做可以避免因单个服务器故障导致的业务中断,提高服务器和应用系统的运行时间
2. 简化系统升级和维护 在虚拟主机集群中,当某个主机需要打补丁和重启时,其上的虚拟机可以迁移到替代的主机
完成补丁安装后,虚拟机再迁移回原来的主机
这样,就允许用户在早上极短的时间内,不用停掉整个系统,完成集群的升级
这种能力在需要7x24小时运行的组织中尤为重要,可以大大简化系统升级和维护的流程
3. 提高业务连续性 故障转移集群通过自有的算法机制,自动接管意外停机服务器上的服务,减少由于硬件或软件的故障造成的停机,对业务连贯性的影响,维护整套系统的高可用性
这种能力对于需要高可靠性和低停机时间的企业来说至关重要
Hyper-V 2012集群的实施与管理 尽管Hyper-V 2012集群带来了诸多优势,但其实施和管理也面临一些挑战
1. 配置复杂性 建立集群框架、管理主机间的连通性、配置共享存储都不是简单的任务,可能涉及到组织内部多个团队
此外,随着集群规模的扩大,配置和管理的复杂性也会增加
因此,需要专业的IT管理人员和团队来负责集群的配置和管理
2. 成本问题 要实现一个虚拟主机集群环境,需要复制部分基础架构并同时保持虚拟机与主机的比例
此外,大部分厂商的实现需要一个SAN或者独立的磁盘子系统
虽然开源iSCSI或者廉价的磁盘阵列可能是个精明的选择,但这些选项可能存在性能和稳定性的问题
因此,在选择存储解决方案时,需要权衡成本、性能和稳定性
3. 技术要求 由于使用了冗余的架构设计,因此需要IT管理人员的知识面要更加广泛
故障转移集群要求网络存在冗余,一般实际部署中,单台物理服务器会使用两条网线,其中一条接入生产网络,另外一条作为心跳线(heart line),为集群之间互相验证存活的手段
此外,还需要对集群的监控、故障转移策略等进行细致的配置和管理
总结与实践建议 Hyper-V 2012集群技术通过提供动态迁移、共享虚拟硬盘、自动激活虚拟机和高可用性等功能,显著提升了企业的业务连续性和管理灵活性
然而,其实施和管理也面临配置复杂性、成本