Windows Server 2003服务器集群技术 (完整版)
本文介绍如何利用Windows Server 2003软件来搭建服务器集群。集群为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。
1、Microsoft Windows 2003集群介绍
服务器群集是一组协同工作并运行Microsoft群集服务(Microsoft Cluster Service,MSCS)的独立服务器。服务器群集为资源和应用程序提供高可用性、故障恢复、可伸缩性和可管理性。
服务器群集允许客户端在出现故障和计划中的暂停时,依然能够访问应用程序和资源。如果群集中的某一台服务器由于故障或维护需要而无法使用,资源和应用程序将转移到可用的群集节点上。
Windows群集(Windows Clustering)解决方案使用了名词“高可用性”而非“容错”。容错技术提供更高层次的弹性和恢复能力。容错服务器通常使用深层硬件冗余,加上专门的软件,几乎可以即时地恢复任何单一的硬件或软件错误。这些解决方案要比Windows群集(Windows Clustering)解决方案昂贵得多,因为组织必须为处于空闲状态等待错误的冗余硬件支付费用。
服务器群集无法保证无间断运作,但是确实能够为多数关键任务应用程序提供足够的可用性。群集服务可以对应用程序和资源进行监控,并能够自动识别和恢复众多故障状况。这为在群集中管理工作负荷提供了灵活性。另外,还提高了整个系统的可用性。
群集服务(Cluster service)的优点包括:
• 高可用性:通过服务器群集,资源(例如:磁盘驱动器和Internet协议(IP)地址)的所有权会自动从故障服务器转移到可用的服务器。当群集中的某个系统或应用程序发生故障时,群集软件会在可用的服务器上重新启动故障应用程序,或者将工作从故障节点分散到剩下的节点上。由此,用户只在瞬间感觉到服务的暂停。
• 故障恢复:当故障服务器重新回到其预定的首选所有者的联机状态时,群集服务将自动在群集中重新分配工作负荷。该特性可配置,但默认禁用。
• 可管理性:您可以使用“群集管理器”工具(CluAdmin.exe),将群集作为一个单一的系统进行管理,并对犹如运行于一个单一服务器的应用程序实施管理。您可以将应用程序转移到群集中的其它服务器。“群集管理器”可用于手动平衡服务器的工作负荷,并针对计划维护释放服务器。您还可以监控群集的状态、所有节点以及来自网络任何地方的资源。
• 可伸缩性:群集服务可扩展以满足需求的增长。当群集监督应用程序的总体负荷超出了群集的能力范围时,可以添加附加的节点。
本文档提供有关针对连接到共享群集存储设备并运行Server 2003 Enterprise Edition或Windows Server 2003的服务器创建和配置服务器群集的指导。本文档的目的是为了指引您完成安装典型群集的步骤,并未解释如何安装群集应用程序。而对于实施非传统仲裁模型,如:多数节点集(Majority Node Set,MNS),的Windows群集(Windows Clustering)解决方案和地理位置分散的群集也不予以讨论。关于服务器群集概念以及安装和配置步骤的附加信息,请参见“Windows Server 2003在线帮助”。
服务器群集配置清单:
本清单帮助您进行安装准备,其后接具体的步骤指导。
软件要求
• 群集中的所有计算机均安装了Microsoft Windows Server 2003 Enterprise Edition或Windows Server 2003 Datacenter Edition。
• 一个名称解析法,比如:域名系统(Domain Name System,DNS)、DNS动态更新协议、Windows Internet名称服务(Windows Internet Name Service,WINS)、HOSTS等等。
• 一个现有的域模型。
• 所有的节点必须是同一个域的成员。
• 一个域级帐户,必须是每个节点上的本地管理员组的成员。建议采用专用帐户。
硬件要求
• 群集硬件必须属于群集服务硬件兼容性列表(Hardware Compatibility List,HCL)。要查找最新的群集服务硬件兼容性列表,请登陆位于http://www.microsoft.com/hcl/的Windows硬件兼容性列表(Windows Hardware Compatibility List),然后搜索“cluster”(群集)。整个解决方案必须得到HCL认证,而不仅仅是个别组件。附件信息,请在Microsoft知识库(Microsoft Knowledge Base)中参阅下方文章:
309395 Microsoft对于服务器群集和硬件的支持策略(The Microsoft Support Policy for Server Clusters and the Hardware)
注意:如果您正在存储区域网络(SAN)上安装该群集,并计划让多个设备和群集与之共享SAN,那么该解决方案也必须服从“群级/多群集设备(Cluster/Multi-Cluster Device)”硬件兼容性列表。附加信息,请在Microsoft知识库中参阅下方文章:
304415 针对附加到相同SAN设备的多群集的支持(Support for Multiple Clusters Attached to the Same SAN Device)
• 两个超大存储设备控制器——小型计算机系统接口(Small Computer System Interface,SCSI)或光纤通道(Fibre Channel);一个用于在其中一个域控制器上安装操作系统(OS)的本地系统磁盘;一个面向共享磁盘的独立的外围组件互连( PCI)存储控制器。
• 群集中的每个节点拥有两个PCI网络适配器。
• 将共享存储设备附加到所有计算机的存储电缆。参考关于配置存储设备的制造商指南。参见本文后面的附录,了解有关使用SCSI或光纤通道(Fibre Channel)所需的特定配置。
• 对于所有的节点,一切硬件都必须是可识别的,对应正确的插槽、设备卡、BIOS、固件修订版等等。这将使配置变得更加简单,同时消除兼容性问题。
网络要求
• 一个唯一的NetBIOS名称。
• 每个节点上的所有网络界面均拥有静态IP地址。 注意:服务器群集(Server Clustering)不支持使用由动态主机配置协议(Dynamic Host Configuration Protocol,DHCP)服务器分配的地址。
• 接入一个域控制器。如果群集服务无法验证用于启动服务的用户帐户,可能导致群集发生故障。建议您在群集所在的相同的局域网(LAN)上拥有一个域控制器,以便确保其可用性。
• 每个节点至少必须拥有两个网络适配器——一个用于连接客户端公用网络,另一个用于连接节点对节点专用群集网络。HCL认证要求一个专用网络适配器。
• 所有节点都必须拥有两个面向公用和专用通信的物理独立的局域网(LAN)或虚拟局域网(LAN)。
• 如果您正在使用容错网卡或网络适配器组合,确认您正在使用最新的固件和驱动程序。向您的网络适配器制造商核实群集兼容性。
共享磁盘要求
• 一个经HCL认可的连接到所有计算机的外部磁盘存储单元。其将用作群集共享磁盘。建议采用某种类型的硬件独立磁盘冗余阵列( RAID)。
• 所有共享磁盘,包括仲裁磁盘,必须在物理上附加到一个共享总线。
注意:以上要求并不适用于多数节点集( Majority Node Set,MNS)群集。这类群集本指南不予讨论。
• 共享磁盘必须位于系统驱动器所用的控制器以外的另一个控制器上。
• 建议在RAID配置中创建多个硬件级别的逻辑驱动器,而不是使用一个单一的逻辑磁盘,然后将其分成多个操作系统级别的分区。这不同于独立服务器通常所采用的配置。但是,它使您可以在群集中拥有多个磁盘资源,并跨节点执行“活动/活动(Active/Active)”配置和手动负载平衡。
• 最小50兆字节(MB)的专用磁盘用作仲裁设备。为了得到最佳的NTFS文件系统性能,建议采用最小500 MB的磁盘分区。
• 确认可以从所有的节点看到附加到共享总线的磁盘。这可以在主适配器安装中进行查看。请参考制造商的文档,了解适配器指定的指导说明。
• 必须根据制造商的指导说明,对SCSI设备分配唯一的SCSI标识号,并正确地将其端接。参见本文附录,了解有关安装和端接SCSI设备的信息。
• 所有共享磁盘必须配置为基本磁盘。附加信息,请在Microsoft知识库中参阅下方文章:
237853 服务器群集磁盘资源不可用的动态磁盘配置(Dynamic Disk Configuration Unavailable for Server Cluster Disk Resources)
群集共享磁盘不支持软件容错。
• 在运行64位版本的Windows Server 2003的系统上,所有共享磁盘必须配置为主引导记录(MBR)。
• 群集磁盘上的所有分区必须格式化为NTFS。
• 建议所有磁盘均采用硬件容错RAID配置。
• 建议最少采用两个逻辑共享驱动器。
1