一种刀片服务器管理网络对称式恢复方法
【专利摘要】一种刀片服务器管理网络对称式恢复方法,管理网络是由主、备管理模块及被管理模块组成,网络恢复是恢复为产品出厂默认网络配置;管理网络对称式回复的前提要求是主、备管理模块都存在,但实施时不一定要求同时在位;管理网络对称式恢复,即主管理模块恢复备管理网络,备管理模块恢复主管理网络;管理网络恢复实体是网络配置文件,每个被管理模块本地保存主、备管理网络配置文件;管理网络恢复方法涉及到管理网络的配置方法,通过对主、备管理模块进行配置完成整个网络的配置恢复;具体内容还包括:刀片服务器各部件类型及连接方式;刀片服务器管理网络对称式恢复方法;刀片服务器管理网络集中托管配置。
【专利说明】—种刀片服务器管理网络对称式恢复方法
【技术领域】
[0001]本发明涉及服务器【技术领域】,具体地说是一种刀片服务器管理网络对称式恢复方法。
【背景技术】
[0002]刀片服务器以其高计算密度、优化部署、资源共享和便于集中管理的特点被大量应用在高性能计算和云计算服务领域中,它已成为现今服务器发展的主要方向之一。刀片服务器系统通常可容纳几片至几十片计算刀片,多个电源模块及风扇模块、冗余备份管理模块、多个交换机模块。正是由于这种高密度性,具备高可用性的服务器监控管理网络就非常必要,特别是针对日益扩大的服务器集群规模,没有强壮的管理网络是不可想象的。
[0003]目前,对于刀片服务器的管理网络设置需求,不同客户会有很大差别,通常客户会按照实际情况自行配置,往往会导致管理网络配置失败,很可能出现无法在线获取已配置网络信息的情况。尤其是对于有大规模刀片服务器集群布置需求的客户,由于需要对大量刀片服务器网络进行特定配置,这就加剧了配置失效的风险。一旦出现网络配置问题,客户只能停机,通过离线工具获取已配置网络信息,再修改后重新应用,这种方式不仅失效恢复效率很低,而且严重客户正常的服务器系统工作需求。
[0004]因此,如何即弥补服务器管理网络配置恢复现存的问题,又能提高管理网络强壮性,就成了亟需解决的实际问题。
【发明内容】
[0005]本发明的目的是提供一种刀片服务器管理网络对称式恢复方法。
[0006]本发明的目的是按以下方式实现的,管理网络是由主、备管理模块及被管理模块组成,网络恢复是恢复为产品出厂默认网络配置;管理网络对称式回复的前提要求,是主、备管理模块都存在,但实施时不一定要求同时在位;管理网络对称式恢复,即主管理模块恢复备管理网络,备管理模块恢复主管理网络;管理网络恢复实体是网络配置文件,每个被管理模块本地保存主、备管理网络配置文件;管理网络恢复方法涉及到管理网络的配置方法,通过对主、备管理模块进行配置完成整个网络的配置恢复;具体内容还包括:刀片服务器各部件类型及连接方式;刀片服务器管理网络对称式恢复方法;刀片服务器管理网络集中托管配置;其中:
刀片服务器各部件类型及连接方式中在所述部件类型包括:刀片模块BMC单元、主备管理模块SMC单元、交换机模块EMC单元;其中:刀片模块的BMC单元、管理模块的SMC单元、交换机模块的EMC单元间通过LAN方式链接;主、备管理模块的SMC单元间通过HeartBeat方式链接;
刀片服务器管理网络对称式恢复方法中所述对称式,是指主、备管理模块的对称冗余性:所述恢复方法是通过对称模块的网络恢复,即主管理网络失效时通过备管理模块完成恢复,而备管理网络失效时通过主管理模块完成恢复; 刀片服务器管理网络集中托管配置中所述集中托管配置,是指将刀片服务器管理网络的配置集中于管理模块,通过对其本地网络配置文件的修改,就可按照特定的规则和算法自动的对其他被管理模块的网络配置文件进行修改;管理模块冗余备份是实施刀片服务器管理网络对称式恢复方法的前提条件,但实施时不一定要求同时在位;
所述的管理网络配置失效,是指网络中各模块的网络配置,包括IP、Netmask及Gateway的配置失败;
所述的规则是在被管理模块中分别保存这主、备管理网络的配置文件,包括:
1)判断当前发起配置恢复的管理模块;
2)刀片模块修改本地对称网络配置文件;
3)交换机模块修改本地对称网络配置文件;
4)管理模块修改本地对称网络配置文件;
所述的算法,是管理模块与被管理模块间的具体配置关系,按照顺序增加、顺序减少、及其他有规律的计算方法获得网络配置信息;
刀片服务器管理网络恢复步骤描述如下:
步骤1:判断当前管理模块的类型;
步骤2:如果是主管理模块,启动恢复备管理模块网络配置流程;
步骤3:发送IPMI命令通知各被管理模块修改本地网络配置;
步骤4:各被管理模块修改本地对称网络配置文件为默认出厂配置;
步骤5:主管理模块修改本地备管理模块网络配置为默认出厂配置;
步骤6:备管理模块重启;
步骤7:如果是备管理模块,启动恢复备管理模块网络配置流程;
步骤8:发送IPMI命令通知各被管理模块修改本地网络配置;
步骤9:各被管理模块修改本地对称网络配置文件为默认出厂配置;
步骤10:备管理模块修改本地主管理模块网络配置为默认出厂配置;
管理网络对称式恢复步骤如下:
步骤1:登录备管理模块配监控管理系统;
步骤2:启动恢复主管理模块网络配置流程;
步骤3:重新启动主管理模块;
步骤4:登录主管理模块配监控管理系统查看修改结果。
[0007]本发明的有益效果是:利用本实施例的刀片服务器管理网络对称式恢复方法,即可以促进管理网络在失效的情况下的快速恢复能力提升,由可以提高工程实施和维护的工作效率,保证用户正常使用服务器系统的工作要求。除此之位,本发明也涉及对刀片服务器集中配置机制,可以增强服务器管理网络的可维护性和可用性。
【专利附图】
【附图说明】
[0008]图1是典型刀片服务器各模块组成及连接图;
图2是刀片服务器管理网络恢复流程图;
图3是刀片服务器管理网络对称式恢复流程图。【具体实施方式】
[0009]参照说明书附图对本发明的方法作以下详细地说明。
[0010]系统包括:刀片服务器各部件类型及连接方式;刀片服务器管理网络对称式恢复方法;刀片服务器管理网络集中托管配置;其中:
刀片服务器各部件类型及连接方式中在所述部件类型包括:刀片模块BMC单元、主备管理模块SMC单元、交换机模块EMC单元;其中:刀片模块的BMC单元、管理模块的SMC单元、交换机模块的EMC单元间通过LAN方式链接;主、备管理模块的SMC单元间通过HeartBeat方式链接;
刀片服务器管理网络对称式恢复方法中所述对称式,是指主、备管理模块的对称冗余性:所述恢复方法是通过对称模块的网络恢复,即主管理网络失效时通过备管理模块完成恢复,而备管理网络失效时通过主管理模块完成恢复;
刀片服务器管理网络集中托管配置中所述集中托管配置,是指将刀片服务器管理网络的配置集中于管理模块,通过对其本地网络配置文件的修改,就可按照特定的规则和算法自动的对其他被管理模块的网络配置文件进行修改;管理模块冗余备份是实施刀片服务器管理网络对称式恢复方法的前提条件,但实施时不一定要求同时在位;
管理网络配置失效是指网络中各模块的网络配置,包括IP、Netmask及Gateway的配置失败。
[0011]规则是在被管理模块中分别保存这主、备管理网络的配置文件,包括:
1)判断当前发起配置恢复的管理模块;
2)刀片模块修改本地对称网络配置文件;
3)交换机模块修改本地对称网络配置文件;
4)管理模块修改本地对称网络配置文件;
算法是管理模块与被管理模块间的具体配置关系,按照顺序增加、顺序减少、及其他有规律的计算方法获得网络配置信息。
图1:是根据本发明的典型刀片服务器各模块组成及连接图。如图1所示,典型刀片服务器包含一定数量计算刀片模块(含管理网络BMC单元),本实例中模块数量为二十片,主备冗余的管理模块(含管理网络SMC单元),若干电源和风扇,热备冗余的以太网交换机(含管理网络EMC单元)。
[0012]图2:是根据本发明的刀片服务器管理网络恢复图。如图2所示,具体过程描述如下:
步骤1:判断当前管理模块的类型;
步骤2:如果是主管理模块,启动恢复备管理模块网络配置流程;
步骤3:发送IPMI命令通知各被管理模块修改本地网络配置;
步骤4:各被管理模块修改本地对称网络配置文件为默认出厂配置;
步骤5:主管理模块修改本地备管理模块网络配置为默认出厂配置;
步骤6:备管理模块重启
步骤7:如果是备管理模块,启动恢复备管理模块网络配置流程;
步骤8:发送IPMI命令通知各被管理模块修改本地网络配置 步骤9:各被管理模块修改本地对称网络配置文件为默认出厂配置; 步骤10:备管理模块修改本地主管理模块网络配置为默认出厂配置;
图3:根据本发明的一个实施例的管理网络对称式恢复流程图。本例中假设主管理模块管理网络配置失效时,通过备管理模块进行对称式恢复,如图3所示,具体过程描述如下:
步骤1:登录备管理模块配监控管理系统;
步骤2:启动恢复主管理模块网络配置流程;
步骤3:重新启动主管理模块;
步骤1:登录主管理模块配监控管理系统查看修改结果。
[0013]以上所述仅为本发明的实施例而已,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【权利要求】
1.一种刀片服务器管理网络对称式恢复方法,其特征在于,管理网络包括由主、备管理模块及被管理模块,网络恢复是恢复为产品出厂默认网络配置;管理网络对称式回复的前提要求是主、备管理模块都存在,但实施时不一定要求同时在位;管理网络对称式恢复,是主管理模块恢复备管理网络,备管理模块恢复主管理网络;管理网络恢复实体是网络配置文件,每个被管理模块本地保存主、备管理网络配置文件;管理网络恢复方法涉及到管理网络的配置方法,通过对主、备管理模块进行配置完成整个网络的配置恢复; 具体内容还包括:刀片服务器各部件类型及连接方式;刀片服务器管理网络对称式恢复方法;刀片服务器管理网络集中托管配置;其中: 刀片服务器各部件类型及连接方式中在所述部件类型包括:刀片模块BMC单元、主备管理模块SMC单元、交换机模块EMC单元;其中:刀片模块的BMC单元、管理模块的SMC单元、交换机模块的EMC单元间通过LAN方式链接;主、备管理模块的SMC单元间通过HeartBeat方式链接; 刀片服务器管理网络对称式恢复方法中所述对称式,是指主、备管理模块的对称冗余性:所述恢复方法是通过对称模块的网络恢复,即主管理网络失效时通过备管理模块完成恢复,而备管理网络失效时通过主管理模块完成恢复; 刀片服务器管理网络集中托管配置中所述集中托管配置,是指将刀片服务器管理网络的配置集中于管理模块,通过对其本地网络配置文件的修改,就可按照特定的规则和算法自动的对其他被管理模块的网络配置文件进行修改;管理模块冗余备份是实施刀片服务器管理网络对称式恢复方法的前提条件,但实施时不一定要求同时在位; 所述的管理网络配置失效,是指网络中各模块的网络配置,包括IP、Netmask及Gateway的配置失败; 所述的规则是在被管理模块中分别保存这主、备管理网络的配置文件,包括: 1)判断当前发起配置恢复的管理模块; 2)刀片模块修改本地对称网络配置文件; 3)交换机模块修改本地对称网络配置文件; 4)管理模块修改本地对称网络配置文件; 所述的算法,是管理模块与被管理模块间的具体配置关系,按照顺序增加、顺序减少、及其他有规律的计算方法获得网络配置信息; 刀片服务器管理网络恢复步骤描述如下: 步骤1:判断当前管理模块的类型; 步骤2:如果是主管理模块,启动恢复备管理模块网络配置流程; 步骤3:发送IPMI命令通知各被管理模块修改本地网络配置; 步骤4:各被管理模块修改本地对称网络配置文件为默认出厂配置; 步骤5:主管理模块修改本地备管理模块网络配置为默认出厂配置; 步骤6:备管理模块重启; 步骤7:如果是备管理模块,启动恢复备管理模块网络配置流程; 步骤8:发送IPMI命令通知各被管理模块修改本地网络配置; 步骤9:各被管理模块修改本地对称网络配置文件为默认出厂配置; 步骤10:备管理模块修改本地主管理模块网络配置为默认出厂配置;管理网络对称式恢复步骤如下:步骤1:登录备管理模块配监控管理系统;步骤2:启动恢复主管理模块网络配置流程;步骤3:重新启动主管理模块;步骤4:登录主管理模块配监控`管理系统查看修改结果。
【文档编号】H04L12/24GK103634141SQ201310530437
【公开日】2014年3月12日 申请日期:2013年11月1日 优先权日:2013年11月1日
【发明者】陈刚 申请人:浪潮电子信息产业股份有限公司