一种cc-numa多节点服务器上系统状态切换和监控的方法

文档序号:7824088阅读:204来源:国知局
一种cc-numa多节点服务器上系统状态切换和监控的方法
【专利摘要】本发明公开一种CC-NUMA多节点服务器上系统状态切换和监控的方法,属于服务器管理领域,主节点服务器调节发送信号通知内部BMC需要执行的操作,由内部管理网络接口通知从节点内的BMC,从节点内的BMC接到命令后去执行相应的系统状态操作,此外主节点服务器中的BMC根据从节点内接收信号的不同电平组合和脉冲信号来判断系统当前的状态,通知客户端主机以便监控;本发明实现了CC-NUMA多节点服务器的同步开机、关机、热重启、冷重启,并解决了多节点服务器之前缺少统一时序控制的问题,并且整个状态变化过程都可以被BMC监控记录。
【专利说明】一种CC-NUMA多节点服务器上系统状态切换和监控的方法

【技术领域】
[0001]本发明公开一种系统状态切换和监控的方法,属于服务器管理领域,具体地说是一种CC-NUMA多节点服务器上系统状态切换和监控的方法。

【背景技术】
[0002]高端服务器通常应用于OLTP联机事务处理能力要求非常高的场景,如银行、科学计算等,由于在同一时间计算和存储的数据量非常大,高端服务器一般采用CC-NUMA的体系结构设计。CC-NUMA,Cache Coherent-Non Uniform Memory Access Architecture,即Cache —致性非统一内存访问,将多个处理器通过专门的互连设备连接在一起组成分布式和共享内存空间,只运行一个操作系统。每一个处理器可以访问自己的Memory存储器,也可以访问其他处理器或者共享的存储器,多个处理器之间一般采用背板或光纤的方式连接,所以在形态上就是由多个服务器节点互连形成一个分区,运行一个操作系统。传统CC-NUMA架构的多节点服务器系统中,其各个节点一般都是自己独立控制开机、关机和重启操作,在操作上每个服务器节点是单独控制,各个节点之间缺乏统一的时序控制和系统监控,控制不当时容易导致系统无法正常启动,影响服务器的工作效率。本发明提供一种CC-NUMA多节点服务器上系统状态切换和监控的方法,通过所有的系统状态切换操作都由主节点服务器发起、从节点服务器跟随执行,并且整个流程都可被BMC管理单元监控,实现同步开机、关机、热重启、冷重启的方法,以解决多节点服务器之前缺少统一时序控制的问题,并且整个状态变化过程都可以被BMC监控记录。


【发明内容】

[0003]本发明针对传统CC-NUMA架构的多节点服务器系统中,其各个节点一般都是自己独立控制开机、关机和重启操作,在操作上每个服务器节点是单独控制,各个节点之间缺乏统一的时序控制和系统监控,控制不当时容易导致系统无法正常启动,影响服务器的工作效率的问题,提供一种CC-NUMA多节点服务器上系统状态切换和监控的方法,实现同步开机、关机、热重启、冷重启,以解决多节点服务器之前缺少统一时序控制的问题,并且整个状态变化过程都可以被BMC监控记录。
[0004]提出的具体方案是:
一种CC-NUMA多节点服务器上系统状态切换和监控系统,包括主节点服务器,从节点服务器,主节点服务器和从节点服务器内都设有BMC监控管理单元,客户端主机;
主节点服务器:主节点服务器负责整个计算机地址空间的分配,其运行B1S和OS,也是系统状态切换的发起者;
若干个从节点服务器:从节点服务器提供计算扩展功能,也是系统状态切换跟随执行者;
主节点和从节点服务器内的BMC监控管理单元:BMC通过“内部管理网络”负责节点服务器之间的通信; 客户端主机:主节点服务器中的BMC还通过一个外部管理网络接口连接到客户端主机,系统状态切换的操作在客户端主机可被监控。
[0005]一种CC-NUMA多节点服务器上系统状态切换和监控的方法,利用权利要求1所述的一种CC-NUMA多节点服务器上系统状态切换和监控系统,主节点服务器调节发送Power_Enable、Power_OK、System_Reset三种信号通知内部BMC需要执行的操作,由内部管理网络接口通知从节点内的BMC,从节点内的BMC接到命令后去执行相应的系统状态操作,此外主节点服务器中的BMC根据从节点内接收的Power_Enable、Power_OK和System_Reset的不同电平组合和脉冲信号来判断系统当前的状态,通知客户端主机以便监控。
[0006]所述的系统状态切换是指开机、关机、冷重启、热重启。
[0007]所述的系统状态切换为开机,具体步骤为:
①主节点服务器发出高电平“Power_Enable”有效信号给BMC,通知BMC需要执行上电操作;
②主节点服务器中的BMC将开机命令通过内部管理网络接口传递给从节点服务器的
BMC ;
③从节点服务器的BMC发出高电平“P0wer_Enable”给所有的从节点服务器,通知从节点服务器执行开机操作;
④主节点和从节点服务器执行开机操作后,反馈高电平“PoWer_OK”信号给各自的BMC,预示本节点上电完成;
⑤在“Power_OK”之后,主节点服务器发出高电平“System_Reset”给BMC,预示主节点内处理器、内存、芯片组复位完成,等待从节点复位完成;
⑥主节点服务器中的BMC收到“System_Reset”后,通过内部管理网络通知其他从节点的 BMC ;
⑦从节点服务器BMC收到“SystenUteset”后,对本节点内的处理器、内存、芯片组进行复位操作;
⑧所有服务器节点复位完成之后,主节点服务器开始加载B1S和OS。
[0008]所述的系统状态切换为关机,具体步骤为:
①主节点服务器发出低电平“Power_Enable”有效信号给BMC,通知BMC需要执行关机操作;
②主节点服务器中的BMC将开机命令通过内部管理网络接口传递给从节点服务器的
BMC ;
③从节点服务器的BMC发出低电平“P0wer_Enable”给所有的从节点服务器,通知从节点服务器执行关机操作;
④主节点和从节点服务器执行开机操作后,反馈低电平“PoWer_0K”信号给各自的BMC,预不本节点关机完成;
⑤在“Power_0K”之后,主节点服务器发出低电平“System_Reset”给BMC,预示主节点内处理器、内存、芯片组复位完成,等待从节点复位完成;
⑥主节点服务器中的BMC收到“System_Reset”后,通过内部管理网络通知其他从节点的 BMC ;
⑦从节点服务器BMC收到“SystenUteset”后,对本节点内的处理器、内存、芯片组进行复位操作;
⑧所有服务器节点复位完成之后,主节点服务器关机完成。
[0009]所述的开机时Power_Enable、Power_OK和System_Reset的电平组合为高电平,高电平,高电平;
所述的关机时Power_Enable、Power_OK和System_Reset的电平组合为低电平,低电平,低电平;
所述的冷重启时Power_Enable、Power_OK和System_Reset都出现一个低脉冲;
所述的热重启时Power_Enable、Power_OK为高电平,System_Reset出现一个低脉冲。
[0010]如果当“Power_Enable” 和“Power_OK” 都为高电平,“System_Reset” 出现一个低脉冲时,系统发生了一个热重启操作;当“ Power_Enab I e ”、“ Power_OK ”和“ Sy stem_Reset”都出现一个低脉冲时,系统发生了一个冷重启操作。
[0011]本发明的有益之处是:本发明通过所有的系统状态切换操作都由主节点服务器发起、从节点服务器跟随执行,并且整个流程都可被BMC管理单元监控,实现同步开机、关机、热重启、冷重启的方法,以解决多节点服务器之前缺少统一时序控制的问题,并且整个状态变化过程都可以被BMC监控记录。

【专利附图】

【附图说明】
[0012]图1为CC-NUMA多节点服务器系统状态切换框图。

【具体实施方式】
[0013]结合附图对本发明做进一步说明。
[0014]首先,建立一种CC-NUMA多节点服务器上系统状态切换和监控系统,包括主节点服务器,从节点服务器,主节点服务器和从节点服务器内都设有BMC监控管理单元,客户端主机;
主节点服务器:主节点服务器负责整个计算机地址空间的分配,其运行B1S和OS,也是系统状态切换的发起者;
若干个从节点服务器:从节点服务器提供计算扩展功能,也是系统状态切换跟随执行者;
主节点和从节点服务器内的BMC监控管理单元:BMC通过“内部管理网络”负责节点服务器之间的通信;
客户端主机:主节点服务器中的BMC还通过一个外部管理网络接口连接到客户端主机,系统状态切换的操作在客户端主机可被监控。
[0015]利用以上系统,实现一种CC-NUMA多节点服务器上系统状态切换和监控的方法,过程为主节点服务器调节发送Power_Enable、Power_0K、System_Reset三种信号通知内部BMC需要执行的操作,由内部管理网络接口通知从节点内的BMC,从节点内的BMC接到命令后去执行相应的系统状态操作,此外主节点服务器中的BMC根据从节点内接收的Power_Enable、Power_0K和System_Reset的不同电平组合和脉冲信号来判断系统当前的状态,通知客户端主机以便监控。
[0016]以系统状态切换开机和关机为例,做具体说明: 系统状态切换为开机:
①I个主节点服务器发出高电平“Power_Enable”有效信号给BMC,通知BMC需要执行上电操作;
②主节点服务器中的BMC将开机命令通过内部管理网络接口传递给从节点O、从节点1、一直到从节点N中的BMC ;
③从节点服务器的BMC发出高电平“P0wer_Enable”给所有的从节点服务器,通知从节点服务器执行开机操作;
④主节点和从节点服务器执行开机操作后,反馈高电平“PoWer_OK”信号给各自的BMC,预示本节点上电完成;
⑤在“Power_OK”之后,主节点服务器发出高电平“System_Reset”给BMC,预示主节点内处理器、内存、芯片组复位完成,等待从节点复位完成;
⑥主节点服务器中的BMC收到“System_Reset”后,通过内部管理网络通知其他从节点的 BMC ;
⑦从节点服务器BMC收到“SystenUteset”后,对本节点内的处理器、内存、芯片组进行复位操作;
⑧所有服务器节点复位完成之后,主节点服务器开始加载B1S和OS。
[0017]系统状态切换为关机:
①主节点服务器发出低电平“Power_Enable”有效信号给BMC,通知BMC需要执行关机操作;
②主节点服务器中的BMC将开机命令通过内部管理网络接口传递给从节点0、从节点
1、一直到从节点N中的BMC ;
③从节点服务器的BMC发出低电平“P0wer_Enable”给所有的从节点服务器,通知从节点服务器执行关机操作;
④主节点和从节点服务器执行开机操作后,反馈低电平“PoWer_0K”信号给各自的BMC,预不本节点关机完成;
⑤在“Power_0K”之后,主节点服务器发出低电平“System_Reset”给BMC,预示主节点内处理器、内存、芯片组复位完成,等待从节点复位完成;
⑥主节点服务器中的BMC收到“System_Reset”后,通过内部管理网络通知其他从节点的 BMC ;
⑦从节点服务器BMC收到“SystenUteset”后,对本节点内的处理器、内存、芯片组进行复位操作;
⑧所有服务器节点复位完成之后,主节点服务器关机完成。
[0018]系统状态监控过程如下:
系统状态下各信号的电平组合及脉冲信号。主节点服务器中的BMC根据其节点内“Power_Enable”、“Power_0K”和“System_Reset”的不同电平组合来判断系统当前的状
--τ O
[0019]开机状态:当“Power_Enable”、“Power_0K”和 “System_Reset” 都为高电平时,系统处于开机状态;
关机状态:当“Power_Enable”、“Power_0K”和“System_Reset”都为低电平时,系统处于关机状态;
热重启:当“Power_Enable”和“Power_OK”都为高电平,“System_Reset”出现一个低脉冲时,系统发生了一个热重启操作;
冷重启:当“Power_Enable”、“Power_OK” 和 “System_Reset” 都出现一个低脉冲时,系统发生了一个冷重启操作;
除此以外都为异常状态。
【权利要求】
1.一种CC-NUMA多节点服务器上系统状态切换和监控系统,其特征是包括主节点服务器,从节点服务器,主节点服务器和从节点服务器内都设有BMC监控管理单元,客户端主机; 主节点服务器:主节点服务器负责整个计算机地址空间的分配,其运行B1S和OS,也是系统状态切换的发起者; 若干个从节点服务器:从节点服务器提供计算扩展功能,也是系统状态切换跟随执行者; 主节点和从节点服务器内的BMC监控管理单元:BMC通过“内部管理网络”负责节点服务器之间的通信; 客户端主机:主节点服务器中的BMC还通过一个外部管理网络接口连接到客户端主机,系统状态切换的操作在客户端主机可被监控。
2.—种CC-NUMA多节点服务器上系统状态切换和监控的方法,利用权利要求1所述的一种CC-NUMA多节点服务器上系统状态切换和监控系统,其特征是主节点服务器调节发送Power_Enable、Power_OK、System_Reset三种信号通知内部BMC需要执行的操作,由内部管理网络接口通知从节点内的BMC,从节点内的BMC接到命令后去执行相应的系统状态操作,此外主节点服务器中的BMC根据从节点内接收的Power_Enable、Power_OK和System_Reset的不同电平组合和脉冲信号来判断系统当前的状态,通知客户端主机以便监控。
3.根据权利要求2所述的一种CC-NUMA多节点服务器上系统状态切换和监控的方法,其特征是所述的系统状态切换是指开机、关机、冷重启、热重启。
4.根据权利要求3所述的一种CC-NUMA多节点服务器上系统状态切换和监控的方法,其特征是所述的系统状态切换为开机,具体步骤为: ①主节点服务器发出高电平“Power_Enable”有效信号给BMC,通知BMC需要执行上电操作; ②主节点服务器中的BMC将开机命令通过内部管理网络接口传递给从节点服务器的BMC ; ③从节点服务器的BMC发出高电平“P0wer_Enable”给所有的从节点服务器,通知从节点服务器执行开机操作; ④主节点和从节点服务器执行开机操作后,反馈高电平“PoWer_0K”信号给各自的BMC,预示本节点上电完成; ⑤在“Power_0K”之后,主节点服务器发出高电平“System_Reset”给BMC,预示主节点内处理器、内存、芯片组复位完成,等待从节点复位完成; ⑥主节点服务器中的BMC收到“System_Reset”后,通过内部管理网络通知其他从节点的 BMC ; ⑦从节点服务器BMC收到“SystenUteset”后,对本节点内的处理器、内存、芯片组进行复位操作; ⑧所有服务器节点复位完成之后,主节点服务器开始加载B1S和OS。
5.根据权利要求3所述的一种CC-NUMA多节点服务器上系统状态切换和监控的方法,其特征是所述的系统状态切换为关机,具体步骤为: ①主节点服务器发出低电平“Power_Enable”有效信号给BMC,通知BMC需要执行关机操作; ②主节点服务器中的BMC将开机命令通过内部管理网络接口传递给从节点服务器的BMC ; ③从节点服务器的BMC发出低电平“P0wer_Enable”给所有的从节点服务器,通知从节点服务器执行关机操作; ④主节点和从节点服务器执行开机操作后,反馈低电平“PoWer_OK”信号给各自的BMC,预不本节点关机完成; ⑤在“Power_OK”之后,主节点服务器发出低电平“System_Reset”给BMC,预示主节点内处理器、内存、芯片组复位完成,等待从节点复位完成; ⑥主节点服务器中的BMC收到“System_Reset”后,通过内部管理网络通知其他从节点的 BMC ; ⑦从节点服务器BMC收到“SystenUteset”后,对本节点内的处理器、内存、芯片组进行复位操作; ⑧所有服务器节点复位完成之后,主节点服务器关机完成。
6.根据权利要求3所述的一种CC-NUMA多节点服务器上系统状态切换和监控的方法,其特征是所述的开机时Power_Enable、Power_OK和System_Reset的电平组合为高电平,高电平,高电平; 所述的关机时Power_Enable、Power_OK和System_Reset的电平组合为低电平,低电平,低电平; 所述的冷重启时Power_Enable、Power_OK和System_Reset都出现一个低脉冲; 所述的热重启时Power_Enable、Power_OK为高电平,System_Reset出现一个低脉冲。
【文档编号】H04L1/22GK104506362SQ201410831246
【公开日】2015年4月8日 申请日期:2014年12月29日 优先权日:2014年12月29日
【发明者】贡维, 宗艳艳 申请人:浪潮电子信息产业股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1