超级并行计算机系统组件的自动标识方法及装置的利记博彩app

文档序号:6400008阅读:186来源:国知局
专利名称:超级并行计算机系统组件的自动标识方法及装置的利记博彩app
技术领域
本发明主要涉及到高性能计算、并行计算机的监控和管理技术领域,特指一种适用于超级并行计算机系统组件的自动标识方法及装置。
背景技术
高性能计算已经成为继理论和实验之后推动科技创新和经济发展的第三大支柱力量。应用水平的持续提高和应用领域的不断拓展对高性能计算能力提出了巨大需求。作为高性能计算的载体,超级并行计算机当前的计算能力已经跨越千万亿次,正在从万万亿次向十万万亿次甚至百万万亿次推进。超级并行计算机系统规模的持续扩张带来的直接影响就是系统组件数量的大幅增长。在2012年11月公布的第40期世界超级并行计算机系统T0P500排名榜上,位列第一位的Cray Titan超级并行计算机系统的计算结点数量达到了 18688个;位列第二位的IBMSequoia超级并行计算机的计算结点数量更是达到了惊人的98304个;第三位的Fujitsu K超级并行计算机的计算结点数量为88128个。海量系统组件给超级并行计算机系统的管理和维护带来了极大困难。超级并行计算机系统在启动或维护管理过程中需要知道每个系统组件的逻辑编号、物理位置以及二者之间的对应关系。在典型的超级并行计算机系统中,系统组件的逻辑编号通常由高速互连系统和操作系统来确定并使用,而高速互连系统和操作系统并不具备实时感知系统组件的物理位置信息的能力;监控管理系统能够实时感知系统组件的物理位置信息,但并不具备将物理位置与逻辑编号对应的能力,因此需要一种装置将系统组件的物理位置信息和逻辑编号作为全局共享信息,从而便利超级并行计算机系统的管理和维护。传统的方法是在每个系统组件上设置多针跳线或类似装置,在将组件安装到系统之前通过手工方式预先设定好唯一标识。操作系统可访问到该标识,并通过该标识来确定组件的逻辑编号。这种方法的缺陷就在于:每次更换系统组件都需要人工重新设置标识,不仅效率低下,并且容易出错,同时给后期的维护管理带来极大麻烦。

发明内容
本发明要解决的技术问题就在于:针对现有技术存在的技术问题,本发明提供一种通用性好、可简化人工操作、降低人为出错几率、提高系统维护效率、增强系统实用性的超级并行计算机系统组件的自动标识方法及装置。为解决上述技术问题,本发明采用以下技术方案:
一种超级并行计算机系统组件的自动标识方法,流程为:
Cl)系统管理控制器实时监测系统组件的在线状态;
(2)在系统组件接入系统后,首先读取该系统组件的标识寄存器,获得当前的标识信息IDpm ;同时,根据该系统管理控制器的已知全局唯一标识和接入系统组件的物理位置计算该系统组件的正确全局唯一标识ID ;(3)对比当前的标识信息IDpm和正确全局唯一标识ID的值,若二者相同则不需要更新组件标识;若不同,则通过系统管理控制器与相应的组件控制器之间的通信接口将正确全局唯一标识ID写入系统组件的标识寄存器。本发明进一步提供一种用来实现上述自动标识方法的装置,它包含一个以上系统管理控制器、位于每个系统组件上独立的组件控制器和标识寄存器、以及位于系统管理控制器上的系统组件自动标识模块,每个系统管理控制器管理控制多个系统组件,所述系统管理控制器通过通信接口与系统组件上的组件控制器相连;每个标识寄存器均保存有对应系统组件在系统中的全局唯一标识;所述系统组件自动标识模块根据系统管理控制器的全局唯一标识以及系统组件的物理位置确定系统组件的全局唯一标识,并通过系统通信接口将组件标识写入相应的标识寄存器。作为本发明的进一步改进:
所述系统组件的组件控制器可通过PCIE、LPC或SPI接口与CPU连接以使CPU访问到标识寄存器。
·
所述通信接口为边界扫描接口或I2C接口,所述系统管理控制器与所述组件控制器之间的通信接口通过紧耦合方式进行连接,或通过线缆松耦合方式进行连接。所述系统管理控制器、通信接口、系统组件的组件控制器以及标识寄存器均采用Standby供电方式供电。所述标识寄存器的位宽B根据系统中的系统组件总数量Number来确定,B和Number之间满足2B ^ Number的关系。与现有技术相比,本发明的优点在于:
1、本发明采用了通过嵌入式系统管理器对每个系统组件进行自动标识的技术方案,实现系统组件的自动标识,并且支持更换系统组件后的标识自动更新功能,极大地简化了人工操作,降低了人为出错几率,提高了系统维护效率,增强了系统的实用性。2、本发明的标识寄存器支持所在系统组件上的CPU进行访问,从而保证了操作系统能够根据该标识信息进行系统启动、控制和维护管理等操作。3、本发明不局限于具体硬件平台,具有通用性,同时具有良好的市场应用前景,特别适合于刀片式超级并行计算机系统。


图1是本发明自动标识方法的工作流程示意图。图2是本发明具体应用时超级并行计算机系统的结构示意图。图3是本发明自动标识装置的系统结构示意图。
具体实施例方式以下将结合说明书附图和具体实施例对本发明做进一步详细说明。如图1所示,本发明超级并行计算机系统组件的自动标识方法的流程为:
(O系统管理控制器实时监测系统组件的在线状态以及接入、脱离系统操作;
(2)在系统组件接入系统后,首先读取该系统组件的标识寄存器,获得当前的标识信息IDpm ;同时,根据该系统管理控制器的已知全局唯一标识和接入系统组件的物理位置计算该系统组件的正确全局唯一标识ID ;
(3)对比当前的标识信息IDpm和正确全局唯一标识ID的值,若二者相同则不需要更新组件标识;若不同,则通过系统管理控制器与相应的组件控制器之间的通信接口将正确全局唯一标识ID写入系统组件的标识寄存器。如图2所示,为本发明在具体应用实例中所面向的超级并行计算机系统的结构示意图。全系统包含M个系统管理控制器,每个系统管理控制器用来管理控制N个系统组件,所有系统管理控制器通过统一网络接口接入系统管理网络。如图3所示,本 发明进一步提供一种超级并行计算机系统组件的自动标识装置,它包含一个以上系统管理控制器、以及位于每个系统组件上的系统组件控制器和标识寄存器,系统管理控制器上设置有系统组件自动标识模块,系统管理控制器通过通信接口与系统组件上的组件控制器相连,该通信接口可以采用边界扫描或I2C等接口类型,系统管理控制器与系统组件控制器之间的通信接口可通过背板等紧耦合方式进行连接,也可通过线缆等松耦合方式进行连接。每个标识寄存器均为独立的并保存有对应系统组件在系统中的全局唯一标识,系统组件的组件控制器可通过PCIE、LPC、SPI等接口与CPU连接,使得CPU可访问到标识寄存器。每个系统组件上的CPU可访问相应的标识寄存器,系统管理控制器也可通过与组件控制器之间的通信接口访问所管辖的全部系统组件的标识寄存器。系统组件自动标识模块能根据系统管理控制器的全局唯一标识以及系统组件的物理位置确定系统组件的全局唯一标识,并通过系统管理控制器与组件控制器之间的通信接口将组件标识写入相应的标识寄存器。系统组件自动标识模块用来实时监测系统组件的在线状态以及接入、脱离系统操作;在系统组件接入系统后,首先读取该系统组件的标识寄存器,获得当前的标识信息IDpm ;同时,根据该系统管理控制器的已知全局唯一标识和接入系统组件的物理位置计算该组件的正确全局唯一标识ID ;对比当前的标识信息IDpm和正确全局唯一标识ID的值,若二者相同则不需要更新组件标识;若不同,则通过系统管理控制器与相应的组件控制器之间的通信接口将正确的全局唯一标识ID写入标识寄存器。系统管理控制器、通信接口、系统组件的组件控制器以及标识寄存器均采用Standby供电方式供电,保证本发明的超级并行计算机系统组件自动标识装置能够在系统组件切电或关电状态下完成系统组件自动标识功能。本实施例中,标识寄存器的位宽B根据系统中的系统组件总数量Number来确定,在较佳的实施例中,B和Number之间需满足2B彡Number的关系。本实施例中,系统管理控制器采用嵌入式系统设计,其上运行嵌入式操作系统及管理控制程序。每个系统管理控制器管理控制一定数量的系统组件,系统管理控制器在超级并行计算机系统中具有已知的全局唯一标识。系统管理控制器能够实时感知系统组件的在线状态以及接入、脱离系统操作,系统管理控制器与所管辖的全部系统组件上的组件控制器之间设置通信接口,使得系统管理控制器具有访问所管辖的系统组件上的标识寄存器的能力,该通信接口可以采用边界扫描或I2C等接口类型。以上仅是本发明的优选实施方式,本发明的保护范围并不仅局限于上述实施例,凡属于本发明思路下的技术方案均属于本发明的保护范围。应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理前提下的若干改进和润饰,应视为本发明的保护范围。
权利要求
1.一种超级并行计算机系统组件的自动标识方法,其特征在于,流程为: (1)系统管理控制器实时监测系统组件的在线状态; (2)在系统组件接入系统后,首先读取该系统组件的标识寄存器,获得当前的标识信息IDpm ;同时,根据该系统管理控制器的已知全局唯一标识和接入系统组件的物理位置计算该系统组件的正确全局唯一标识ID ; (3)对比当前的标识信息IDpm和正确全局唯一标识ID的值,若二者相同则不需要更新组件标识;若不同,则通过系统管理控制器与相应的组件控制器之间的通信接口将正确全局唯一标识ID写入系统组件的标识寄存器。
2.一种用来实现权利要求1所述自动标识方法的装置,其特征在于,包含一个以上系统管理控制器、位于每个系统组件上独立的组件控制器和标识寄存器、以及位于系统管理控制器上的系统组件自动标识模块,每个系统管理控制器管理控制多个系统组件,所述系统管理控制器通过通信接口与系统组件上的组件控制器相连;每个标识寄存器均保存有对应系统组件在系统中的全局唯一标识;所述系统组件自动标识模块根据系统管理控制器的全局唯一标识以及系统组件的物理位置确定系统组件的全局唯一标识,并通过系统通信接口将组件标识写入相应的标识寄存器。
3.根据权利要求2所述的装置,其特征在于,所述系统组件的组件控制器可通过PCIE、LPC或SPI接口与CPU连接以使CPU访问到标识寄存器。
4.根据权利要求2所述的装置,其特征在于,所述通信接口为边界扫描接口或I2C接口,所述系统管理控制器与所述组件控制器之间的通信接口通过紧耦合方式进行连接,或通过线缆松耦合方式进行连接。
5.根据权利要求2所述 的装置,其特征在于,所述系统管理控制器、通信接口、系统组件的组件控制器以及标识寄存器均采用Standby供电方式供电。
6.根据权利要求2所述的装置,其特征在于,所述标识寄存器的位宽B根据系统中的系统组件总数量Number来确定,B和Number之间满足2B彡Number的关系。
全文摘要
本发明公开了一种超级并行计算机系统组件的自动标识方法及装置,该方法的流程为(1)实时监测系统组件的在线状态;(2)在系统组件接入系统后,读取该系统组件的标识寄存器,获得当前的标识信息IDpre;同时,根据该系统管理控制器的已知全局唯一标识和接入系统组件的物理位置计算该系统组件的正确全局唯一标识ID;(3)对比IDpre和ID的值,若不同,则将正确全局唯一标识ID写入标识寄存器。该装置包含一个以上系统管理控制器、位于每个系统组件上独立的组件控制器和标识寄存器、及位于系统管理控制器上的系统组件自动标识模块。本发明具有通用性好、可简化人工操作、提高系统维护效率、增强系统实用性等优点。
文档编号G06F13/16GK103150277SQ201310070819
公开日2013年6月12日 申请日期2013年3月6日 优先权日2013年3月6日
发明者李宝峰, 蒋句平, 田宝华, 郑明玲, 张晓明, 李元山, 李小芳, 邢建英, 袁远, 孙言强, 姚信安, 宋飞, 张晟 申请人:中国人民解放军国防科学技术大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1