分布式组构系统中的诊断的利记博彩app
【专利摘要】分布式组构系统具有分布式线路卡(DLC)机架和扩展组构耦合器(SFC)机架。每个DLC机架包括网络处理器和组构端口。每个DLC机架的每个网络处理器包括与该DLC机架的DLC组构端口进行通信的组构接口。每个SFC机架包括组构元件和组构端口。通信链路将每个SFC组构端口连接到一个DLC组构端口。每个通信链路包括信元传载通路。每个SFC机架的每个组构元件收集该SFC机架的每个SFC组构端口的每通路统计。每个SFC机架包括程序代码,其获得该SFC机架的组构元件芯片收集的每通路统计。网络元件包括程序代码,其汇总由每个SFC机架的每个组构元件收集的每通路统计并且将该统计合并成整个分布式组构系统的拓扑。
【专利说明】分布式组构系统中的诊断
【技术领域】
[0001] 本发明总体上涉及数据中也和数据处理。更特别地,本发明涉及分布式组构 (f油ric)系统中的诊断。
【背景技术】
[0002] 数据中也一般是提供支持企业和组织所需的因特网和内联网服务的集中式设施。 典型的数据中也可容纳各种类型的电子设备,诸如计算机、服务器(例如,电子邮件服务 器、代理服务器W及DNS服务器)、交换机、路由器、数据储存设备、W及其他相关组件。数据 中也的基础设施,具体而言,交换机组构中的交换机层,在服务支持中起着中也作用。数据 中也的实现可具有数百数千的交换机机架,各种机架之间的互连可能是复杂的,难W跟踪。 此外,各种机架之间的诸多错综复杂的互连会使在数据中也产生的问题难W排除。
【发明内容】
[0003] 一方面,本发明的特征在于用于管理分布式组构系统的计算机程序产品,在分布 式组构系统中,至少一个扩展组构禪合器(scaled-out f油ric coupler, SFC)机架通过组 构通信链路连接到至少一个分布式线路卡值LC)机架。每个组构通信链路将所述至少一个 SFC机架的一个组构端口连接到所述至少一个DLC机架的一个组构端口。每个组构通信链 路包括用于传载信元(cell)的多个通路。计算机程序产品包括计算机可读储存介质,计算 机可读储存介质上实现有计算机可读程序代码。计算机可读程序代码包括配置为由每个 SFC机架的每个组构元件芯片收集该SFC机架的每个SFC组构端口的每通路统计的计算机 可读程序代码。计算机可读程序代码还包括配置为由中央代理汇总由每个SFC机架的每个 组构元件芯片收集的每通路统计的计算机可读程序代码,W及配置为将中央代理汇总的每 通路统计合并成整个分布式组构系统的拓扑W供用户界面呈现的计算机可读程序代码。
[0004] 在另一方面,本发明的特征在于一种分布式组构系统,其包括至少一个分布式线 路卡值LC)机架和至少一个扩展组构禪合器(SFC)机架。每个DLC机架包括至少一个网络 处理器和多个DLC组构端口。每个DLC机架的每个网络处理器包括与该DLC机架的DLC组 构端口进行通信的组构接口。每个SFC机架包括组构元件芯片和多个SFC组构端口。每个 SFC组构端口通过组构通信链路连接到DLC组构端口之一。每个组构通信链路包括传载信 元的多个通路。每个SFC机架的每个组构元件芯片收集该SFC机架的每个SFC组构端口的 每通路统计。每个SFC机架还包括处理器和储存程序代码的存储器,程序代码配置为在运 行时获得该SFC机架的组构元件芯片收集的每通路统计。网络元件包括处理器和存储器, 存储器储层程序代码,程序代码配置成汇总由每个SFC机架的每个组构元件芯片收集的每 通路统计并且将所汇总的每通路统计合并成整个分布式组构系统的拓扑W供用户界面呈 现。
[0005] 在又一方面,本发明的特征在于用于管理分布式组构系统的方法,在分布式组构 系统中,至少一个扩展组构禪合器(SFC)机架通过组构通信链路连接到至少一个分布式线 路卡值LC)机架。每个组构通信链路将所述至少一个SFC机架的一个组构端口连接到所述 至少一个DLC机架的一个组构端口。每个组构通信链路包括传载信元的多个通路。该方法 包括由每个SFC机架的每个组构元件芯片收集SFC机架的每个SFC组构端口的每通路统 计。由每个SFC机架的每个组构元件芯片收集的每通路统计由中央代理汇总。由中央代理 汇总的每通路统计被合并成整个分布式组构系统的拓扑W供用户界面呈现。
【专利附图】
【附图说明】
[0006] 现在将参考附图仅W示例的方式描述本发明的实施例,附图中:
[0007] 图1是包括数据中也、服务器W及管理站的联网环境的实施例;
[0008] 图2是具有与多个分布式线路卡值LC)机架互连的多个扩展组构禪合器(SFC)的 分布式组构系统的实施例的功能框图;
[0009] 图3是具有用于收集拓扑和/或统计的本地软件代理的SFC机架的功能框图;
[0010] 图4是包括两个网络处理器的DLC机架的实施例的功能框图,每个网络处理器都 具有组构接口;
[0011] 图5是双交换机DLC机架的CXP/PHY和两个网络处理器的组构接口之间的互连的 实施例的功能框图;
[0012] 图6是具有本地软件代理并且可选地具有中央软件代理的DLC机架的功能框图, 本地软件代理收集性能统计,中央软件代理收集分布式组构系统中的所有SFC和DLC的拓 扑和/或统计信息;
[0013] 图7A和图7B包括用于构建分布式组构系统的拓扑、用于收集与分布式组构系统 的操作相关的统计、W及用于在用户界面中显示拓扑和/或统计的过程的流程图;
[0014] 图8是简化的分布式组构系统的示例拓扑的框图;W及
[0015] 图9是可由SFC和DLC产生的链路级诊断的图形视图的示例的图示。
【具体实施方式】
[0016] 此处描述的分布式组构系统包括与多个独立的分布式线路卡值LC)机架进行通 信的独立扩展组构禪合器(SFC)机架。SFC机架具有一个或多个基于信元的组构元件芯片, 组构元件芯片通过SFC组构端口在通信链路上与DLC机架上的交换芯片的组构接口进行通 信。每个组构元件芯片可进行每个SFC组构端口处的活动的统计测量。类似地,每个化C 组构接口可进行DLC组构端口上的活动的统计测量。该样的统计测量包括但不限于对测量 期间发送和接收的信元数进行计数,W及对错误信元进行计数。从管理站,网络管理员可W 图形地或通过命令行界面(化I)显示该统计信息W及分布式组构系统的拓扑。该信息的显 示为网络管理员提供了分布式组构系统的各种通信链路的性能的实时快照W及排除故障 的工具。
[0017] 图1示出了联网环境2的实施例,联网环境2包括通过网络8与管理站4和服务 器6进行通信的数据中也10。网络8的实施例包括但不限于局域网(LAN)、城域网(MAN) W 及诸如因特网或万维网之类的广域网(WAN)。数据中也10 -般是容纳各种计算机、路由器、 交换机W及支持对企业、组织或其他实体的运营不可或缺的应用和数据的其他相关设备的 设施。
[0018] 数据中也10包括与此处称为分布式线路卡值LC) 14的网络元件14进行通信的 SFC机架12。SFC机架12和化C 14 一起形成分布式组构系统并且对应于单个信元交换域。 虽然仅示出四个DLC机架14,但是信元交换域中的DLC机架数量可在数百和数千的范围。 DLC 14是指定集群的成员。数据中也10可具有一个W上的集群,但是每个DLC仅可W是一 个集群的成员。数据中也10可W在单个位置实现,或分布在多个位置中。虽然示为在数据 中也10外,但是管理站4和服务器6中的任一个(或两者)都可被视为数据中也10的一 部分。
[0019] 在数据中也10中,功能发生在H个平面上;管理平面、控制平面和数据平面。对 集群的管理,诸如配置管理、运行时配置管理、信息呈现(示出和显示)、图形生成W及处理 SNMP请求,发生在管理平面上。控制平面与涉及网络信令和控制协议的那些功能相关。数 据平面管理数据流。在数据中也10中,管理平面和控制平面的功能被集中,管理平面和控 制平面主要在服务器6处实现,数据平面的功能分布在化C 14和SFC 12中。
[0020] 管理站4提供用于管理和控制分布式组构系统的网络交换机12、14和控制器6的 集中管理点。通过管理站4,数据中也10的用户或网络管理员与控制器6进行通信,W便 从单个位置管理可想而知具有数百化C、数十SFC W及一个或多个控制器的集群。在管理 站4上执行的图形用户界面(GUI)应用用于向网络管理员提供分布式组构系统的整个网 络拓扑的视图。该样的GUI应用的示例是由位于纽约州Armonk的IBM公司提供的Blade Harmony Manager⑩。简而言之,基于GUI的应用可W使用由SFC的组构元件芯片收集的 信息来W图形形式表示整个分布式组构系统的拓扑,如下面更详细地描述的那样。
[0021] 另外,管理站4可W通过各种连接中的一种直接(点对点)或间接连接到数据中 也10的给定化C 14,所述连接为诸如标准电话线、数字订户线值化)、异步DSULAN或WAN 链路(例如T1、T3)、宽带连接(巾贞中继、ATM)、W及无线连接(例如802. ll(a)、802. 11化)、 802. 11 (g)、802. 11 (n))。通过使用诸如Telnet或SNMP(简单网络管理协议)之类的网络 协议,管理站4可W访问整个系统的控制平面服务器6的命令行界面(CLI),W便管理分布 式组构系统并且访问由各种网络交换机收集的拓扑和统计信息,如下面更详细地描述的那 样。
[0022] -般而言,服务器6是向数据中也10提供一种或多种服务的计算机(或计算机群 组),其示例包括但不限于电子邮件服务器、代理服务器、DNS服务器、W及运行分布式组构 系统的控制平面的控制服务器。为了支持整个DLC集群的控制平面功能,服务器6配置有 足够的处理能力(例如,有多个处理器核)。
[0023] 图2示出了具有与多个独立DLC机架或箱14-1、14-2、14-N(概言之,14)进行通信 的多个独立SFC机架12-1、12-2、12-3和12-4 (概言之,12)的分布式组构系统的实施例。 此示例实施例具有四个SFC机架12和N个DLC机架14。SFC 12和化C 14是单个基于信 元的交换域的一部分。
[0024] 每个SFC机架12包括与N个SFC组构端口 18进行通信的一个或多个基于信元的 交换机组构元件(FE) 16。在此示例实施例中,至少有与分布式组构系统中的各个SFC机架 12中的SFC组构端口 18 -样多的DLC机架14。SFC机架12的每个组构元件16基于信元 标头中的目的地信息,在SFC组构端口 18之间交换信元。
[0025] 每个DLC机架14具有网络端口 20、网络处理器22-1、22-2(也称为交换芯片)W 及组构端口 24。一般而言,网络处理器22针对数据包(packet)处理被优化。每个网络处 理器22与每个组构端口 24并且与网络端口 20的子集进行通信(例如,每个网络处理器22 可W交换从在DLC的一半网络端口上接收到的数据包流量导出的信元)。网络处理器24的 示例实现是位于加州Irvine的化oadcom生产的BCM 88650, 一种28端口 10抓E交换机设 备。网络端口 20与交换域外部的诸如因特网之类的网络8进行通信。在一实施例中,每个 DLC机架14具有四十个网络端口 20,每个网络端口 20配置为10抓PS W太网端口。DLC机 架14的综合网络带宽是400抓PS。
[002引 图2中的分布式组构系统具有全网格府11-mesh)配置海个DLC14与SFC 12中 的每一个进行通信;更具体而言,给定化C机架14的每个组构端口 24通过组构通信链路26 与SFC 12中的不同的一个的组构端口 44进行电通信。参考作为代表性示例的化C 14-1, DLC14-1的DLC组构端口 24-1与SFC 12-1的组构端口 18-1进行通信,DLC组构端口 24-2 与SFC 12-2的组构端口 18-1进行通信,DLC组构端口 24-3与SFC 12-3的组构端口 18-1 进行通信,DLC组构端口 24-4与SFC 12-4的组构端口 18-1进行通信。W此全网格配置连 接,DLC和SFC形成分布式虚拟机架,DLC充当线路卡。分布式虚拟机架虚拟地是模块化机 架;也就是说,可W向分布式虚拟机架中添加化C 14或从其去除化C 14,一次一个,就像向 物理机架添加或从其去除线路卡一样。全网格配置只是分布式组构系统体系结构的一个示 例。其中连接DLC和SFC的其他类型的配置包括但不限于菊花链和星形构造。
[0027] 每个DLC组构端口 24和SFC组构端口 18之间的通信链路26可W是有线连接。 互连变体包括直接附连电缆值AC)或光缆。DAC提供五到走米的电缆长度;而光缆在数据 中也内提供高达100米的连接性(标准光学连接性可超过10km)。可另选地,通信链路26 可W是直接物理连接(即,DLC组构端口 24的电连接器直接物理连接到SFC组构端口 18 的电连接器)。在一实施例中,每个通信链路支持12个SerDes (串行器/解串行器)通道 (channel)(每个通道由发送通路(lane)和接收通路构成)。
[0028] 在该分布式组构系统的操作过程中,数据包到达一个化C 14的网络端口 20。网络 处理器22从数据包标头和有效负载提取所需信息W形成预分类元数据。通过使用该元数 据,网络处理器22执行表查找,W发现此数据包和其他相关动作的物理目的地端口。利用 该些结果和元数据,网络处理器22创建专有标头并且将其附加到数据包的前面。与网络端 口 20进行通信的化C 14的网络处理器22将包括专有标头的整个数据包分割为较小的信 元,并且为每个信元添加信元标头(用于对信元进行排序)。网络处理器22通过DLC组构 端口 24将信元发送到SFC 12中的每一个,将不同的信元发送到不同的SFC 12。例如,考虑 具有1600比特长度的传入数据包。化C 14的接收方网络处理器22可将数据包拆分为四个 400比特(在将标头信息添加到那些信元之前)的信元。然后,网络处理器22将不同的信 元发送到四个SFC12中的每一个,效果上,实现信元跨SFC 12的负载平衡。
[0029] 接收到信元的每个SFC 12的基于信元的交换机组构元件16检查该信元的标头, 确定其目的地,并且通过该SFC的组构端口 18中的合适的一个将信元发送到目的地化C 14。目的地化C 14从SFC接收与原始数据包相关的所有信元,重新组装原始数据包(即, 删除所添加的标头,组合信元),并且通过其网络端口 20中的合适的一个发送重新组装的 数据包。继续前面的四信元示例,考虑每个SFC确定目的地DLC是化C 14-2。每个SFC 12 通过其组构端口 18-2将其信元发送到化C 14-2。DLC 14-2从所接收到的四个信元重新组 装数据包(所添加的标头提供组合信元的顺序),并且从合适的网络端口 20发送数据包。 信元中的预分类标头信息确定合适的网络端口。
[0030] 具有四个SFC机架12的图2的全网格配置可W是全线路速率配置,即,用于将信 元从给定DLC传输到SFC的综合带宽(即,480抓PS)大于在网络端口 20上到达给定化C 的数据包的综合带宽(即,400Gbps)。该配置也可适用于支持对于化C 14的各种超订置换 (oversubscription permutation)。例如,代替具有四个SFC,分布式虚拟机架可W只有两 个SFC机架(例如,12-1、12-2),每个化C14只使用两个组构端口 24用于与SFC机架12进 行通信,每个SFC机架12 -个组构端口 24。此超订置换的例如每个DLC在其网络侧具有 400抓PS的综合进口带宽(四十个10抓PS W太网端口)和用于与两个SFC进行通信的其两 个120抓PS组构端口 24上的240抓PS的综合出口信元交换带宽。也可W实施其他超订置 换。
[003。 图3示出了 SFC机架的实施例的功能框图,包括与SFC组构端口 18-1、18-2、18-3 和18-4(概言之,18)进行通信的基于信元的组构元件芯片16。虽然称为芯片,但是组构元 件芯片16可包括多个芯片(即,芯片组)。组构元件芯片16可用加州Irvine的化oadcom 生产的BCM88750来实现。SFC机架12可W具有通过组构端口 18进行通信的一个W上的组 构元件芯片16。每个SFC组构端口 18通过通信链路26与DLC组构端口中的一个进行通 信。每个通信链路26包括多个SerDes通道。在一实施例中,每个通信链路26的SerDes 通道的数量是十二(即,十二个接收通路和十二个发送通路)。
[0032] 组构元件芯片16可收集有关组构元件芯片16和化C 14的组构端口 24之间的每 个通信链路上的连接性和统计活动的信息。除了与信元传输和接收W及所检测出的错误 相关的各种统计之外,该样的信息还包括但不限于由通信链路承载的每个通路的状态和带 宽。此信息被认为是准确且可靠的,能用于构建分布式组构系统的拓扑。组构元件芯片16 将所收集到的信息存储在一个或多个表中。
[0033] SFC机架12还包括与存储器27进行通信的处理器25。储存在存储器27中的是 本地软件代理28、与组构元件芯片16相关联的SDK (软件开发工具包)30、W及用来与SDK 30进行通信的API层31。通过SDK 30和SDK API 31,本地软件代理28可W访问组构元件 芯片16将所收集到的连接性和/或统计信息储存在其中的每个表。本地软件代理28的执 行可W按需发生。
[0034] 图4示出了每个化C 14具有通过PHY接口 38与网络处理器22-1、22-2进行通信 的网络端口 20的实施例的框图。在一实施例中,PHY接口 38包括用于每个网络端口 20的 XFI电气接口(10Gb小形状因子可插模块狂FP))。每个网络处理器22具有组构接口(1/ 巧32并且通过存储器通道36与缓冲存储器34进行通信。在一实施例中,缓冲存储器34利 用1866MHz DDR3SDRAM(双倍数据速率同步动态随机存取存储器)器件来实现。
[00巧]每个网络处理器22的组构接口 32包括优选地提供二十四个SerDes通道40的 SerDes(未示出)。SerDes包括用于在每个方向上在串行和并行接口之间转换数据的一对 功能块。在一实施例中,每个SerDes通道40 W 10. 3抓PS带宽操作;二十四个通道的综合 带宽大致是240抓ps (或当两个组构接口 32时480抓ps)。在另一实施例中,每个SerDes通 道40 W大致25抓PS带宽操作。二十四个SerDes通道40被分为四组,每组六个通道。 [0036] DLC 14还包括分别与DLC 14的四个(例如,标准IB CXP)组构端口 24-U24-2、 24-3、24-4进行通信的PHY 42-1、42-2、42-3、42-4(概言之,42)。每个?狀42还与来自两 个网络处理器22-1、22-2中的每个的一组六个SerDes通道40进行通信(于是,每个PHY42 支持十二个SerDes通道40)。在一实施例中,每个PHY 42是3x40G PHY。
[0037] 优选地,化C 14的每个组构端口 24包括120抓ps CXP接口。在一实施例中,CXP 接口在单个外形中具有十二个发送和十二个接收SerDes通路(12x),每个通路提供10抓PS 带宽。120抓ps 12x CXP接口的描述可见于由InfiniBand? Trade Association发布的 "Supplement to InfiniBand? Architecture Specification Volume 2Release 1.2.1" 中。12通道CXP的此实施例被称为标准InfiniBand(IB)CXP。在另一实施例中,CXP接口 具有用于支持10通路应用的10个通路(lOx)(诸如100Gb W太网)。10通路CXP的此实 施例被称为W太网CXP。
[0038] 图5示出了分别是两个网络处理器22-U22-2的组构接口 32-1、32-2(概言之, 32)与化C 14的CXP组构端口 24之间的接口连接的实施例。在图5中,PHY 42-U42-2、 42-3和42-4分别被包括到CXP组构端口 24-1、24-2、24-3和24-4中,每个CXP组构端口 24 支持十二对通路(一对对应于Tx/Rv通路)。该些十二对通路从两个组构接口 32-1、32-2 中的每一个映射到六个SerDes通道。每个组构接口 32提供二十四个SerDes通道40,其分 成四个六通道的组。对于组构接口 32中的每一个,一组六个SerDes通道40传递到四个组 构端口 24中的不同的一个。例如,来自每个组构接口 32-1、32-2的一组六个SerDes通道映 射到CXP组构端口 24-1的PHY 40-1,来自每个组构接口 32-1、32-2的第二组六个SerDes 通道映射到CXP组构端口 24-2的PHY 42-2,来自每个组构接口 32-U32-2的第H组六个 SerDes通道映射到CXP组构端口 24-3的PHY 40-3,来自每个组构接口 32-1、32-2的第四 组六个SerDes通道映射到CXP组构端口 24-4的PHY42-4。
[0039] 图6示出了包括网络处理器芯片22、存储器60 W及处理器62的DLC机架14的实 施例的功能框图。存储器60包括与网络处理器芯片22相关联的SDK 50、用于与SDK 50进 行通信的API层52、本地软件代理54 W及可任选的中央软件代理56。网络处理器22的组 构接口 32与DLC组构端口 24-1、24-2、24-3和24-4进行通信。每个DLC组构端口 24通过 优选包括十二个SerDes通道(十二对Tx/Rv通路)的通信链路26与SFC组构端口 18中 的一个进行通信。
[0040] 与SFC的组构元件芯片16类似,网络处理器芯片22可W收集关于与DLC的组构端 口处的活动的统计相关的信息。该样的信息包括但不限于关于每个DFC组构端口 24的各 个通路的健康、使用、错误和带宽的统计。网络处理器芯片22可W将所收集到的信息储存 在一个或多个表中。当执行时,本地软件代理50通过API层54和SDK层52访问每个表。 该样的执行可W按需发生。
[0041] 一般而言,中央软件代理56汇总由分布式组构系统中的每个SFC12收集到的信 息,并且创建分布式组构系统的拓扑。在图6中,中央软件代理56示为驻留在化C 14上。 中央软件代理56可W安装在每个DLC上,但是仅在主控DLC上激活。在另一实施例中,中 央软件代理可W替代地驻留在服务器(例如,图1的服务器6)上。
[0042] 图7A和图7B示出了用于产生分布式组构系统的拓扑并且用于诊断分布式组构系 统的过程70的实施例。虽然关于单个组构元件芯片进行描述,但是将理解,在分布式组构 系统的操作过程中,每个芯片都执行过程70。SFC 12的组构元件芯片16检测(步骤72) 组构元件和DLC上的交换芯片的组构接口之间的连接性。为了检测连接性,SFC12的组构 元件芯片16在其全部SerDes链路26上交换最高优先级可达性消息,W 了解SFC 12连接 到的每个交换芯片(即,网络处理器22)的设备ID。在消息交换的多个迭代之后,组构元 件芯片16生成(步骤74)包含表示该SFC的SerDes链路上的目标设备的可达性的信息的 表。表是可用于保存所收集到的信息的数据结构的示例。通过各种机制,组构元件芯片16 构建各个通路及其连接性的拓扑矩阵。作为一个该样的机制的示例,组构元件芯片16的逻 辑和交换芯片的组构接口的逻辑在所有SerDes链路上交换控制信元。每个控制信元包含 源设备的细节。通过了解源设备id,该些组构元件芯片构建每个通路的拓扑表。然后,通过 查找具有相同对等设备id的所有通路,组构元件芯片的逻辑构建设备级别的拓扑。另外, 组构元件芯片16频繁地(例如,每隔6微砂)更新表。更新频率确保信息的精确度和可靠 性。
[0043] 组构元件芯片16还可收集(步骤76)关于每个SFC组构端口 18的各个通路的 健康、使用、错误、带宽的每通路统计。在收集时段收集到的各个通路的统计包括但不限于 所接收到的总信元、所发送的总信元、总单播信元、总多播信元、总广播信元、各种类型的控 制信元总数、每优先级队列的统计(例如优先等级0至7)。在测量时段各个通路的错误统 计包括但不限于所接收到的信元错误、所发送的信元错误、P化(锁相环)错误、所接收到的 信元上的信元标头错误、各种类型的本地缓冲区溢出、1-比特奇偶错误、W及多比特奇偶错 误。组构元件芯片16将所收集到的统计储存在存储器中(例如,与拓扑信息一起或分开储 存在表中)。组构元件芯片16还可W执行每通路诊断,诸如调节和测试每个通路的模拟信 号属性(例如,振幅和信号预加强)。
[0044] 例如,每通路诊断可包括对各种模式设置伪随机比特序列(PRB巧(例如,PRBS31、 PRBS23、PRBS11、PRBS9和PRBS7)。通过在通路两端设置该些模式中的每个,诊断模块可识 别和调谐每通路型式(pattern)敏感性。
[0045] 此外,诊断模块可测量每个通路上针对各种数据速率消耗的W毫瓦计的功率。通 过测量每通路消耗的功率量,可W确定给定SFC或DLC组构端口的功耗。其他诊断可包括 通过读取通路寄存器来收集每个通路的上升和下降时间(即,所谓的信号边缘速率)。该样 的诊断提供了串行交换性能该一每通路属性。
[0046] 作为能执行的诊断的另一示例,组构元件芯片能读取每个通路的"单位或比特 区间"。单位区间或比特区间是W给定数据速率为一个比特分配的时间的度量(例如, 10. 3抓PS通路具有等于97. 08皮砂的比特区间)。对于每个组构端口,计算和给出平均比 特区间W用于性能评估和调谐。
[0047] 诊断模块还可针对每个通路执行抖动模拟,向通路添加各种量的抖动并且确定交 换机组构和DLC的每通路容限。可W执行针对基准时钟抖动的类似测试W用于容限校准。
[0048] 作为调谐的示例,诊断模块可调谐每个组构端口的建立和保持时间的设置W稳 定化用于钟控到并行寄存器中的并行数据总线。调谐的另一示例包括设置每个通路的编 码(例如,64/66b、8/10b),其影响通路识别奇偶和校正错误的能力。诊断模块还可调谐 SerDes通路W在传载连续相同型式(例如00000000000000或11111111111111111)时效率 高,而不损失数据时钟。
[0049] 与SFC组构元件芯片16的操作同时地,网络处理器芯片22的DLC组构接口 32也 通过每个通信链路26上收集(步骤78)所接收到的或所发送的信元的每通路统计,包括错 误统计。
[0050] 通过SDK 31的API层30,在SFC机架12上运行的本地软件代理28可W访问(步 骤80)由组构元件芯片16产生的那些连接性表和由组构元件芯片16收集到的各个通路的 统计。类似地,通过SDK 50和API层52,在化C 14上运行的本地软件代理54访问(步骤 82)由网络处理器芯片22的组构接口 32收集到的各个通道的统计。由本地软件代理28、 54对信息进行收集可W按预定义的或动态设置的时间间隔发生。
[0051] 分别在SFC 12和化C 14上运行的本地软件代理28、54将连接性和统计信息转发 (步骤84)到在主控化C(或另选地,连接到数据中也的服务器(例如,服务器6))上运行的 中央软件代理56。此信息用于构建分布式组构系统的拓扑,并且按需提供所有端口上的每 个通路的详细统计。
[005引响应于从SFC接收到的连接性信息,中央软件代理56生成(步骤86)表示分布 式组构系统的拓扑的连接性图形。此图形准确地描绘分布式组构系统中的所有DLC和SFC 的连接性。除了拓扑信息和每个通路的各种信元统计之外,中央软件代理56还具有链路带 宽、超订因子、流量分布和其他细节。连接性图形也可示出所有互连链路26的带宽(和/ 或诸如此类的其他信息)。此外,由于组构元件芯片16高频地更新它们的连接性矩阵,因此 中央软件代理56可W频繁地更新分布式组构系统的全局连接性拓扑,W示出链路状态(例 如)W及拓扑变化。
[0053] 来自管理站4的网络管理员可W连接(步骤88)到运行中央软件代理56的设备 并且请求所收集到的并且更新的信息。响应于该请求,在管理站4上运行的基于GUI的应 用W图形形式显示(步骤90)连接性图形W呈现整个分布式组构系统的拓扑的最新视图。 最新视图可包括每个SFC和每个DLC之间的每个通信链路26的带宽和链路状态。
[0054] 复杂分布式网络系统的整个网络拓扑的图形视图有利地方便了对分布式组构系 统的管理、故障诊断W及调试。网络管理员可W与分布式组构系统的图形视图进行交互 (步骤92),W通过控制SFC和DLC之间的链路的状态来控制系统的拓扑。关于每个SFC和 各个组构元件芯片,每个通路、每个SFC组构端口、每个DLC地按需显示统计通过准确定位 受影响的链路而简化了对分布式组构系统中出现的问题的故障排除。
[00巧]图8是包括组构元件芯片16和两个网络处理器芯片22-U22-2的分布式组构系 统的示例简化拓扑的框图。为了说明,两个网络处理器芯片22-U22-2驻留在单独的DLC机 架上。在此示例中,SFC组构端口 18-1U8-2通过通信链路26连接到网络处理器芯片22-1 的组构接口 32-1,SFC组构端口 18-3、18-4连接到网络处理器芯片22-2的组构接口 32-2。 表1是组构元件芯片16可能基于由组构元件芯片16和组构接口 32-U32-2交换的可达性 消息产生的表的简化示例。
[0056]表 1 [00571
【权利要求】
1. 一种用于管理分布式组构系统的方法,在所述分布式组构系统中至少一个扩展组构 耦合器(SFC)机架通过组构通信链路连接到至少一个分布式线路卡(DLC)机架,每个组构 通信链路将所述至少一个SFC机架的一个组构端口连接到所述至少一个DLC机架的一个组 构端口,每个组构通信链路包括传载信元的多个通路,所述方法包括: 由每个SFC机架的每个组构元件芯片收集该SFC机架的每个SFC组构端口的每通路统 计; 由中央代理汇总由每个SFC机架的每个组构元件芯片收集的每通路统计;以及 将所述中央代理汇总的所述每通路统计合并成整个分布式组构系统的拓扑以供用户 界面呈现。
2. 如权利要求1所述的方法,还包括由每个DLC机架的网络处理器的每个组构接口收 集该DLC机架的每个DLC组构端口的每通路统计。
3. 如权利要求1或2所述的方法,还包括由所述中央代理汇总由每个DLC机架的网 络处理器的每个组构接口收集的每通路统计,其中由用户界面呈现的拓扑还合并有由每个 DLC机架的网络处理器的每个组构接口收集的每通路统计。
4. 如任一前述权利要求所述的方法,其中,所述每通路统计包括测量区间期间接收的 信元数和发送的信元数。
5. 如任一前述权利要求所述的方法,其中,所述每通路统计包括在下列各项中的一个 或多个的测量区间期间获得的计数:接收和发送的单播信元、接收和发送的多播信元、以及 接收和发送的广播信元,针对每种类型的接收和发送的信元所使用的每种不同优先等级的 计数,信元跨多个通路的分布,以及组构通信链路的利用。
6. 如任一前述权利要求所述的方法,其中,所述每通路统计包括下列各项中的一个或 多个的错误统计:接收信元错误、发送信元错误、PLL(锁相环)错误、接收信元上的信元标 头错误、不同类型的本地缓冲器溢出、1比特奇偶错误、以及多比特奇偶错误。
7. 如任一前述权利要求所述的方法,其中,所述每通路统计包括测量区间期间不同类 型的控制信元的计数。
8. 如任一前述权利要求所述的方法,还包括调谐和测试每个通路的模拟信号属性。
9. 一种分布式组构系统,包括: 至少一个分布式线路卡(DLC)机架,每个DLC机架包括至少一个网络处理器和多个DLC 组构端口,每个DLC机架的每个网络处理器包括与该DLC机架的DLC组构端口进行通信的 组构接口; 至少一个扩展组构耦合器(SFC)机架,每个SFC机架包括组构元件芯片和多个SFC组 构端口,每个SFC组构端口通过组构通信链路连接到所述DLC组构端口之一,每个组构通信 链路包括传载信元的多个通路,每个SFC机架的每个组构元件芯片收集该SFC机架的每个 SFC组构端口的每通路统计,每个SFC机架还包括处理器和储存程序代码的存储器,所述程 序代码配置为在运行时获取由该SFC机架的组构元件芯片收集的每通路统计;以及 网络元件,包括处理器和储存程序代码的存储器,所述程序代码配置为汇总由每个SFC 机架的每个组构元件芯片收集的每通路统计并且将所汇总的每通路统计合并成整个分布 式组构系统的拓扑以供用户界面呈现。
10. 如权利要求9所述的分布式组构系统,其中,每个DLC机架的网络处理器的每个组 构接口收集该DLC机架的每个DLC组构端口的每通路统计。
11. 如权利要求10所述的分布式组构系统,其中,每个SFC机架的每个组构元件芯片和 每个DLC机架的网络处理器的每个组构接口调谐和测试每个通路的模拟信号属性。
12. 如权利要求10所述的分布式组构系统,其中,所述中央代理汇总由每个DLC机架的 网络处理器的每个组构接口收集的每通路统计,并且其中由用户界面呈现的拓扑还合并有 由每个DLC机架的网络处理器的每个组构接口收集的每通路统计。
13. 如权利要求9到12中的任一项所述的分布式组构系统,其中,所述每通路统计包括 在测量区间期间接收的信元数和发送的信元数。
14. 如权利要求9到12中的任一项所述的分布式组构系统,其中,所述每通路统计包括 下列各项中的一个或多个的测量区间期间获得的计数:接收和发送的单播信元、接收和发 送的多播信元、接收和发送的广播信元、以及测量区间期间不同类型的控制信元。
15. 如权利要求14所述的分布式组构系统,其中,所述每通路统计还包括:针对接收和 发送信元中的每种类型使用的每种不同优先等级的计数。
16. 如权利要求9到15中的任一项所述的分布式组构系统,其中,所述每通路统计包括 下列各项中的一个或多个的错误统计:接收信元错误、发送信元错误、PLL (锁相环)错误、 接收信元上的信元标头错误、不同类型的本地缓冲器溢出、1比特奇偶错误、以及多比特奇 偶错误。
17. 如权利要求9到16中的任一项所述的分布式组构系统,其中,由每个SFC机架的每 个组构元件芯片和每个DLC机架的网络处理器的每个组构接口收集的每通路统计包括跨 通路的信元分布。
18. 如权利要求9到17中的任一项所述的分布式组构系统,其中,由每个SFC机架的每 个组构元件芯片和每个DLC机架的网络处理器的每个组构接口收集的每通路统计包括对 组构通信链路的利用。
19. 一种计算机程序产品,用于管理分布式组构系统,在所述分布式组构系统中,至少 一个扩展组构耦合器(SFC)机架通过组构通信链路连接到至少一个分布式线路卡(DLC)机 架,每个组构通信链路将所述至少一个SFC机架的一个组构端口连接到所述至少一个DLC 机架的一个组构端口,每个组构通信链路包括传载信元的多个通路,所述计算机程序产品 包括计算机可读储存介质,所述计算机可读储存介质上实现有计算机可读程序代码,所述 计算机可读程序代码可由计算机运行以执行权利要求1-8中的任一项所述的方法。
【文档编号】H04L29/08GK104488226SQ201380012659
【公开日】2015年4月1日 申请日期:2013年2月19日 优先权日:2012年3月7日
【发明者】K·G·坎博, N·皮沙姆巴拉姆, 吕达人, V·潘德伊, N·高什, S·安南萨拉姆, C·蒙顿, N·马克杰 申请人:国际商业机器公司