一种网络设备故障定位系统、方法及装置制造方法

文档序号:7822288阅读:184来源:国知局
一种网络设备故障定位系统、方法及装置制造方法
【专利摘要】本发明公开了一种网络设备故障定位系统、方法及装置,包括检测模块、通讯模块、信息收集模块和信息判断模块,其中:检测模块,用于监听与自身建立连接的待检测设备的故障发生信息;当监听到待检测设备发生故障时,向信息收集模块发送触发指令;通讯模块,用于转发检测模块向信息收集模块发送的触发指令;信息收集模块,用于通过与多个网络层级的命令收集接口收集待检测设备的故障相关信息;将收集到的故障相关信息发送给信息判断模块;信息判断模块,用于将故障相关信息与预设的故障定位信息进行比较;根据比较结果确定故障问题。采用本发明实施例提供的方案,提高了网络设备定位的可靠性和准确性。
【专利说明】一种网络设备故障定位系统、方法及装置

【技术领域】
[0001]本发明涉及通信【技术领域】,尤其涉及一种网络设备故障定位系统、方法及装置。

【背景技术】
[0002]在无线网络中,网络中的网络设备可能会出现故障,为了保证无线网络能够正常运行,需要对网络设备进行故障检测,快速的定位网络设备的故障,这对于提高网络设备的可靠性是非常重要的。现有的对网络设备故障定位主要有如下两种方式:
[0003]第一种方式:采用外部故障定位检测的方式。外部的终端设备上的网管软件通过简单网络管理协议(SNMP, Simple Network Management Protocol)与待检测设备进行通信连接,网管软件可以通过向待检测设备发送数据获取请求,来收集待检测设备的异常日志、CPU、内存、接口收发包等信息,并将收集到的信息提供给网管人员,网管人员对这些信息进行分析从而定位故障。由于人工参与对大量信息的分析来定位故障,信息量大可能会发生漏检的情况,使得采集的故障信息不完整,使得故障定位的可靠性和准确性差。并且,如果网管人员在收集到的信息中发现有告警信息,并且该告警信息对应的是当前正在运行的应用,网管人员无法对当前正在运行的应用进一步检测,无法深入检测系统故障。另外,网管软件对待检测设备进行故障检测的前提是网络通信正常,一旦待检测设备出现重大故障,将导致系统不可用,此时这种定位方式失效。
[0004]第二种方式:采用内部故障定位检测的方式。在待检测设备内部增加故障检测模块,内部程序运行时生成相应的日志文件,故障检测模块收集日志文件并按周期定量发送日志文件给网管设备,由网管人员对日志文件进行分析确定故障。由于受故障检测模块本身性能的局限,故障检测模块收集的日志信息不完整,网管人员对日志信息分析也会出现漏检的情况,同样使得故障定位的可靠性和准确性差。


【发明内容】

[0005]本发明实施例提供一种网络设备故障定位系统、方法及装置,用以解决现有技术中存在的网络设备故障定位可靠性和准确性差的问题。
[0006]本发明实施例提供一种网络设备故障定位系统,包括:检测模块、通讯模块、信息收集模块和信息判断模块,其中:
[0007]所述检测模块,用于监听与自身建立连接的待检测设备的故障发生信息,所述故障发生信息为表征所述待检测设备是否发生故障的信息;当监听到所述待检测设备发生故障时,向所述信息收集模块发送触发指令,指示所述信息收集模块工作;
[0008]所述通讯模块,用于转发所述检测模块向所述信息收集模块发送的触发指令;
[0009]所述信息收集模块,用于当接收到所述检测模块的触发指令后,通过与多个网络层级的命令收集接口收集所述待检测设备的故障相关信息;将收集到的所述故障相关信息发送给所述信息判断模块;
[0010]所述信息判断模块,用于接收所述信息收集模块发送的所述故障相关信息;将所述故障相关信息与所述故障检测模块中保存的预设的故障定位信息进行比较;根据在预设的故障定位信息中,对比得到与所述故障相关信息对应的故障定位信息,确定故障问题。
[0011]通过本发明实施例提供的上述系统,由于通过与多个网络层级的命令收集接口收集待检测设备的故障相关信息,实现了自动化收集故障相关信息,并且实现了多个网络层级信息的一键收集,收集的信息更加完整,无需人工参与故障相关信息的收集,避免了信息的漏检和故障定位的误判,从而提高了网络设备定位的可靠性和准确性。
[0012]进一步的,所述信息判断模块,具体用于在将所述故障相关信息与所述故障检测模块中保存的预设的故障定位信息进行比较之前,对所述故障相关信息进行预过滤处理。
[0013]进一步的,所述信息判断模块,具体用于在确定故障问题后,根据预先设置的故障等级,确定对所述故障问题是否进行处理;将确定的处理结果发送给所述检测模块进行相应的处理。
[0014]进一步的,所述待检测设备为无线Linux嵌入式系统。
[0015]进一步的,所述多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
[0016]本发明实施例还提供了一种网络设备故障定位方法,包括:
[0017]监听与自身建立连接的待检测设备的故障发生信息,所述故障发生信息为表征所述待检测设备是否发生故障的信息;
[0018]当监听到所述待检测设备发生故障时,通过与多个网络层级的命令收集接口收集所述待检测设备的故障相关信息;
[0019]将所述故障相关信息与预设的故障定位信息进行比较;
[0020]根据在预设的故障定位信息中,对比得到与所述故障相关信息对应的故障定位信息,确定故障问题。
[0021]通过本发明实施例提供的上述方法,由于通过与多个网络层级的命令收集接口收集待检测设备的故障相关信息,实现了自动化收集故障相关信息,并且实现了多个网络层级信息的一键收集,收集的信息更加完整,无需人工参与故障相关信息的收集,避免了信息的漏检和故障定位的误判,从而提高了网络设备定位的可靠性和准确性。
[0022]进一步的,上述方法,还包括:
[0023]在将所述故障相关信息与预设的故障定位信息进行比较之前,对所述故障相关信息进行预过滤处理。
[0024]进一步的,所述多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
[0025]本发明实施例还提供了一种网络设备故障定位装置,包括:
[0026]监听单元,用于监听与自身建立连接的待检测设备的故障发生信息,所述故障发生信息为表征所述待检测设备是否发生故障的信息;
[0027]收集单元,用于当监听到所述待检测设备发生故障时,通过与多个网络层级的命令收集接口收集所述待检测设备的故障相关信息;
[0028]比较单元,用于将所述故障相关信息与预设的故障定位信息进行比较;
[0029]确定单元,用于根据在预设的故障定位信息中,对比得到与所述故障相关信息对应的故障定位信息,确定故障问题。
[0030]通过本发明实施例提供的上述装置,由于通过与多个网络层级的命令收集接口收集待检测设备的故障相关信息,实现了自动化收集故障相关信息,并且实现了多个网络层级信息的一键收集,收集的信息更加完整,无需人工参与故障相关信息的收集,避免了信息的漏检和故障定位的误判,从而提高了网络设备定位的可靠性和准确性。
[0031 ] 进一步的,上述装置,还包括:
[0032]过滤单元,用于在将所述故障相关信息与预设的故障定位信息进行比较之前,对所述故障相关信息进行预过滤处理。
[0033]进一步的,所述多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
[0034]本申请的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。

【专利附图】

【附图说明】
[0035]附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
[0036]图1为本发明实施例提供的网络设备故障定位系统的结构示意图;
[0037]图2为本发明实施例1提供的网络设备故障定位方法的流程图;
[0038]图3为本发明实施例2提供的网络设备故障定位装置的结构示意图。

【具体实施方式】
[0039]为了给出提高网络设备定位的可靠性和准确性的实现方案,本发明实施例提供了一种网络设备故障定位系统、方法及装置,以下结合说明书附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。并且在不冲突的情况下,本申请中的实施例及实施例中的特征可以相互组合。
[0040]本发明实施例提供一种网络设备故障定位系统,如图1所示,包括:检测模块101、通讯模块102、信息收集模块103和信息判断模块104,其中:
[0041]检测模块101,用于监听与自身建立连接的待检测设备的故障发生信息,所述故障发生信息为表征所述待检测设备是否发生故障的信息;当监听到所述待检测设备发生故障时,向所述信息收集模块发送触发指令,指示所述信息收集模块工作;
[0042]通讯模块102,用于转发所述检测模块向所述信息收集模块发送的触发指令;
[0043]信息收集模块103,用于当接收到所述检测模块的触发指令后,通过与多个网络层级的命令收集接口收集所述待检测设备的故障相关信息;将收集到的所述故障相关信息发送给所述信息判断模块;
[0044]信息判断模块104,用于接收所述信息收集模块发送的所述故障相关信息;将所述故障相关信息与所述故障检测模块中保存的预设的故障定位信息进行比较;根据在预设的故障定位信息中,对比得到与所述故障相关信息对应的故障定位信息,确定故障问题。
[0045]本发明实施例中,在网络设备故障定位系统启动后,自动加载检测I旲块,并完成故障检测所需环境变量的加载,所需环境变量包括=TCLSH环境变量、待检测设备的环境变量、待检测设备的信息监控检查点等变量。检测模块通过与待检测设备各组件内部接口进行消息管道的建立,即与待检测设备建立连接。在建立连接后,具体监听待检测设备中各组件的进程以及系统变量等情况。由于检测模块同时监听待检测设备的多个组件,在监听未发现故障时,网络设备故障定位系统正常运行。如果待检测设备的组件发生故障,该组件通过内部接口向检测模块发送故障发生信息,该故障发生信息表征待检测设备是否发生故障。检测模块在监听到该组件的故障发生信息后,触发信息收集模块收集该组件相关进程以及变量信息,通过组件相关进程以及变量信息的情况能够反映出是否发生故障,这里组件相关进程以及变量信息即故障相关信息。
[0046]进一步的,信息判断模块104,具体用于在将所述故障相关信息与所述故障检测模块中保存的预设的故障定位信息进行比较之前,对所述故障相关信息进行预过滤处理。
[0047]进一步的,信息判断模块104,具体用于在确定故障问题后,根据预先设置的故障等级对应的处理方式,对所述故障问题进行相应的处理。
[0048]本发明实施例中,由于有一些故障等级较低的问题不需要进行处理,是在允许范围之内的,因此预先设置故障等级,可以将允许范围内的故障对应设置故障等级较低。
[0049]进一步的,所述待检测设备为无线Linux嵌入式系统。
[0050]本发明实施例中的网络设备故障定位系统可以应用在无线Linux嵌入式系统,对无线Linux嵌入式系统中的各系统层级组件进行故障定位,由于网络设备故障定位系统实现在嵌入式Linux上,是Linux独立运行的进程,独立于待检测的系统,因此即使待检测系统出现重大故障,网络设备故障定位系统仍可以独立运行。
[0051]进一步的,所述多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
[0052]由于通过从协议层到底层至上而下的故障相关信息收集,从而全面的收集故障出现情况下的完整的信息,使得故障定位更加准确。
[0053]通过本发明实施例提供的上述系统,由于通过与多个网络层级的命令收集接口收集待检测设备的故障相关信息,实现了自动化收集故障相关信息,并且实现了多个网络层级信息的一键收集,收集的信息更加完整,无需人工参与故障相关信息的收集,避免了信息的漏检和故障定位的误判,从而提高了网络设备定位的可靠性和准确性。
[0054]下面结合附图,用具体实施例对本发明提供的方法及装置进行详细描述。
[0055]实施例1:
[0056]基于同一发明构思,根据本发明上述实施例提供的网络设备故障定位系统,相应地,本发明实施例1还提供了一种网络设备故障定位方法,结合该系统中的各个模块,以该方法应用于无线Linux嵌入式系统为例,本发明实施例1提供的该方法的流程图如图2所示,具体包括:
[0057]步骤201、检测模块监听与自身建立连接的待检测设备的故障发生信息。
[0058]本步骤中,在启动系统进行定位后自动加载检测模块,并加载故障检测所需环境变量,所需环境变量包括=TCLSH环境变量、待检测设备的环境变量、待检测设备的信息监控检查点等变量。检测模块通过与待检测设备各组件内部接口进行消息管道的建立,即与待检测设备通过通讯模块建立连接。
[0059]其中,该故障发生信息表征该待检测设备是否发生故障。即该故障发生信息只是用于告知检测模块该待检测设备发生故障了,但具体什么故障还是未知的。
[0060]具体的,以无线Linux嵌入式系统中的控制的无线接入点和配置协议(CAPWAP,Control And Provis1ning of Wireless Access Points Protocol Specificat1n)组件隧道异常中断为例。当CAPWAP组件的隧道异常中断时,CAPffAP组件通过内部的接口将中断的消息打包后发送给检测模块,该终端的消息即为故障发生信息。
[0061]步骤202、当检测模块监听到该待检测设备发生故障时,向信息收集模块发送触发指令。
[0062]具体的,当检测模块监听到CAPWAP组件发送的故障发生消息后,向信息收集模块发送触发指令,触发信息收集模块生效,可以在触发指令中携带CAPWAP组件发生故障的信息,指示信息收集模块收集故障相关信息。检测模块向信息收集模块发送的触发指令是由通讯模块转发的。其中,该故障相关信息是与该CAPWAP组件相关的进程以及变量的信息,这些信息能够反映该CAPWAP组件发生故障的情况。
[0063]步骤203、信息收集模块根据该触发指令,通过与多个网络层级的命令收集接口收集待检测设备的故障相关信息。
[0064]其中,多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
[0065]具体的,信息收集模块收集CAPWAP组件相关的进程以及变量的信息,信息收集模块也可以对CAPWAP组件相关联的组件的相关进程和变量进行信息收集。信息收集模块通过检查组件配置信息、查看DHCP表项、查看CAPWAP隧道状态、查看以太网接口状态、查看底层CAPWAP驱动信息以及查看底层报文收发情况,按照网络各层协议至上而下的顺序进行故障相关信息的收集。
[0066]由于通过从协议层到底层至上而下的故障相关信息收集,从而全面的收集故障出现情况下的完整的信息,能够使得故障定位更加准确。
[0067]步骤204、信息收集模块将收集到的故障相关信息发生给信息判断模块。
[0068]步骤205、该信息判断模块对接收到的故障相关信息进行预过滤处理。
[0069]本步骤中,信息判断模块对故障相关信息进行预过滤处理,可以先过滤一些无用的相关信息。
[0070]步骤206、该信息判断模块将过滤后的故障相关信息与预设的故障定位信息进行比较。
[0071]本步骤中,预设的故障定位信息可以根据实际经验进行设置,具体的,可以设置不同的故障定位信息对应不同类型的故障问题,或者对应不同组件的故障问题。
[0072]步骤207、该信息判断模块根据在预设的故障定位信息中,对比得到与故障相关信息对应的故障定位信息,确定故障问题。
[0073]进一步的,该信息判断模块在确定故障问题后,确定该故障问题对应的故障等级,并根据预先设置的故障等级对应的处理方式,对该故障问题进行相应的处理。由于有一些故障等级较低的问题不需要进行处理,是在允许范围之内的,因此预先设置故障等级,可以将允许范围内的故障对应设置故障等级较低。
[0074]本发明实施例中的检测模块、信息收集模块和信息判断模块可以工作在TCL脚本运行环境中,但不局限于TCL脚本语言,还可以使用其他如Python、Perl等脚本语言来实现。
[0075]通过本发明实施例提供的上述方法,由于通过与多个网络层级的命令收集接口收集待检测设备的故障相关信息,实现了自动化收集故障相关信息,并且实现了多个网络层级信息的一键收集,收集的信息更加完整,无需人工参与故障相关信息的收集,避免了信息的漏检和故障定位的误判,从而提高了网络设备定位的可靠性和准确性。
[0076]实施例2:
[0077]基于同一发明构思,根据本发明上述实施例提供的网络设备故障定位方法,相应地,本发明实施例2还提供了一种网络设备故障定位装置,其结构示意图如图3所示,具体包括:
[0078]监听单元301,用于监听与自身建立连接的待检测设备的故障发生信息,所述故障发生信息为表征所述待检测设备是否发生故障的信息;
[0079]收集单元302,用于当监听到所述待检测设备发生故障时,通过与多个网络层级的命令收集接口收集所述待检测设备的故障相关信息;
[0080]比较单元303,用于将所述故障相关信息与预设的故障定位信息进行比较;
[0081]确定单元304,用于根据在预设的故障定位信息中,对比得到与所述故障相关信息对应的故障定位信息,确定故障问题。
[0082]进一步的,过滤单元305,用于在将所述故障相关信息与预设的故障定位信息进行比较之前,对所述故障相关信息进行预过滤处理。
[0083]进一步的,所述多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
[0084]上述各单元的功能可对应于图2所示流程中的相应处理步骤,在此不再赘述。
[0085]综上,本发明实施例提供的方案,包括:检测模块、通讯模块、信息收集模块和信息判断模块,其中:检测模块,用于监听与自身建立连接的待检测设备的故障发生信息,故障发生信息为表征待检测设备是否发生故障的信息;当监听到待检测设备发生故障时,向信息收集模块发送触发指令;通讯模块,用于转发检测模块向信息收集模块发送的触发指令;信息收集模块,用于当接收到检测模块的触发指令后,通过与多个网络层级的命令收集接口收集待检测设备的故障相关信息;将收集到的故障相关信息发送给信息判断模块;信息判断模块,用于接收信息收集模块发送的故障相关信息;将故障相关信息与故障检测模块中保存的预设的故障定位信息进行比较;根据在预设的故障定位信息中,对比得到与故障相关信息对应的故障定位信息,确定故障问题。采用本发明实施例提供的方案,提高了网络设备定位的可靠性和准确性。
[0086]本申请的实施例所提供的网络设备故障定位装置可通过计算机程序实现。本领域技术人员应该能够理解,上述的模块划分方式仅是众多模块划分方式中的一种,如果划分为其他模块或不划分模块,只要网络设备故障定位装置具有上述功能,都应该在本申请的保护范围之内。
[0087]本申请是参照根据本申请实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0088]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0089]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0090]显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
【权利要求】
1.一种网络设备故障定位系统,其特征在于,包括:检测模块、通讯模块、信息收集模块和信息判断模块,其中: 所述检测模块,用于监听与自身建立连接的待检测设备的故障发生信息,所述故障发生信息为表征所述待检测设备是否发生故障的信息;当监听到所述待检测设备发生故障时,向所述信息收集模块发送触发指令,指示所述信息收集模块工作; 所述通讯模块,用于转发所述检测模块向所述信息收集模块发送的触发指令; 所述信息收集模块,用于当接收到所述检测模块的触发指令后,通过与多个网络层级的命令收集接口收集所述待检测设备的故障相关信息;将收集到的所述故障相关信息发送给所述信息判断模块; 所述信息判断模块,用于接收所述信息收集模块发送的所述故障相关信息;将所述故障相关信息与所述故障检测模块中保存的预设的故障定位信息进行比较;根据在预设的故障定位信息中,对比得到与所述故障相关信息对应的故障定位信息,确定故障问题。
2.如权利要求1所述的系统,其特征在于,所述信息判断模块,具体用于在将所述故障相关信息与所述故障检测模块中保存的预设的故障定位信息进行比较之前,对所述故障相关信息进行预过滤处理。
3.如权利要求1所述的系统,其特征在于,所述信息判断模块,具体用于在确定故障问题后,根据预先设置的故障等级,确定对所述故障问题是否进行处理;将确定的处理结果发送给所述检测模块进行相应的处理。
4.如权利要求1所述的系统,其特征在于,所述待检测设备为无线Linux嵌入式系统。
5.如权利要求1-5任一所述的系统,其特征在于,所述多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
6.一种网络设备故障定位方法,其特征在于,包括: 监听与自身建立连接的待检测设备的故障发生信息,所述故障发生信息为表征所述待检测设备是否发生故障的信息; 当监听到所述待检测设备发生故障时,通过与多个网络层级的命令收集接口收集所述待检测设备的故障相关信息; 将所述故障相关信息与预设的故障定位信息进行比较; 根据在预设的故障定位信息中,对比得到与所述故障相关信息对应的故障定位信息,确定故障问题。
7.如权利要求6所述的方法,其特征在于,在将所述故障相关信息与预设的故障定位信息进行比较之前,还包括: 对所述故障相关信息进行预过滤处理。
8.如权利要求6或7所述的方法,其特征在于,所述多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
9.一种网络设备故障定位装置,其特征在于,包括: 监听单元,用于监听与自身建立连接的待检测设备的故障发生信息,所述故障发生信息为表征所述待检测设备是否发生故障的信息; 收集单元,用于当监听到所述待检测设备发生故障时,通过与多个网络层级的命令收集接口收集所述待检测设备的故障相关信息; 比较单元,用于将所述故障相关信息与预设的故障定位信息进行比较; 确定单元,用于根据在预设的故障定位信息中,对比得到与所述故障相关信息对应的故障定位信息,确定故障问题。
10.如权利要求9所述的装置,其特征在于,还包括: 过滤单元,用于在将所述故障相关信息与预设的故障定位信息进行比较之前,对所述故障相关信息进行预过滤处理。
11.如权利要求9或10所述的装置,其特征在于,所述多个网络层级的命令收集接口包括底层命令收集接口、协议层命令收集接口和系统层命令收集接口。
【文档编号】H04L12/24GK104378246SQ201410748274
【公开日】2015年2月25日 申请日期:2014年12月9日 优先权日:2014年12月9日
【发明者】贺宏达 申请人:福建星网锐捷网络有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1