一种网管系统监管平台及监管方法

文档序号:10515266阅读:322来源:国知局
一种网管系统监管平台及监管方法
【专利摘要】本发明公开了一种网管系统监管平台及监管方法,属于网管系统监管领域,解决的问题是如何有效监管网管系统并快速修复障碍;其结构包括网管系统、资源模块、预警分析模块、关联分析模块、消息分发平台、元数据管理模块和电子运维系统;其监管步骤为:通过预警分析模块进行预警基线策略分析;通过关联分析模块进行网管系统动态关联分析;通过消息发送平台进行指令策略管理,制定性能指标监管策略;实现对网管系统数据质量的监管;生成预警信息,并通过电子运维系统发出告警;在告警后,并自动触发修复指令进行主动修复;在电子运维系统中通过大屏幕拓扑结合告警方式对网管系统进行多维展现。
【专利说明】
一种网管系统监管平台及监管方法
技术领域
[0001]本发明涉及网管系统监管领域,具体地说是一种网管系统监管平台及监管方法。
【背景技术】
[0002]随着运营商监控集中化、流程自动化、手段智能化及指挥调度中心等管理手段的提升,尤其是3G全业务运营时代的到来,各网管平台的生产维护越来越重要,但目前还没有专门的自动化手段对支撑网管系统平台的服务质量进行有效地监管,尤其是对后台存在的问题没有直观的手段能够快速发现并处理。
[0003]运营商自身传统的运行状态监控方式仅仅实现了系统软件、硬件运行状况的监控,缺乏对系统所支撑业务应用影响程度的分析,也没有建立起软硬件以及软件系统间的相互关联关系,对于系统故障所涉及的范围只能通过应用层面的影响后知后觉,也没有直观、快捷的界面提供全局各系统运行状态的拓扑展现,不利于维护人员快速判断定位故障原因,在生产维护中的价值很有限,也不能够满足在日益发展的网络维护工作中对于“全程全网监控指挥调度管理”的工作要求。
[0004]如何实现对网管系统中服务质量中各运行指标的有效监管,实现对数据质量、系统自身及系统间运行状况进行有效监管,并对网管系统故障的提前预警、快速修复,是需要解决的技术问题。

【发明内容】

[0005]本发明的技术任务是提供一种网管系统监管平台及监管方法,来解决如何有效监管网管系统并快速修复障碍的问题。
[0006]本发明的技术任务是按以下方式实现的:
一种网管系统监管平台,包括网管系统,还包括资源模块、预警分析模块、关联分析模块、消息分发平台、元数据管理模块和电子运维系统,资源模块分别与关联分析模块和预警分析模块连接,关联分析模块和预警分析模块均与派单接口模块连接,派单接口模块分别与电子运维系统和消息分发平台连接,消息分发平台分别与关联分析模块和预警分析模块连接,预警分析模块与元数据管理模块连接,元数据管理模块上连接有若干个网管系统;
资源模块,用于存储采集到的网管系统的性能指标数据;
预警分析模块,用于对网管系统的性能指标数据进行预警分析;
关联分析模块,用于对网管系统进行动态关联分析,实现网管系统软硬件间的动态关联以及网管系统不同软件间的动态关联;
消息分发平台,用于进行指令策略管理;
元数据管理模块,用于采集网管系统的性能指标数据,并描述数据库内元数据的结构和建立方法;
电子运维系统,用于通过大屏幕拓扑结合告警对网管系统进行多维展现。
[0007]网管系统的性能指标数据包括性能配置省部接口、设备、关键服务进程、应用服务负荷以及存储的性能指标数据。
[0008]电子运维系统具有包括系统主视图、系统架构视图、系统模块视图、位图和仪表的多维度大屏幕拓扑展现方式。
[0009]电子运维系统具有颜色标注和状态灯闪亮的告警方式。
[0010]—种网管系统监管方法,应用上述的网管系统监管平台对网管系统监管,步骤为: 元数据管理模块采集网管系统的性能指标数据,并将性能指标数据存储在资源模块内,性能指标数据包括性能配置省部接口、设备、关键服务进程、应用服务负荷以及存储的性能指标数据;
通过预警分析模块进行预警基线策略分析,制定用于对网管系统的性能指标数据进行监管的预警基线及容忍线;
通过关联分析模块进行网管系统动态关联分析,对网管系统软硬件平台的关联性进行梳理,制定网管系统软硬件间关联及网管系统不同软件间关联的判断规则,实现网管系统软硬件间的动态关联以及网管系统不同软件间的动态关联;
通过消息发送平台进行指令策略管理,制定性能指标监管策略;
通过元数据管理模块中的数据描述进行数据质量追踪,得出有问题数据的来源以及有问题数据的产生原因,并为数据质量识别提供数据支持,实现对网管系统数据质量的监管;根据性能指标监管策略,将网管系统的性能指标数据与预警基线和容忍线进行比较,生成预警信息,并通过电子运维系统发出告警;
在告警后,根据网管系统软硬件间的关联、网管系统不同软件间的关联对故障进行定位,并自动触发修复指令进行主动修复;
在电子运维系统中通过大屏幕拓扑结合告警方式对网管系统进行多维展现。
[0011]预警基线的制定方法为:依据普通模式和特殊模式两种方式在历史数据的样本空间中进行选取,保留反映变化规律的典型数据,排除异常数据,通过策略算法生成预警基线。
[0012]预警基线包括在预警动态基线和预警静态基线,预警动态基线用于对在不同时间变化差异较大的性能指标数据进行预测分析,预警静态基线用于对不随时间变化的性能指标数据进行预测分析。
[0013]大屏幕拓扑展现方法为:从系统主视图拓扑展现、系统架构视图拓扑展现和系统模块视图展现进行多维度展现,并将接入相关性能指标数据以位图和仪表的方式进行集中动态的展现。
[0014]告警方式为:网管系统的性能指标数据在预警基线和容忍线之间或高于容忍线时,在拓扑主机上通过状态灯闪亮的方式进行告警;网管系统中出现网络中断或进程问题时,通过不同颜色标注的方式进行告警。
[0015]本发明的一种网管系统监管平台及监管方法具有以下优点:
1、本发明提供性能指标策略和预警基线策略分析,对网管系统自身、网管系统间运行状况、网管系统基础硬件及数据库进行有效预警监管;
2、本发明提供数据质量监管,通过元数据管理中的数据描述,对上层指标进行从上至下的追溯,从而可以分析出有问题的数据来源及产生原因,并对数据质量识别提供必要的数据支持,通过数据分析,对数据的准确性、完整性、一致性、合理性和及时性进行核查; 3、本发明进行关联分型,实现了网管系统软硬件间的动态关联及网管系统不同软件间的动态关联的有限监管;
4、本发明在发出告警后,可依据设置在系统中的策略,对系统端口故障、进程故障等问题,自动触发修复指令进行主动修复,将系统隐患提前捕捉并修复解决,从而降低故障对生产维护所带来的影响;
5、本发明通过通过大屏幕拓扑结合告警方式进行多维展现,实现了对网管系统多维度动态、透明化的监管,使得监控维护人员能够直观快速的判断故障原因,并进行有效处理以减低对自动派单灯重要服务的影响。
【附图说明】
[0016]下面结合附图对本发明进一步说明。
[0017]附图1为一种网管系统监管平台的结构示意图;
附图2为一种网管系统监管方法的工作原理图。
【具体实施方式】
[0018]参照说明书附图和具体实施例对本发明的一种网管系统监管平台及监管方法作以下详细地说明。
[0019]实施例1:
一种网管系统监管平台,包括网管系统,还包括资源模块、预警分析模块、关联分析模块、消息分发平台、元数据管理模块和电子运维系统,资源模块分别与关联分析模块和预警分析模块连接,关联分析模块和预警分析模块均与派单接口模块连接,派单接口模块分别与电子运维系统和消息分发平台连接,消息分发平台分别与关联分析模块和预警分析模块连接,预警分析模块与元数据管理模块连接,元数据管理模块上连接有九个网管系统。
[0020]资源模块,用于存储采集到的网管系统的性能指标数据,该性能指标数据包括性能配置省部接口、设备、关键服务进程、应用服务负荷以及存储的性能指标数据,可用于反映网管系统自身及网管系统间运行状态。
[0021]预警分析模块,用于对网管系统的性能指标数据进行预警分析,预警分析模块内设置有预警基线和容忍线,通过将网管系统中性能指标数据与预警线和容忍线进行比较得出预警结果,该预警结果通过派单接口模块发送到电子运维系统,通过电子运维系统进行故障告警。
[0022]关联分析模块,用于对网管系统软硬件关联进行分析,并制定网管系统软硬件间关联以及网管系统不同软件间关联的判断规则,实现网管系统软硬间的动态关联以及网管系统不同软件间的动态关联,从而在告警发生后能够自动进行故障定位,在电子运维系统中从主视图自动切换到故障点,可更直观的展现出网管系统软硬件之间的影响关系以及网管系统不同软件之间的影响关系。
[0023]消息分发平台,用于进行指令策略管理,制定性能指标监管策略,性能指标监管策略用于对网管系统运行状态及服务质量的性能指标的监管。
[0024]元数据管理模块,用于描述数据库内元数据的结构和建立方法。采集网管系统的软硬件状态信息,并描述数据库中关于上述软硬件状态信息的元数据的结构和建立方法,便于进行数据质量追踪及数据质量分析。
[0025]电子运维系统,用于通过大屏幕拓扑结合告警方式对网管系统进行多维展现,其中维度包括系统主视图即一级维度、系统架构视图即二级维度、系统模块视图即三级维度,并将接入相关性能指标数据以位图、仪表等直观方式进行集中、动态的展现。对预警分析中在预警基线及容忍线区间或在容忍线以外的状态在拓扑主机上通过不同状态灯闪亮你,网络中断、进程问题等则通过不同颜色进行标注,使得监控维护人员能够直观快速的判断故障原因,并进行有效处理以减低对自动派单等重要服务的影响。
[0026]实施例2
本发明的一种网管系统监管方法,应用实施例1所述的一种网管系统监管平台对网管系统监管,步骤为:
元数据管理模块采集网管系统的性能指标数据,并将性能指标数据存储在资源模块内,性能指标数据包括性能配置省部接口、设备、关键服务进程、应用服务负荷以及存储的性能指标数据;
通过预警分析模块进行预警基线策略分析,制定用于对网管系统的性能指标数据进行监管的预警基线及容忍线;
通过关联分析模块进行网管系统动态关联分析,对网管系统软硬件平台的关联性进行梳理,制定网管系统软硬件间关联及网管系统不同软件间关联的判断规则,实现网管系统软硬件间的动态关联以及网管系统不同软件间的动态关联;
通过消息发送平台进行指令策略管理,制定性能指标监管策略;
通过元数据管理模块中的数据描述进行数据质量追踪,得出有问题数据的来源以及有问题数据的产生原因,并为数据质量识别提供数据支持,实现对网管系统数据质量的监管;根据性能指标监管策略,将网管系统的性能指标数据与预警基线和容忍线进行比较,生成预警信息,并通过电子运维系统发出告警;
在告警后,根据网管系统软硬件间的关联、网管系统不同软件间的关联对故障进行定位,并自动触发修复指令进行主动修复;
在电子运维系统中通过大屏幕拓扑结合告警方式对网管系统进行多维展现。
[0027]通过上述步骤,本发明对网管系统进行预警基线策略分析、元数据质量分析、服务质量分析、网管系统动态关联影响分析,并通过上述分析实现了对网管系统运行状态及服务质量的监管、实现了对网管系统数据质量及数据流向的监管,实现了对网管系统故障智能化主动修复,实现了对网管系统集中、动态、多维展现,下面分别对上述网管系统的监管及修复功能进行进一步说明。
[0028](I)、对网管系统运行状态及服务质量的监管
在进行预警分析时,将采集到的性能指标数据与预先设定的容忍线进行比较后,将数值在预警基线与容忍线范围区间的指标、以及超出容忍线的性能指标数据生成预警信息。预警基线的制定方法为:依据普通模式和特殊模式在历史数据的样本空间中进行选取,保留反映变化规律的典型数据,排除异常数据,通过策略算法生成预警基线,该预警基线包括预警动态基线和预警静态基线,预警静态基线用于对不随时间变化的性能指标数据进行预测分析,预警动态基线用于对在不同时间(包括重大节假日和重大事件)变化差异较大的性能指标数据进行预测分析。
[0029]在进行服务质量分析时,针对网管系统各项指标健康状态,制定了性能指标监管策略,对网管系统状态及数据的实时性、完整性、准确性、合理性等多角度进行分析,使监控维护人员能够直观快速的了解网管系统运行状态,及时发现网管系统隐患,有效降低故障历时,大幅提升了网管系统对生产应用的服务保障能力;
预警基线策略分析结合性能指标策略,对在未来一段时间内的性能指标数据的可能范围进行预测,降低系统容量不足的风险,从而实现对网管系统及网管系统间运行状态如性能配置省部接口、设备、关键服务进程、应用服务负荷、存储等相关指标进行有效的预警监管。
[0030](2)、对数据质量及数据流向的监管
元数据管理模块中的元数据是网管系统数据基础,直接影响整个网管系统的数据质量、服务质量,通过制定科学完善的元数据评估方案,实现从数据源起开始进行数据质量的分析,进而有效保障对数据质量异常情况的准确判断。
[0031]通过从数据源其开始进行数据质量分析,保障了数据源异常情况的预警快速法相,通过元数据管理模块中对数据的描述进行数据质量追踪,对上层指标进行从上至下的追溯,从而可以分析出有问题的数据来源及产生原因,并对数据质量识别提供必要的数据支持,通过以上数据质量分析,对数据的准确性、完整性、一致性、合理性和及时性进行核查。
[0032](3)、对网管系统故障的智能化主动修复
网管系统动态关联分析,即在关联分析模块对网管系统软硬件间的关联关系进行梳理,并制定网管系统软硬件间关联及网管系统不同软件间关联的影响判断规则,实现网管系统软硬件间的动态关联以及网管系统不同软件间的动态关联。这样在告警发生后能够自动进行故障定位,在电子运维系统中从主视图自动切换到故障点,可以更直观的展现出相互间的影响关系,并依据预置的性能指标管理策略对系统端口故障、进程故障等问题自动触发修复指令进行主动修复,将系统隐患提前捕捉并修复解决,从而降低故障对生产维护所带来的影响。
[0033](4)、对网管系统集中、动态、多维的展现
本发明实现了对网管系统集中、动态、多维展现:通过大屏幕拓扑结合告警方式进行多维展现,其中维度包括系统主视图即一级维度、系统架构视图即二级维度、系统模块视图即三级维度等,并将接入相关性能指标数据以位图、仪表等直观方式进行集中、动态的展现。在预警分析中,在预警基线及容忍线区间或容忍线以外的状态在拓扑主机上通过不同状态灯闪亮来进行告警,网络中断、进程问题等则通过不同颜色进行标注,使得监控维护人员能够直观快速的判断故障原因,并进行有效处理以减低对自动派单等重要服务的影响。
[0034]通过上面【具体实施方式】,所述技术领域的技术人员可容易的实现本发明。但是应当理解,本发明并不限于上述的【具体实施方式】。在公开的实施方式的基础上,所述技术领域的技术人员可任意组合不同的技术特征,从而实现不同的技术方案。
【主权项】
1.一种网管系统监管平台,包括网管系统,其特征在于还包括资源模块、预警分析模块、关联分析模块、消息分发平台、元数据管理模块和电子运维系统,资源模块分别与关联分析模块和预警分析模块连接,关联分析模块和预警分析模块均与派单接口模块连接,派单接口模块分别与电子运维系统和消息分发平台连接,消息分发平台分别与关联分析模块和预警分析模块连接,预警分析模块与元数据管理模块连接,元数据管理模块上连接有若干个网管系统; 资源模块,用于存储采集到的网管系统的性能指标数据; 预警分析模块,用于对网管系统的性能指标数据进行预警分析; 关联分析模块,用于对网管系统进行动态关联分析,实现网管系统软硬件间的动态关联以及网管系统不同软件间的动态关联; 消息分发平台,用于进行指令策略管理; 元数据管理模块,用于采集网管系统的性能指标数据,并描述数据库内元数据的结构和建立方法; 电子运维系统,用于通过大屏幕拓扑结合告警对网管系统进行多维展现。2.根据权利要求1所述的一种网管系统监管平台,其特征在于网管系统的性能指标数据包括性能配置省部接口、设备、关键服务进程、应用服务负荷以及存储的性能指标数据。3.根据权利要求1所述的一种网管系统监管平台,其特征在于电子运维系统具有包括系统主视图、系统架构视图、系统模块视图、位图和仪表的多维度大屏幕拓扑展现方式。4.根据权利要求1所述的一种网管系统监管平台,其特征在于电子运维系统具有颜色标注和状态灯闪亮的告警方式。5.—种网管系统监管方法,其特征在于应用如权利要求1-5中任一项所述的网管系统监管平台对网管系统监管,步骤为: 元数据管理模块采集网管系统的性能指标数据,并将性能指标数据存储在资源模块内,性能指标数据包括性能配置省部接口、设备、关键服务进程、应用服务负荷以及存储的性能指标数据; 通过预警分析模块进行预警基线策略分析,制定用于对网管系统的性能指标数据进行监管的预警基线及容忍线; 通过关联分析模块进行网管系统动态关联分析,对网管系统软硬件的关联性进行梳理,制定网管系统软硬件间关联及网管系统不同软件间关联的判断规则,实现网管系统软硬件间的动态关联以及网管系统不同软件间的动态关联; 通过消息发送平台进行指令策略管理,制定性能指标监管策略; 通过元数据管理模块中的数据描述进行数据质量追踪,得出有问题数据的来源以及有问题数据的产生原因,并为数据质量识别提供数据支持,实现对网管系统数据质量的监管;根据性能指标监管策略,将网管系统的性能指标数据与预警基线和容忍线进行比较,生成预警信息,并通过电子运维系统发出告警; 在告警后,根据网管系统软硬件间的关联、网管系统不同软件间的关联对故障进行定位,并自动触发修复指令进行主动修复; 在电子运维系统中通过大屏幕拓扑结合告警方式对网管系统进行多维展现。6.根据权利要求5所述的一种网管系统监管方法,其特征在于预警基线的制定方法为:依据普通模式和特殊模式两种方式在历史数据的样本空间中进行选取,保留反映变化规律的典型数据,排除异常数据,通过策略算法生成预警基线。7.根据权利要求5所述的一种网管系统监管方法,其特征在于预警基线包括在预警动态基线和预警静态基线,预警动态基线用于对在不同时间变化差异较大的性能指标数据进行预测分析,预警静态基线用于对不随时间变化的性能指标数据进行预测分析。8.根据权利要求5所述的一种网管系统监管方法,其特征在于大屏幕拓扑展现方法为:从系统主视图拓扑展现、系统架构视图拓扑展现和系统模块视图展现进行多维度展现,并将接入相关性能指标数据以位图和仪表的方式进行集中动态的展现。9.根据权利要求5所述的一种网管系统监管方法,其特征在于告警方式为:网管系统的性能指标数据在预警基线和容忍线之间或高于容忍线时,在拓扑主机上通过状态灯闪亮的方式进行告警;网管系统中出现网络中断或进程问题时,通过不同颜色标注的方式进行告塾目ο
【文档编号】H04L12/24GK105871611SQ201610196394
【公开日】2016年8月17日
【申请日】2016年3月31日
【发明人】袁明明
【申请人】浪潮通信信息系统有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1