一种基于改进的最近邻算法的电网告警分析方法
【技术领域】
[0001] 本发明涉及电网调度自动化安全领域,具体涉及一个基于改进的最近邻算法的电 网告警分析方法。
【背景技术】
[0002] 随着电网规模的不断扩大,电网结构日趋复杂,系统运行方式快速多变,运行管 理面临着更大的挑战。而电网监控信息种类繁多、数据量庞大,通过科学的方法监测电网监 控信息,归类分析发现电网运行规律以快速做出决策则显得十分必要。
[0003] 监控业务是在"三集五大"调整之后并入调控中心业务中的,之前各地区关于监控 信号数据的处理与分析还处于探索阶段。对监控数据的处理分析也主要基于对收集上来的 信息进行汇总统计,缺乏全面、系统的分析手段对信息进行归类整理,降低了工作效率。
【发明内容】
[0004] 本发明针对以上问题,提供了一种能够将数据信息归类和统计,进而分析,便于判 别告警类别,提高判别可靠性,提高工作效率的基于改进的近邻算法的电网告警分析方法。
[0005] 本发明的技术方案为:包括以下步骤:
[0006]S1、通过对电网调度自动化系统的数据进行归类和统计,将得到的告警数据进行 分类,其类别为事故、异常、越限、变位和告知;
[0007]S2、结合历史告警信息,确定各告警指标的权值;采用改进的最近邻算法判别当前 告警属于的类别,进行相应的处理。
[0008] 步骤S2包括以下步骤:
[0009] (1)数据结构设计:设每个地区的告警信息集合抽象为一个元组,表示为^ = (xu,xi2,…,xim),m为样本对象的维数,那么历史告警信息表示为X= {x"x2,…,χη},η为 样本对象的个数;Xl对应电网调度自动化系统收集上来的某一地区已知类别的告警信息; [0010] (2)改进的最近邻算法对告警信息进行分析,步骤如下:
[0011] 步骤1 :构建训练样本集合,将历史告警信息X= {Xi,X2,…,Xn}作为训练样本集;
[0012] 步骤2 :设定K值,K为在训练样本集中选取待测样本"近邻"的个数;
[0013] 步骤3:在训练样本集中选出与待测样本最近的K个样本,样本之间的"近邻"由欧 式距离来度量;假设待测样本为(X &Xu,…,xj,此时待测样本与训练样本Xi之间的 距离为:
[0014]
[0015]其中w2,…,wm分别为相应属性指标对应的权重,权值集合定义为W={wuw2,… ,wm};其中,权值的确定如下:
[0016] 步骤3. 1 :取^,w2,…,Wni的值都为1,对若干个已知分类的样本作为测试集进行测 试,统计它与样本的实际分类值之间差异个数P;
[0017] 步骤3. 2 :依次去除样本中的第j个属性,然后求出样本的估计分类值,统计它与 样本的实际分类值之间差异个数P](j= 1,2,…,m);
[0018] 步骤3.3:计;S
k表示当缺少第j个属性值指标时对分类的影响程度,那 么权值集合W各元素的值为
= 1,2,…,m,特别地,如果Pj= 0或p= 0, 置g.j= 1 ;
[0019] 步骤4:假设根据对历史告警信息不同的处理,分为q类告警,表示为S= {s^S2,…,Sq};对于待测样本Xc,Xi,X2,…,Χκ表示与Xc距离最近的K个样本,设离散 的目标函数为f:x-Sl,其中X表示某个告警样本,Sl表示第i个类别;/OD表示对 f(x。)的估计,计算为
,该函数表示为使得 -
汉值最大时的s,Ses= {Si,s2,…,sq},对于
若S= f(Xl)、 ,
, 〖,那么上式就可以输出待测样本的K个近 邻中对应最多的告警类别s;
[0020] 步骤5:/(Xe)即是待测样本X。对应的类别,并根据类别对X。进行相应处理。
[0021] 步骤S1中的告警数据包括事故跳闸统计、告警信号统计以及量测不平衡统计。
[0022] 本发明通过对事故、异常、越限、变位和告知五类告警信息的收集,并对各告警类 别赋以不同的权值,然后结合历史告警信息,确定各告警指标的权值,并采用改进的最近邻 算法判别当前告警属于的类别,进行相应处理。
[0023] 对电网调度自动化系统的事故跳闸、告警信号以及量测不平衡数据进行归类和统 计,为改进的最近邻算法提供有效的数据支持。
[0024] 本发明从繁杂的监控跳闸、告警以及不平衡性等数据中归纳、抽取关键监测指标 数据,并进行分析、归类、总结,以帮助监控人员总结发现历史规律,辅助决策,从而减轻其 繁重的统计分析工作,有效提高电网监控部门的监测分析能力,进而提高工作效率。
【附图说明】
[0025] 图1是本发明的流程图;
【具体实施方式】
[0026] 本发明如图1所示,包括以下步骤:
[0027]S1、通过对电网调度自动化系统的数据进行归类和统计,将得到的告警数据进行 分类,其类别为事故、异常、越限、变位和告知;
[0028]S2、结合历史告警信息,确定各告警指标的权值;采用改进的最近邻算法判别当前 告警属于的类别,进行相应的处理。
[0029]步骤S2包括以下步骤:
[0030] (1)数据结构设计:设每个地区的告警信息集合抽象为一个元组,表示为^ = (xu,xi2,…,xim),m为样本对象的维数,那么历史告警信息表示为X= {x"x2,…,xn},η为 样本对象的个数。本例中m= 5,分别代表告警类别为事故、异常、越限、变位和告知5个属 性指标;Xl对应电网调度自动化系统收集上来的某一地区已知类别的告警信息,Xi即对应 第i个地区的告警信息;η则为收集告警信息的总数;
[0031] (2)改进的最近邻算法对告警信息进行分析,步骤如下:
[0032] 步骤1 :构建训练样本集合,将历史告警信息X= {χ。Χ2,…,xj作为训练样本集;
[0033] 步骤2 :设定K值,K为在训练样本集中选取待测样本"近邻"的个数。工作中,先 确定一个初始值,然后根据分类的准确度不断调整,最终达到最优;当分类结果的准确度低 于预先设置的阈值时,就增大K的值,直到使分类结果的准确度达到要求。
[0034] 步骤3 :在训练样本集中选出与待测样本最近的K个样本,样本之间的"近邻"由欧 式距离来度量,距离越小则表示与待测样本的距离越近。假设待测样本为(Xd,\2,… ,X?),此时待测样本与训练样本Xi之间的距离为:
[0035]
[0036] 其中w^w;;,···a分别为相应属性指标对应的权重,权值集合定义为W= ,… ,wm};其中,权值的确定如下:
[0037] 步骤3. 1 :取^,w2,…,Wni的值都为1,对若干个已知分类的样本作为测试集进行测 试,统计它与样本的实际分类值之间差