本发明涉及输变电设备检测领域,具体涉及一种多维度实时变电设备数据的阈值自适应设置异常检测方法。
背景技术:
众所周知,设备的运行状态对于电厂生产影响巨大,设备在正常工况运行过程中体现出来的功能特征、表象特征以及电气特征与异常状态下的特征是有差异的。根据设备状态预警,做出检修计划,将节省电厂巨大的人力、物力、财力,具有非常大的经济潜力。
目前,在设备状态预警方面,设备生产厂商根据制造工艺设定各个部件不同预警级别的阈值方法,现有设备异常检测方法采用静态阈值设置的方法,即以现有数据平均值为基准,上下分别以均值的固定百分比(例如150%、300%)作为上下阈值,进行数据异常检测。
上下阈值之间的区域为“正常”区域,上下阈值之外的区域为“异常”区域。静态阈值设置无法反映数据的动态实时特点。阈值上下界设置采用业务专家的主观经验,无法反映数据客观规律。阈值的确定直接影响了对于变电设备的检测精度以及数据处理的效率,然而目前静态阈值的方式已经无法满足日趋复杂的变电设备检测。
技术实现要素:
本发明的目的在于克服现有技术的不足,提供一种多维度实时变电设备数据的阈值自适应设置异常检测方法,解决变电设备状态参数异常检测阈值区间较多依赖变电设备专家离线计算及主观经验,而无法根据设备运行实时状态自适应方式变化的问题,采用了多种归一化方式进行数据处理,并且对采集的实时测点数据首先进行多重的去野值判断,提高了数据的有效性和处理效率。
本发明提供了一种多维度实时变电设备数据的阈值自适应设置异常检测方法,依次包括如下步骤:
步骤1:在变电系统数据库里,找到变电设备的所有历史指标信息,选取一段时间内变电设备在正常运行状态下和非正常运行状态下的历史数据;
步骤2:
A.对选取的变电设备的正常运行状态下的历史数据按照如下公式进行归一化处理:
其中,hn1为h1归一化后的值,hmax1和hmin1分别为变电设备正常运行状态下的历史数据的最大值和最小值,h1为变电设备正常运行状态下的历史数据;
B.对选取的变电设备的非正常运行状态下的历史数据按照如下公式进行归一化处理:
其中,hn2为h2归一化后的值,hmax2和hmin2分别为变电设备非正常运行状态下的历史数据的最大值和最小值,h2为变电设备非正常运行状态下的历史数据;
步骤3:
A:将归一化后的hn1做平均值计算,得到平均值H1,并且设置阈值补偿参数L1,设置正常状态下初始野值滤除阈值的下限值为H1-L1,上限值为H1+L1,;
B:将归一化后的hn2做平均值计算,得到平均值H2,计算ΔH=|H1-H2|,并且设置误差阈值补偿参数L2,设置非正常状态下初始野值滤除误差阈值的下限值为ΔH-L2,上限值为ΔH+L2;
步骤4:
A.将正常状态下初始野值滤除阈值的下限值为H-L,上限值为H+L分别利用如下公式进行还原,得到还原后的初始野值滤除阈值的上、下限值:
B.将非正常状态下初始野值滤除误差阈值的下限值为ΔH-L2,上限值为ΔH+L2分别利用如下公式进行还原,得到还原后的初始野值滤除误差阈值的上、下限值:
步骤5:实时获取变电设备运行状态多维度实时测点数据,判断:
A:比较实时测点数据和初始野值滤除阈值的上、下限值的差值,如果差值没有落入初始野值滤除阈值的上、下限值构成的阈值范围,则剔除此实时测点数据,如果都落入则进入下一步骤;
B:判断实时测点数据是否落入初始野值滤除阈值的上、下限值构成的阈值范围,如果未落入则剔除此实时测点数据,如果落入则进行归一化处理,获得变电设备运行状态的实时多维度归一化数据序列;
步骤6:通过对变电设备运行状态的实时多维度归一化数据序列应用降维操作,产生变电设备运行状态的实时降维数据序列;
步骤7:应用可配置的预测器,对变电设备运行状态的实时降维数据序列进行预测计算,产生变电设备运行状态的预测数据序列;
步骤8:应用变电设备运行状态的实时数据及预测数据进行分值计算,得到变电设备运行状态分值;
步骤9:确定变电设备运行状态阈值区间,包括上阈值界、下阈值界;
步骤10:应用变电设备运行状态阈值区间,判断当前时刻分值是否在阈值区间范围,判断变电设备的状态异常。
其中,步骤5中进行归一化处理,获得变电设备运行状态的实时多维度归一化数据序列具体为:
多维度实时变电设备参数xt定义为t时刻变电设备数据集合,x(i)定义为多维度变电设备数据的第i维,i=1,2,…,n,表示为:
xt=(x(1),x(2),…,x(i),…,x(n))
对多维度实时变电设备参数xt进行正规化,实现归一化运算,
得到t时刻变电设备运行状态的实时多维度归一化数据序列到nt,其中NOR(xt)是正规化运算,||xt||,是xt的模。
其中,步骤6具体为对变电设备运行状态的实时多维度归一化数据序列nt进行降维运算:
yt=PCA(nt)
得到t时刻变电设备运行状态的实时降维数据序列yt,其中PCA(xt)是降维运算,通过对变电设备运行状态的实时多维度归一化数据序列应用降维操作,产生变电设备运行状态的实时降维数据序列。
其中,步骤7具体为:应用变电设备运行状态的实时降维数据序列yt和变电设备运行状态的实时数据及预测数据进行分值计算,
得到变电设备运行状态分值到zt。
其中,步骤9具体为:
[Q1-1.5IQR,Q3+1.5IQR]
其中,Q1-1.5IQR为上阈值;Q3+1.5IQR为下阈值;四分位数间距IQR=Q3-Q1。
其中,步骤10具体为:使用变电设备运行状态分值到zt与变电设备运行状态阈值区间[Q1-1.5IQR,Q3+1.5IQR]进行比较,如果zt在该区间范围,则变电设备状态正常;否则,变电设备状态异常。
本发明的多维度实时变电设备数据的阈值自适应设置异常检测方法,可以实现:
解决变电设备状态参数异常检测阈值区间较多依赖变电设备专家离线计算及主观经验,而无法根据设备运行实时状态自适应方式变化的问题,利用特定顺序和特殊的处理方式,并且采用了多种归一化方式进行数据处理,并且对采集的实时测点数据首先进行多重的去野值判断,提高了数据的有效性和处理效率,提高了运算效率,并且能够实时快速、自动化的检测设备异常情况。
附图说明
图1为野值滤除阈值处理流程图
图2为变电设备参数异常检测方法流程图
具体实施方式
下面详细说明本发明的具体实施,有必要在此指出的是,以下实施只是用于本发明的进一步说明,不能理解为对本发明保护范围的限制,该领域技术熟练人员根据上述本发明内容对本发明做出的一些非本质的改进和调整,仍然属于本发明的保护范围。
本发明提供了一种多维度实时变电设备数据的阈值自适应设置异常检测方法,如图1和2所示,具体包括如下的步骤:
步骤1:在变电系统数据库里,找到变电设备的所有历史指标信息,选取一段时间内变电设备在正常运行状态下和非正常运行状态下的历史数据;
步骤2:
A.对选取的变电设备的正常运行状态下的历史数据按照如下公式进行归一化处理:
其中,hn1为h1归一化后的值,hmax1和hmin1分别为变电设备正常运行状态下的历史数据的最大值和最小值,h1为变电设备正常运行状态下的历史数据;
B.对选取的变电设备的非正常运行状态下的历史数据按照如下公式进行归一化处理:
其中,hn2为h2归一化后的值,hmax2和hmin2分别为变电设备非正常运行状态下的历史数据的最大值和最小值,h2为变电设备非正常运行状态下的历史数据;
步骤3:
A:将归一化后的hn1做平均值计算,得到平均值H1,并且设置阈值补偿参数L1,设置正常状态下初始野值滤除阈值的下限值为H1-L1,上限值为H1+L1,其中L1可以为根据实际需要滤除野值而设置的,也可以根据长时间变电设备的历史数据做出的经验选择,例如可以是0.1,0.2等;
B:将归一化后的hn2做平均值计算,得到平均值H2,计算ΔH=|H1-H2|,并且设置误差阈值补偿参数L2,设置非正常状态下初始野值滤除误差阈值的下限值为ΔH-L2,上限值为ΔH+L2,其中L2可以为根据实际要滤除野值而设置的,也可以根据长时间变电设备的历史数据做出的经验选择,例如可以是0.03,0.05等;
步骤4:
A.将正常状态下初始野值滤除阈值的下限值为H-L,上限值为H+L分别利用如下公式进行还原,得到还原后的初始野值滤除阈值的上、下限值:
B.将非正常状态下初始野值滤除误差阈值的下限值为ΔH-L2,上限值为ΔH+L2分别利用如下公式进行还原,得到还原后的初始野值滤除误差阈值的上、下限值:
步骤5:实时获取变电设备运行状态多维度实时测点数据,判断:
A:比较实时测点数据和初始野值滤除阈值的上、下限值的差值,如果差值没有落入初始野值滤除阈值的上、下限值构成的阈值范围,则剔除此实时测点数据,如果都落入则进入下一步骤;
B:判断实时测点数据是否落入初始野值滤除阈值的上、下限值构成的阈值范围,如果未落入则剔除此实时测点数据,如果落入则进行归一化处理,获得变电设备运行状态的实时多维度归一化数据序列;
进行归一化处理,获得变电设备运行状态的实时多维度归一化数据序列;
其中对测点数据进行归一化运算,具体为;
多维度实时变电设备参数xt定义为t时刻变电设备数据集合,x(i)定义为多维度变电设备数据的第i维,i=1,2,…,n,表示为:
xt=(x(1),x(2),…,x(i),…,x(n))
所述归一化处理,是指对多维度实时变电设备参数xt进行正规化,实现归一化运算,
得到t时刻变电设备运行状态的实时多维度归一化数据序列到nt,其中NOR(xt)是正规化运算,||xt||,是xt的模。
其中所述变电设备包括(但不限于)开关刀闸、变压器等,所述变电设备状态参数包括(但不限于)电流、电压、功率、功率因数、油温、油中气体数据等。
步骤6:通过对变电设备运行状态的实时多维度归一化数据序列应用降维操作,产生变电设备运行状态的实时降维数据序列;
对归一化处理后的数据序列进行多维度变电设备数据降维,具体为:
所述进行降维操作,是指对变电设备运行状态的实时多维度归一化数据序列nt进行降维运算:
yt=PCA(nt)
得到t时刻变电设备运行状态的实时降维数据序列yt,其中PCA(xt)是降维运算,通过对变电设备运行状态的实时多维度归一化数据序列应用降维操作,产生变电设备运行状态的实时降维数据序列;所述降维运算PCA(xt)包括(但不限于)离散余弦变换、主成分分析、离散小波变换等。
步骤7:应用可配置的预测器,对变电设备运行状态的实时降维数据序列进行预测计算,产生变电设备运行状态的预测数据序列;
对变电设备运行状态的实时降维数据序列进行预测计算,产生变电设备运行状态的预测数据序列,具体为:
所述预测计算,是指对变电设备运行状态的实时降维数据序列yt进行预测计算,
得到t时刻变电设备运行状态的预测数据序列其中AR(yt)是预测器;其中所述预测器包括(但不限于):多项式回归预测器、支持向量机预测器、人工神经网络预测器、卡尔曼预测滤波器、决策树回归预测器。
步骤8:应用变电设备运行状态的实时数据及预测数据进行分值计算,得到变电设备运行状态分值;
利用变电设备实际数据与预测数据进行分值计算,得到当前时刻电设备运行状态分值,具体为:
所述分值计算,是指应用变电设备运行状态的实时降维数据序列yt和变电设备运行状态的实时数据及预测数据进行分值计算,
得到变电设备运行状态分值到zt;
步骤9:确定变电设备运行状态阈值区间,包括上阈值界、下阈值界;
确定变电设备运行状态阈值区间,包括上阈值界、下阈值界,计算正常阈值范围,具体为:
所述变电设备运行状态阈值区间,是指
[Q1-1.5IQR,Q3+1.5IQR]
其中,Q1-1.5IQR为上阈值;Q3+1.5IQR为下阈值;四分位数间距IQR=Q3-Q1。
步骤10:应用变电设备运行状态阈值区间,判断当前时刻分值是否在阈值区间范围,并做出变电设备运行状态是否异常的结论。
所述判断当前时刻分值是否在阈值区间范围,并做出变电设备运行状态是否异常的结论是指使用变电设备运行状态分值到zt与变电设备运行状态阈值区间[Q1-1.5IQR,Q3+1.5IQR]进行比较,如果zt在该区间范围,则变电设备状态正常;否则,变电设备状态异常。
尽管为了说明的目的,已描述了本发明的示例性实施方式,但是本领域的技术人员将理解,不脱离所附权利要求中公开的发明的范围和精神的情况下,可以在形式和细节上进行各种修改、添加和替换等的改变,而所有这些改变都应属于本发明所附权利要求的保护范围,并且本发明要求保护的产品各个部门和方法中的各个步骤,可以以任意组合的形式组合在一起。因此,对本发明中所公开的实施方式的描述并非为了限制本发明的范围,而是用于描述本发明。相应地,本发明的范围不受以上实施方式的限制,而是由权利要求或其等同物进行限定。