专利名称:遥测电力负荷特性的分类和预测方法
技术领域:
本发明涉及遥测电力负荷特性(load pattern)的分类和预测方法。
背景技术:
根据电力产业的特性,电力设备和用户的度量仪表散布在全国,对于设备的过负荷、低电压等电力品质的监视以及用于稳定供给电力的电力设备的控制、用于获得电力使用量的远程查表等遥测是经由有/无线通信网进行的。这种设备的遥测正在推广中,并且大力推进有关负荷分布图(profile)的技术开发。特别是,为了通过远程查表数据的负荷分析来改善收费制度、改革用户服务以及提供附加值、树立经营战略、满足电力供需以及开发能源政策、树立设备投资计划等使用目的,正在尝试各种研究。
然而,现有的负荷分布图分析技术仅能够区分平日与休息日,构成以1日为单位的电力使用量矢量,并且仅限于通过按照季节、年度进行分析把握整体上的负荷状态,此时,由于月初和月末的平日负荷以相同方式生成,因此无法实现每日变化的负荷特性的分析以及连续的按照时间带区别的负荷分析和预测。另外,大部分的负荷分析,仅限于进行群集化并抽取代表性的负荷特性,并且在预测中以现有的被计测的负荷今后将如何变化等为焦点的未来预测技术为主流。即,并未适用使用计测设备的属性的分类和相对未计测设备的负荷特性的预测技术或方法论。
发明内容
本发明针对如上述的现有问题而提出,其目的在于,提供遥测的电力负荷的按照时间带区别的连续的特性的群集化和分类、未计测设备的预测方法。
另外,本发明涉及遥测电力负荷特性的分类和预测方法,特别是其目的在于,如远程查表或变压器的无线负荷监视那样,对于进行遥测而周期性地生成的电力设备的负荷特性的数据进行群集化和分类,并对负荷特性进行分析而能够使其反映到针对电力的供给和需要的计划中,利用被分类的代表负荷特性和设备属性对因用户的设置回避或计测装置的设置困难、设置费用的负担等而未计测的电力设备的负荷特性进行预测,并节省计测费用。
为了实现上述目的,本发明适用了大容量数据的收集和处理技术、时间数据挖掘(Data Mining)技术、高性能统计处理技术、负荷模拟技术和解析技术。通过按照时间带区别的连续的负荷特性的群集化,生成按照群集区别的代表负荷特性,利用遥测而得的设备的属性信息和代表负荷特性进行分类,能够将未计测设备的属性适用于分类模型来预测负荷特性。
本发明的目的可通过遥测电力负荷特性的分类和预测方法来实现,该遥测电力负荷特性的分类和预测方法包括收集步骤,其收集遥测数据;数据的前处理步骤,其包含从上述遥测数据抽取分层样本,并从样本数据中对错误和异常值进行清除处理的过程;正规化步骤,其对上述前处理后的数据按要分析的规定的期间单位来构成矢量,并以使遥测值分布于特定范围内的方式进行正规化作业;群集化步骤,其对上述正规化后的数据进行群集化而生成代表负荷特性;分类步骤,其基于计测设备的属性信息来进行分类;预测步骤,其基于未计测设备的属性来分配群集,并对未计测设备的负荷特性进行预测。
根据本发明的优选实施方式,上述群集化步骤中可以通过再现性评价方法来进行群集分析处理,该评价方法中将正规化数据分割为训练数据和试验数据,在输入k值后,适用群集化模型来生成交叉分类表,从而确定最佳的k值。
根据本发明的优选实施方式,上述分类步骤可以包括使用群集化结果和计测设备信息来进行决策树结构的分类。
根据本发明的优选实施方式,对上述计测设备的属性而言,在远程查表数据的情况下,作为用户特性信息,可以包括契约种类、契约电力、电气使用的用途、产业分类、供电方式、地域区分、月查表量,在变压器的无线负荷监视数据的情况下,作为变压器特性信息,可以包括容量、电灯收容户数、动力收容户数、负荷地域特性和从该变压器供给的用户的契约种类、契约电力、电气使用的用途、高压/低压的区分以及月使用量。
根据本发明的优选实施方式,上述未计测设备的负荷特性的预测,可以以与群集化结果和计测设备的属性相同的方式,将未计测设备的属性按照作为分类模型的结果的决策树分配群集,并将所分配的群集的正规化后的代表负荷特性复原为本来的负荷量来预测未计测设备的负荷特性。
如上所述,根据本发明,当通过按照时间带区别的连续的负荷特性的群集化而生成按照群集区别的代表负荷特性时,在远程查表数据的情况下,通过用户的代表负荷特性能够进行负荷特性和电力使用状态的分析,并且能够提供为了提高负荷预测准确性、实现按照电力需要组群区别的外部要因(天气、经济增长率等)的敏感度分析、针对价格系统进行模拟和改善、根据负荷特性提供个性化的用户服务,以及树立经营战略等而成为核心的知识。在变压器的无线负荷监视数据的情况下,能够进行变压器的负荷特性的特点分析,并且能够应用于与负荷特性对应的变压器更换基准的建立和寿命评价的研究。
如果将群集化的负荷特性按照设备属性进行分类,则在现有状态下,能够把握针对设备区分方式负荷特性如何被分类。在远程查表数据的情况下,通过用户的契约种类、契约电力、产业分类、电气使用的用途、月查表量等的区分来对负荷特性进行分类,在变压器的无线负荷监视数据的情况下,通过变压器的容量、地域特性、所供给的用户的特性信息的区分来对负荷特性进行分类。由此,能够预测未计测电力设备的负荷特性,且能够应用于未来的具有连续性的按照时间带区别的负荷预测中。可以说本发明应用范围广泛,其不仅能够适用于远程查表、变压器的无线负荷监视,而且还能够适应于如配电自动化、送变电设备的负荷监视那样的进行遥测的电力设备的负荷特性的数据。
图1是表示本发明涉及的遥测电力负荷特性的分类和预测方法的流程图。
图2是表示群集化方法的流程图。
图3是表示远程查表数据的群集化中的交叉分类表的例示图。
图4是表示远程查表用户的代表负荷特性的生成结果的例示图。
图5是表示远程查表用户的决策树的例示图。
具体实施例方式 以下,参照附图对本发明进行详细说明。
图1为表示本发明涉及的遥测电力负荷特性的分类和预测方法的流程图。
参照图1,本发明首先在步骤1中将遥测数据与数据库或文件联系起来,在步骤2中进行前处理。这里,作为遥测数据,对应于用户远程查表数据、变压器的无线负荷监视数据、自动化开闭器的电力品质监视数据、送变电设备的负荷监视数据。前处理作业可以包含样本抽取和异常值清除处理。作为样本抽取适用分层取样(Stratified Sample)抽取技术,以针对关注项目按不同的频度进行收容。分层取样中,当大容量数据集合D被分割成称为层(Strata)的相互分离的部分时,通过在各层中获得1个简单随机样本(Simple Random Sample)来生成D的分层样本。例如,在远程查表数据的情况下,相对于关注项目的契约类别和契约电力,数据的频度为非对称的,因此按照总体的频度来抽取样本。
收集的数据中所含的错误和异常值(Outlier)数据会导致群集分析的性能显著降低,从而必须进行用于数据精制的前处理作业。在原始远程查表数据的情况下,将1日没有96个数据或者1日有效电力之和小于1的当日数据除去。在15分钟为单位时,最小查表量在契约电力为街灯时为0.08,而1以下则视为无法正常查表。另外,为了进行异常值处理,而适用数据精制技术中的SOM(Self-Organizing feature Map)群集化算法。构成矩阵为10乘10(100群集)的群集中所含的数据对象为1以下的群集结果,被当作异常值而除去。
当前处理完成时,在步骤3中进行正规化作业,以对前处理的数据进行分析的周期例如月、周、日、小时等为单位来构成矢量,并以使遥测值分布于特定范围内的方式进行正规化作业处理。远程查表数据由于进行预测的未计测客户进行月查表,因此以月为单位将15分钟远程查表数据按照客户类别构成1个矢量。变压器的无线负荷监视数据,以月为单位分析负荷特性的特点,为了预测未计测设备而以月为单位将30分钟计测数据按照设备类别构成1个矢量。此时,如果直接使用原始计测数据,则按照电力使用量的分布来形成群集化。因此,进行正规化以使矢量的最大值为1。
接着,在步骤4中对正规化的数据进行群集化,转入步骤5生成代表负荷特性。
另外,根据群集分析的结果生成多个群集时,在步骤7中构建类别(class)的分类模型。分类用作区别不同的类别的对象的说明工具,并且用于预测未知记录的类别标签(class label)。即,按照计测各群集的客户或设备的特性进行分类,并在未计测客户或设备输入时预测类别标签。
此时,能够将步骤6的计测设备属性提供给步骤7的分类步骤。如果对此进行详述,则在远程查表的情况下,作为客户特性信息有契约种类、契约电力、电气使用的用途、产业分类、供给方式、地域区分、月查表量,在变压器的无线负荷监视数据的情况下,作为变压器特性信息有容量、电灯收容户数、动力收容户数、负荷地域特性和从该变压器供给的客户的契约类别、契约电力、电气使用的用途、高压/低压的区分以及月使用量。此时,在属性信息较多的情况下,计算平均信息量(Entropy)来缩小适用范围。平均信息量作为区间的相对于纯度的尺度,是在区间中类别的发生概率(比值)。即,所提供的区间如果仅包含属于1个类别的值(完全纯粹),则平均信息量为0,如果在1个区间内几个类别的值等同地频繁发生(区间在可能限度内不纯),则平均信息量最大,因此将各属性值从1个分离区间开始,对统计的试验结果类似的邻接区间进行合并而生成较大的区间。
作为用于步骤7的分类的分类器的例子,可以举出决策树(DecisionTree)、贝叶斯(Bayesian)分类器、神经网络(Neural Network)、SVM(Support Vector Machine)以及规则基础分类器等,但是在本发明中评价性能采用决策树。分类模型的性能评价采用由TP(True Positive)、TN(True Negative)、FP(False Positive)、FN(False Negative)表示的混合矩阵(confusion matrix),并能够按照如下式,即 来计算准确性并选择生成最大值的算法。决策树是将意志决定规则图表化为树结构来进行分类和预测的分析方法。该方法中将分类或预测的过程以树结构的推理规则(Induction Rule)来进行表示,因此与其它方法相比,其具有分析者能够容易理解并说明其过程的优点。
对于未计测设备的负荷特性的预测中,以与步骤6的计测设备的属性相同的方式,将步骤7的未计测设备的属性,按照步骤7的分类模型的结果即决策树,如步骤9那样进行群集分配。此时,分配的群集(即代表负荷特性)为0和1之间的正规化的负荷特性,因此必须复原为原来的负荷量。当C为代表负荷特性(C1~Ck~Cn),T是月单位总使用量时,按各时间带区别的未计测设备的负荷特性(10)按照如下式计算。
图2是表示本发明涉及的群集数的确定和用于生成代表负荷特性的群集化方法的流程图。在群集化中,最佳的k个群集数的确定,不仅对于群集化而且对于分类性能也具有很大影响,因此是非常重要的要素,必须适用引入过去经验的启发式(Heuristic)方法论。在本发明的群集数确定中使用再现性(Reproducibility)评价方法。所谓群集分析的再现性是指,通过相同机制生成的3个独立的新的数据以相同方式进行群集化的结果与现有群集化结果类似时则具有再现性。再现性评价模型可以采用如神经网络或决策树分类以及回归分析等有监督学习(Supervised Learning)建模中使用的数据分割技术。资料分割可以重复相同的群集化方法,因此能够利用该技术进行再现性评价。
参照图2,步骤S1中的正规化数据在步骤S2中任意地被分割为二个数据。其中一个为步骤S3中的训练数据,另一个为步骤S4中的试验数据。易于分割的方法是按遥测设备的ID为奇数的和偶数的来进行分割。接着,将从经验上预想具有意义的k值进行输入(步骤S5),并将训练数据适用于群集化模型(步骤S6)。这里,群集化模型考虑在大容量数据中迅速的群集构成、用户基础的群集数确定方式、判断群集的适应性的再现率适用的容易性等来适用,在本发明中适用k-means算法。
另外,将试验数据的各对象适用于从训练数据生成的群集化模型中并进行分离。即,将试验数据分配给最近的中心的群集。将试验数据以相同方式群集化来计算出其自身的模型。另外,将试验数据的各对象分配给多个群集中的一个。接着,基于试验数据的两个群集化结果来生成交叉分类表(S7)。对此参照图3来在后面叙述。如果适用的群集化为最优化后的,则在该表中应表示出行与列的较强的对应性。否则应表示行与列的较弱的对应性。
接着转入步骤S8。在交叉分类表中,求出从主倾向偏离的数据数和比率(%)。在根据所输入的k值生成的交叉分类表中,计算出最初从最小主倾向偏离的比率则确定为最佳k值,否则再次转入步骤S5,输入另一k值并再次重复进行生成交叉分类表的作业。在k值被确定后,将分割前的正规化数据(步骤S1)适用于群集化模型(S9)。其结果,如图4所示(后述),生成按照各群集区别的代表负荷特性(S10)。
图3是表示远程查表数据的群集化中的交叉分类表的例示图。
参照图3,将远程查表数据作为将群集数设定为5个并群集化为训练数据和试验数据的群集而生成交叉分类表的结果,在图3中,阴影所示部分为属于主倾向的数据数,无阴影部分为从主倾向偏离的数据数。用整体数据数除以从主倾向偏离的数据数,则生成从主倾向偏离的数据的比率。
图4是表示远程查表客户的代表负荷特性的生成结果的例示图。
参照图4,将k值以31群集化,将31个代表负荷特性相对于特定的1日期间以15分钟为单位来表示。
图5为表示远程查表客户的决策树的例示图。
参照图5,表示对于远程查表数据的群集适用客户特性信息,并通过决策树分类器生成的结果的一部分,这里使用的客户特性信息有契约种类代码、契约电力、电气使用的用途代码、产业分类代码、供给方式代码、地域(栋)代码、月查表量。可知月查表量的属性信息是分类基准的重要要素。这样,如果使用以月为单位构成的决策树来输入未计测客户的特性信息,则代入该客户的特性信息来确定群集。例如,在所输入的未计测客户的特性信息中,当月查表量(TOT_KWH)比1,426、536kWH大,契约电力(CNTR_PWR)比12,500kW大,契约种类代码(CNTR_CD)比228小或相同,且产业分类代码(INDU_CD)比67121大时,则分配群集(Cluster)23。
权利要求
1.一种遥测电力负荷特性的分类和预测方法,其特征在于,包括
收集步骤,其收集遥测数据;
数据的前处理步骤,其包含从上述遥测数据抽取分层样本,并从样本数据中对错误和异常值进行清除处理的过程;
正规化步骤,其对上述前处理后的数据按要分析的规定的期间单位来构成矢量,并以使遥测值分布于特定范围内的方式进行正规化作业;
群集化步骤,其对上述正规化后的数据进行群集化而生成代表负荷特性;
分类步骤,其基于计测设备的属性信息来进行分类;
预测步骤,其基于未计测设备的属性来分配群集,并对未计测设备的负荷特性进行预测。
2.根据权利要求1所述的遥测电力负荷特性的分类和预测方法,其特征在于,上述群集化步骤中通过再现性评价方法来进行群集分析处理,该评价方法中将正规化数据分割为训练数据和试验数据,在输入k值后,适用群集化模型来生成交叉分类表,从而确定最佳的k值。
3.根据权利要求1所述的遥测电力负荷特性的分类和预测方法,其特征在于,上述分类步骤包括使用群集化结果和计测设备信息来进行决策树结构的分类。
4.根据权利要求3所述的遥测电力负荷特性的分类和预测方法,其特征在于,对上述计测设备的属性而言,在远程查表数据的情况下,作为用户特性信息,包括契约种类、契约电力、电气使用的用途、产业分类、供电方式、地域区分、月查表量,在变压器的无线负荷监视数据的情况下,作为变压器特性信息,包括容量、电灯收容户数、动力收容户数、负荷地域特性和从该变压器供给的用户的契约种类、契约电力、电气使用的用途、高压/低压的区分以及月使用量。
5.根据权利要求1所述的遥测电力负荷特性的分类和预测方法,其特征在于,上述未计测设备的负荷特性的预测,以与群集化结果和计测设备的属性相同的方式,将未计测设备的属性按照作为分类模型的结果的决策树分配群集,并将所分配的群集的正规化后的代表负荷特性复原为本来的负荷量来预测未计测设备的负荷特性。
全文摘要
本发明涉及遥测电力负荷特性的分类和预测方法,特别是能够以度量仪表的远程查表或配电变压器的无线负荷监视的方式进行遥测,对电力设备的负荷特性周期性地生成的数据进行群集化和分类,并分析连续的按时间带区别的负荷特性,生成因设备的区分方式而不同的负荷特性的分类规则,利用被分类的代表负荷特性和设备的属性,能够对没有进行计测(以下称为未计测)设备的负荷特性进行预测。由此,能够实现按照电力需要组群区别的负荷特性和电力使用状态的分析,并且能够提高负荷预测准确性、实现外部要因的敏感度分析、设备更换基准的建立以及提供用于寿命评价技术开发的核心知识。另外,本发明还能够应用于遥测的电力设备的负荷特性的数据。
文档编号H02J13/00GK101728868SQ20091000303
公开日2010年6月9日 申请日期2009年1月8日 优先权日2008年10月31日
发明者辛镇浩, 金荣一, 李俸在, 梁日权 申请人:韩国电力公社