一种基于主动学习的化工过程故障监控方法
【技术领域】
[0001] 本发明涉及化工过程故障监控技术领域,具体涉及一种基于主动学习的化工过程 故障监控方法。
【背景技术】
[0002] 近年来,由于分布式控制系统的发展,大量的工业过程数据被有效地收集和储存 起来,这些数据中包含了大量有价值的工业过程信息,使得基于数据驱动的工业过程监控 方法获得了广泛的关注。在基于数据驱动的故障监控方法中,朴素贝叶斯分类器是一种常 用方法,但在应用朴素贝叶斯分类器进行故障监控方法之前,有两个潜在的问题需要解决: 1)朴素贝叶斯分类器需要已标记的正常和故障工况数据建模,也就是说朴素贝叶斯分类器 不能发现未知故障。2)朴素贝叶斯分类器需要大量已标记工况数据建模。在工业实践中, 很难收集到全部的故障类型数据,一般只有有限数量的已标记的数据和大量未标记的观测 数据,这限制了朴素贝叶斯分类器在工业实际中的应用。
【发明内容】
[0003] 针对现有技术存在的不足,本发明提供一种基于主动学习的化工过程故障监控方 法。
[0004] 本发明的技术方案是:
[0005] -种基于主动学习的化工过程故障监控方法,包括以下步骤:
[0006]步骤1、实时采集化工过程信号的属性;
[0007] 步骤2、建立朴素贝叶斯分类器模型对化工过程进行故障监控;
[0008] 步骤2-1、根据化工过程历史信号建立初始训练信号集和未标记观测信号集:从 采集的历史信号中选择出设定数量的正常信号和故障信号,并根据每个信号所属信号类别 进行标记作为训练信号集,采集的历史信号中的其余信号作为未标记观测信号集;
[0009] 化工过程历史信号包括属性和信号类别;
[0010] 属性包括:物料属性、反应器属性、汽/液分类器属性、解析塔属性、测量结果属 性、压缩机属性、分离器属性、汽提器属性、冷凝器属性;
[0011] 信号类别包括:正常信号和故障信号,故障信号分为若干故障类别;
[0012] 步骤2-2、更新训练信号集和未标记观测信号集;
[0013] 步骤2-3、根据训练信号集建立朴素贝叶斯分类器模型并预测未标记观测信号的 类标签;
[0014] 步骤2-4、利用主动学习方法对朴素贝叶斯分类器模型进行修正:如果类标签为 未知故障类别,则收集从第一次出现属于未知故障类别的未标记观测信号开始的m个连续 未标记观测信号,作为已标记的新的故障类别信号加入到原来的训练信号集中,得到新的 训练信号集,返回步骤2-2 ;否则将未标记观测信号的后验概率熵大于阈值的信号及其类 标签加入到原来的训练信号集中,返回步骤2-2 ;
[0015] 步骤2-5、重复步骤2-2~步骤2-4,直至所有历史信号均被检测过,得到最终的朴 素贝叶斯分类器模型;
[0016] 步骤2-6、将实时采集的化工过程信号的属性作为最终的朴素贝叶斯分类器模型 的输入,对化工过程故障监控;
[0017] 步骤3、得到化工过程故障监控结果,即实时确定化工过程中的信号类别。
[0018] 所述物料属性包括:物料流量、排空物料流量、物料进料量;
[0019] 所述反应器属性包括:反应器给料流量、反应器压力、反应器液位、反应器温度、反 应器冷凝液出口温度、冷却水流量;
[0020] 所述汽/液分类器属性包括:汽/液分类器温度、汽/液分类器液位、汽/液分类 器压力、汽/液分类器出口流量;
[0021] 所述解析塔属性包括:解析塔液位、解析塔压力、解析塔出口流量、解析塔温度、解 析塔蒸汽流量;
[0022] 所述测量结果属性包括:反应器流量色谱对物料的测量结果、放空气体色谱对物 料的测量结果、产品流量色谱对物料的测量结果;
[0023] 所述压缩机属性包括:压缩机返回物料流量、压缩机功率、压缩机再循环阀开度、 压缩机排放阀开度;
[0024] 所述分离器属性包括:分离器罐液流量;
[0025] 所述汽提器属性包括:汽提器液体产品流量、汽提器水流阀开度;
[0026] 所述冷凝器属性包括:冷凝器冷凝液出口温度、冷凝器冷却水流量和搅拌速度。
[0027] 所述步骤2-3具体按如下步骤进行:
[0028] 步骤2-3-1、设未标记观测信号X=仏,X2,…,Xk,…,Xp,C};其中XpX2,…, \,"·,ΧΡ是属性,C是信号类另lj,其取值为{〇。,〇1,〇2,"*,(^,"*,〇(]},1^为属性的索引号, i为信号类别的索引号,c。表不正常信号,c广·cq表不故障类别;
[0029] 步骤2-3-2、建立朴素贝叶斯分类器模型;
[0030] 步骤2-3-2-1、计算训练信号集中每一个属性XJ1于故障类型Cl的概率P(Xk|Cl);
[0031]
[0032] 其中,、和心分别代表训练信号集中属于第(^类信号第k个属性的平均值和标准 差;
[0033] 步骤2_3_2_2、未标记观测彳目号X属于彳目号类别q的先验概率P(X|cJ:
[0034]
C2)
[0035] 步骤2-3-2_3、计算未标记观测信号X属于信号类别Cl的后验概率P(ci|X)即朴 素贝叶斯分类器模型:
[0036] P(Cl|X) =P(X|Cl)P(Cl)A^X) (3)
[0037] 其中,P⑴代表未标记观测信号X出现的概率,P(Cl)代表信号类别c#现的概 率即信号类别(31的先验概率沖((3 1) = |(^:)|/|〇|,其中|(^:)|代表训练信号集〇中(31类别 的训练信号数,Id|代表训练信号集中全体训练信号数;
[0038] 步骤2-3-3、以未标记观测信号X作为朴素贝叶斯分类器模型的输入量,得到未 标记观测信号X属于信号类别Cl的后验概率p(Cl|x),i= {〇,1,2, "·,?,···,(!},取概率P(ClIX)最大的信号类别Cl作为X的类标签。
[0039] 所述步骤2-4具体按如下步骤进行:
[0040] 步骤2-4-1、如果未标记观测信号X的类标签为故障信号,使用相似性原则判断是 否该类别是未知故障类别,如果未标记观测信号X的类标签为正常信号,跳到步骤2-4-2;
[0041] 所述相似性原则是指如果连续η个未标记观测信号的后验概率最大的信号类别 的后验概率小于设定后验概率下限τi,则该类别是未知故障类别,收集从第一次出现属于 未知故障类别的未标记观测信号开始的m个连续未标记观测信号作为已标记的新的故障 类别信号加入到原来的训练信号集中,得到新的训练集信号,返回步骤2-2 ;如果未出现连 续η个未标记观测信号的后验概率最大的信号类别的后验概率小于设定后验概率下限τp 跳到步骤2-4-2;
[0042] 步骤2-4-2、将P(X|ci)的后验概率熵作为不确定性指标,检测未标记观测信号: 如果未标记观测信号的不确定性指标大于阈值τu,则标记这个后验概率最大的信号类别 作为该信号的类标签,加入到原来的训练信号集中,得到新的训练信号集,返回步骤2-2; 如果未标记观测信号的不确定性指标u小于等于τu,则返回步骤2-2。
[0043] 有益效果:
[0044] 本发明克服了化工过程中很难收集到全部的故障类型数据的困难,根据有限数量 的已标记的数据和大量未标记的观测数据,建立朴素贝叶斯分类器再利用主动学习方法寻 找未标记观测信号中的有用样本,然后重新训练朴素贝叶斯分类器,使其可以发现新的故 障类型和改善分类精度。
【附图说明】
[0045] 图1为本发明一种实施例的TEP工业过程示意图;
[0046] 图2为本发明一种实施例的基于主动学习的化工过程故障监控方法流程图;
[0047] 图3为本发明一种实施例的传统朴素贝叶斯分类器方法和基于主动学习的化工 过程故障监控方法的准确率示意图。
【具体实施方式】
[0048] 下面结合附图对本发明的【具体实施方式】做详细说明。
[0049] 如图1所示,本实施方式的基于主动学习的化工过程故障监控方法应用于 TennesseeEastmanProcess(TEP)过程中;TEP工业过程由美国伊斯曼