基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法

文档序号:6305384阅读:607来源:国知局
基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法
【专利摘要】本发明公开了一种基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,采取一种先进的多元回归分析方法,主要用来解决多元回归分析中变量多重相关性及自变量多于样本变量等实际问题。设法将多个变量中综合为少数几个代表性变量,既能够代表原始变量的绝大多数信息,又互不相关,其提取的主成分既能教好的解释因变量,又能很好的解释自变量,并且在新的综合变量基础上,可以进一步的统计分析,为后来的能耗与产量的平衡优化研究打下理论基础,达到高效率、高产量、低能耗的目的,对挖泥船进行能耗与产量优化具有重要意义。
【专利说明】基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法
【技术领域】
[0001]本发明涉及偏最小二乘法在绞吸式挖泥船众多能耗影响因素中提取主成分的应用,属于疏浚工程领域。
【背景技术】
[0002]在实际疏浚作业中,科研人员通过相应的设备记录到大量的数据,以便进行分析寻找规律。多变量、大样本无疑会为科学研究提供丰富的信息,但在大多数情况下,许多变量之间存在的相关性增加了问题分析的复杂性。因此需要找到一个合理的方法,在减少分析变量的同时,尽量减少原变量包含信息的损失,对所收集的资料做全面的分析。偏最小二乘法就是这样一种方法,它可以在众多变量中,找出少数几个综合性变量,来反映原来因变量及自变量所反映的主要信息,使问题简化。偏最小二乘法的作用在于:①能降低所研究的数据空间的维数提取的主成分对原始变量系统有很好的解释能力构造回归模型,可以用于能耗预测分析;④可以对变量进行分类。
[0003]偏最小二乘法(Partial least squares, PLS)是一种先进的多元回归分析方法,主要用来解决多元回归分析中变量多重相关性及自变量多于样本变量等实际问题。通过将自变量和因变量的高维数据空间投影到相应的低维特征空间,分别得到自变量和因变量的相互正交特征向量,再建立自变量和因变量特征向量的一元线性回归关系。与主成分分析(Primary Component Analysis, PCA)相比较:在PCA中,首先它完全撇开因变量,单独考虑对自变量系统提取主成分,这就有可能导致主成分对因变量的相关性很低,从而导致自变量与因变量的相关性分析不合理;而PLS是从原有自变量中提取相互正交的成分,成分提取时既考虑了与因变量的相关性,使成分与因变量的协方差达到最大,也考虑了与自变量的相关性,使成分包含X的信息达到最大。它在选取特征向量时强调自变量对因变量的解释和预测作用,去除了对回归无益噪声的影响,是模型包含最少的变量数,因而PLS模型具有更好的鲁棒性和预测稳定性。PLS分析是集多元线性回归分析、典型相关分析、主成分分析的基本功能为一体的一种分析方法。
[0004]在用统计分析方法研究多变量的课题时,变量个数太多就会增加课题的复杂性。人们自然希望变量个数较少而得到的信息较多。在很多情形,变量之间是有一定的相关关系的,当两个变量之间有一定相关关系时,可以解释为这两个变量反映此课题的信息有一定的重叠。PLS是对于原先提出的所有变量,建立尽可能少的新变量,使得这些新变量是两两不相关的,提取出来这些新变量不仅对原始变量有最佳解释能力,而且在反映课题的信息方面保持较多的原有信息。
[0005]疏浚作为水下作业,影响因素众多,其中众多参数变量之间常常存在一定的相关性。这势必增加了分析问题的复杂性。如何确保合理有效的工艺决策,减少调控参数,降低操作复杂性,成为疏浚低能耗、低排放、高效率的关键问题。
[0006]PLS方法是一种变量系统的投影分析与还原解释方法,其技术的核心是在线性最小二乘算法中嵌入数据信息综合与变量筛选技术,在最大限度保证与自变量系统与因变量系统相关性的前提下,化简自变量系统,消除自变量的多重相关性,并且在新的综合变量基础上,可以进一步的统计分析。为后来的能耗与产量的预测研究打下理论基础。

【发明内容】

[0007]本发明利用现有的偏最小二乘方法,对绞吸式挖泥船上影响能耗众多的因素进行分析计算。使之能通过降维的作用减少变量的个数,分析起来更够更加清晰明了。
[0008]本发明具体技术方案如下:
[0009]一种基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,包括以下步骤:
[0010]步骤(1):收集影响绞吸式挖泥船能耗因素变量的数据资料,确定P个分析能耗变量,列出因变量与自变量样本矩阵;其中,P为正整数;
[0011]步骤(2):对样本矩阵进行标准化处理;
[0012]步骤(3):根据标准样本矩阵,分别计算矩阵的最大特征值所对应单位特征向量,得自变量和因变量的第一个主成分;
[0013]步骤(4):计算缩减后标准样本数据的残差矩阵,重复步骤(3),依次求出其他主成分;
[0014]步骤(5):根据提取主成分终止判断准则,依次计算出主成分对自变量、因变量信息的解释能力;
[0015]步骤(6):确定主成分个数;
[0016]步骤(7):将标准化处理后的样本矩阵数据带入提取各主成分表达式,分别计算出各主成分的变量。
[0017]上述步骤(1)中样本矩阵如下:
[0018]设对P个自变量X1, X2,...Xp和q个因变量Y1, y2,...yq进行了 η次观测,分别记自变量与因变量的“样本点X变量”型的数据矩阵为:
[0019]X = (Xij)nxp = (X1, X2,...xp), i = I, 2..., η ; j = I, 2,...p
[0020]Y = (Yij)nxq = (y” y2,...yq), i = I, 2..., n ; j = I, 2,...q
[0021]上述步骤(2)中矩阵标准化处理如下:
[0022]记标准化后的数据矩阵为
[0023]E0 = (Gij)nxp 和 F。= (fij)nxq,
【权利要求】
1.一种基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,其特征在于包括以下步骤: 步骤(1):收集影响绞吸式挖泥船能耗因素变量的数据资料,确定P个分析能耗变量,列出因变量与自变量样本矩阵;其中,P为正整数; 步骤(2):对样本矩阵进行标准化处理; 步骤(3):根据标准样本矩阵,分别计算矩阵的最大特征值所对应单位特征向量,得自变量和因变量的第一个主成分; 步骤(4):计算缩减后标准样本数据的残差矩阵,重复步骤(3),依次求出其他主成分;步骤(5):根据提取主成分终止判断准则,依次计算出主成分对自变量、因变量信息的解释能力; 步骤(6):确定主成分个数; 步骤(7):将标准化处理后的样本矩阵数据带入提取各主成分表达式,分别计算出各主成分的变量。
2.根据权利要求1所述的基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,其特征在于所述步骤(1 )中的样本矩阵如下: 设对P个自变量X1, X2,...Xp和q个因变量yu y2,...y,行了 η次观测,分别记自变量与因变量的“样本点X变量”型的数据矩阵为:
X = (Xij)nxp = (X1, X2,...Xp), i = I, 2..., η ; j = 1,2,...p
Y = (Yij)nXq = (Yd Υ2)...yq)) i = I, 2..., η ; j = 1,2,...q。
3.根据权利要求1所述的基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,其特征在于所述步骤(2)中矩阵标准化处理如下: 记标准化后的数据矩阵为:
4.根据权利要求1所述的基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,其特征在于所述步骤(3)中第一个主成分提取的计算步骤如下: 求矩阵EJFqFJEq啲最大特征值所对应单位特征向量Wl,得自变量的第一个主成分,&=E0W1 求矩阵FjE0EjF0的最大特征值所对应单位特征向量Cl,得因变量的第一个主成分,U1=F0C1 求残差矩阵
5.根据权利要求1所述的基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,其特征在于所述步骤(4)中其他主成分的计算步骤如下: 令Etl = E1, Ftl = F1,对残差矩阵进行新一轮的主成分提取 设第h步的计算结果为 th = ElrfWh (1-5) uh = FlrfCh (1-6)
6.根据权利要求1所述的基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,其特征在于所述步骤(5)中的提取主成分终止判断准则采用复测定系数准则, 由统计量
7.根据权利要求1所述的基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,其特征在于所述步骤(5)中主成分对自变量、因变量信息的解释能力的计算过程如下: 记P2(^th)是主成分th与因变量&的简单相关系数的平方,th对因变量系统Y的解释能力:
RcKyj ;th) = P 2(yj ;th) (1-11)
8.根据权利要求1所述的基于偏最小二乘法的疏浚作业能耗影响因素主成分提取方法,其特征在于所述步骤(6)中主成分个数的确定如下: 分别绘制主成分和主成分对能耗因变量Y解释能力总信息及能耗影响因素X解释能力总信息柱状图,找出Rdh(Cum) >85%时,两者的主成分个数,然后对其两者取主成分个数交集,这样不仅保证了主成分对能耗因变量Y有较好的解释能力,而且也保证了主成分对能耗影响因素X的具有较好的解释能力。
【文档编号】G05B13/04GK103995467SQ201410224607
【公开日】2014年8月20日 申请日期:2014年5月26日 优先权日:2014年5月26日
【发明者】李凯凯, 许焕敏, 周玉刚, 穆乃超 申请人:河海大学常州校区
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1