一种基于基因表达式编程(gep)双向预测的短椭圆弧拟合方法

文档序号:10570209阅读:305来源:国知局
一种基于基因表达式编程(gep)双向预测的短椭圆弧拟合方法
【专利摘要】本发明一种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合方法,属于数字化测量技术领域,涉及GEP预测建模、最小二乘拟合方面的相关知识。本发明首先采用小波滤波的方法对短椭圆弧的原始观测数据进行去噪处理,然后利用构建的GEP预测模型对去噪后的短椭圆弧观测数据进行双向有限长预测,本质上相当于拓展了短椭圆弧的长度。本发明提出一种GEP算法变异率的自适应定义方法,可以有效抑制算法“早熟”现象的发生,提高算法的收敛速度。最后,采用加权最小二乘拟合算法对预测后的短椭圆弧观测数据进行拟合,最终使得短椭圆弧的拟合精度及稳定性得以显著提高。
【专利说明】
一种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合 方法
技术领域
[0001] 本发明"一种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合方法"属于数字 化测量技术领域,涉及到GEP预测建模、最小二乘拟合方面的理论与知识。
【背景技术】
[0002] 椭圆作为几何基元家族中重要的一个成员,椭圆拟合算法在机械工程、军事装备、 图像处理、天文测量、矿山勘测、航空航天、医疗卫生等领域得到广泛应用。然而,在很多情 况下,受到测量条件、测量工况的限制,数字化测量装备无法在整个椭圆圆周上获取观测 点,只能测量到一段椭圆弧。再一个,许多测量对象(如:机械零部件)本身就是一段椭圆弧 体。椭圆弧拟合,特别是短椭圆弧的拟合算法一直是数字化测量领域一个公认的具有挑战 性的难题。究其原因在于短椭圆弧只是整个椭圆的一个部分,椭圆弧的长度越短,则被丢弃 的表征信息越多,它对整个椭圆的代表性就越差,从而造成测量准确度较差。关于短椭圆弧 拟合算法,目前常用的有直接最小二乘法、霍夫变换法、最小子集法、卡曼滤波法等。研究发 现,当椭圆弧长度小于整个椭圆的1/4时,随着椭圆弧长度的进一步减小,采用上述方法得 到的椭圆弧参数(中心坐标、半长轴、半短轴、倾斜角)的拟合误差会急剧大幅度攀升。

【发明内容】

[0003] 本发明要解决的技术问题是:现有的短椭圆弧拟合算法的拟合误差比较大,为解 决上述问题,提供一种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合方法。
[0004] 本发明的目的是以下述方式实现的:
[0005] -种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合方法,包括以下步骤:
[0006] (1)采用小波域阈值滤波的方法对短椭圆弧观测数据进行去噪处理;提出利用混 合阈值函数来估计小波系数,对小波阈值函数定义中的调节系数、阈值由遗传算法得到其 最佳值;
[0007] (2)构建GEP预测模型,利用提出的变异率自适应定义方法,对短椭圆弧观测数据 进行双向有限长预测;
[0008] (3)利用"中值估计"的思想,确定短椭圆弧加权最小二乘拟合算法目标函数中的 加权系数;
[0009] (4)采用加权最小二乘拟合算法对预测后的观测数据进行拟合,得到椭圆弧的特 征参数。
[0010] 假设短椭圆弧的一组观测数据为(^^以二^^儿根据广义时间序列的定义, 可视其为一时间序列y(n),n = l,2. . .N利用Mallat算法实现对y(n)的一维离散小波变换, 得到一组在各个尺度下的小波系数%,k,采用混合阈值函数来估计小波系数,其定义如下:
[0011] wjtk=\ 5 ]-k \ ]-h ' hk' ?e[0 l]〇 l〇 其它
[0012] 遗传算法寻优的方法来得到最佳的调节系数ao,最优的阈值AQ,具体步骤如下:
[0013] (b)对调节系数a及阈值A进行实数编码;
[0014] (b)初始化群体;
[0015] (c)定义适应度函数,并计算每一个个体的适应度值,定义适应度函数为: ::;这里,/= 士- .为均方根误差,y(n)为原始信号,J(?)为去 :R-1 _ 噪后信号;
[0016] ⑷设定算法终止条件:目标函数€<£〇(如:£〇 = 10力,或者限定最大进化代数;如 果算法满足终止条件,则输出最优调节系数、最佳阈值,依据定义的混合阈值函数得到估计 小波系数,小波重构便得到滤波后的数据;
[0017] (e)否则,对种群进行遗传算法操作,包括:选择、交叉、变异,选择算子采用最优保 存策略,交叉算子采用两点交叉法,变异算子采用高斯变异算子,并设定种群的交叉率、变 异率;估计小波系数;&小波重构,转步骤( c)。
[0018] 基于GEP算法的短椭圆弧观测数据双向有限长预测步骤及方法如下所述:
[0019] (a)输入去噪后的短椭圆弧观测数据;
[0020] (b)定义函数集{ +,-,*,/,Q}、终端符合集{x,y},设置GEP参数,包括:函数集、连接 函数、基因头部长度、基因数目、种群大小、选择策略、变异率、IS插串率、IS元素长度、RIS插 串率、RIS元素长度、基因插串率、单点重组率、两点重组率、基因重组率;产生初始种群;对 每一个染色体进行等长线性字符串编码;
[0021] (c)对每一个染色体进行解码操作;
[0022] (d)定义适应度函数,这里采用相对误差的定义形式,计算每一个染色体的适应度 值;
[0023] (e)判断是否满足算法终止条件;
[0024] (f)如果满足算法终止条件,输出最优个体,即最佳的预测表达式,利用该预测表 达式对短椭圆弧观测数据进行双向有限长预测,然后结束程序;
[0025] (g)如果不满足算法终止条件,确定保存策略;
[0026] (h)进行遗传操作,包括:选择操作、插串操作、重组操作、变异操作;
[0027]不同于设置变异率Pm(g)为一常量,提出一种自适应的定义方法:Pm(g)=P m〇(l+a)
[0028] 变异调节系数
,Pm〇为预设变异率,f(g-l)为上一代的最佳适应度 值,f(g)为当前一代的最佳适应度值,NS为连续未进化的代数,这样在算法进化初期,以8_ 1)<汽8)具=0,则?"(8)=?"〇;进化的中后期4(8-1)^^(8),队>0,则?"(8)>?"(),且随着 未进化代数Ns的增大,Pm(g)持续变大;
[0029] (i)经过各种遗传算子的操作,产生新一代种群;转步骤(c)。
[0030] 相对于现有技术,本发明意在阐明一种提高短椭圆弧拟合精度的新思路与新方 法,主要涵盖三个方面的内容。一是采用小波滤波方法对原始的短椭圆弧观测数据进行去 噪处理。二是利用GEP算法对短椭圆弧去噪后的观测数据进行双向有限长预测,这本质上相 当于延长了短椭圆弧的长度,减小了短椭圆弧参数的拟合误差;三是采用加权最小二乘拟 合算法对预测后的短椭圆弧观测数据进行拟合,该加权最小二乘拟合算法通过定义不同观 测数据样本在目标函数中的权重系数,可以有效提高对那些离群观测数据的抗干扰能力。
【附图说明】
[0031 ]图1是是整个短椭圆弧拟合算法的流程图。
[0032] 图2是小波域阈值滤波方法对短椭圆弧观测数据去噪流程图。
[0033] 图3是基于GEP算法短椭圆弧观测数据双向有限长预测的流程图。
[0034] 图4是椭圆弧的加权最小二乘拟合算法流程图。
【具体实施方式】
[0035] 如图1-图4所示,本发明意在阐明一种提高短椭圆弧拟合精度的新思路与新方法, 主要涵盖三个方面的内容。一是采用小波滤波方法对原始的短椭圆弧观测数据进行去噪处 理。二是利用GEP算法对短椭圆弧去噪后的观测数据进行双向有限长预测,这本质上相当于 延长了短椭圆弧的长度,减小了短椭圆弧参数的拟合误差;三是采用加权最小二乘拟合算 法对预测后的短椭圆弧观测数据进行拟合,该加权最小二乘拟合算法通过定义不同观测数 据样本在目标函数中的权重系数,可以有效提高对那些离群观测数据的抗干扰能力。具体 的实施方式及步骤如下:
[0036] (1)对短椭圆弧观测数据进行去噪处理
[0037] 如图2所示,假设短椭圆弧的一组观测数据为(Xl,yi)i = l,2. . .N,根据广义时间序 列的定义,可视其为一时间序列y(n),n=l ,2. . .N。利用著名的Mallat算法实现对y(n)的一 维离散小波变换,得到一组在各个尺度下的小波系数w^。针对软、硬阈值函数的不足,这里 提出采用混合阈值函数来估计小波系数,其定义形式如下: signiw, ^)(w, k - a/L) vr, ,\> X
[0038] w'a = M 1 M 1 ae[0 1] .[0 其它
[0039] 该混合阈值函数避免了硬阈值函数对小波系数的简单置零,同时也增加了对那些 大于阈值的小波系数收缩变换的柔性,收缩程度可以由调节系数来实现。在确定了阈值函 数之后,另外一个关键问题就是如何确定阈值的大小。为此,本发明提出采用遗传算法寻优 的方法来得到最佳的调节系数,最优的阈值,进而,利用得到的最佳调节系数与最优阈值对 观测数据实现滤波。具体步骤如下:
[0040] (a)对调节系数a及阈值A进行实数编码。相比起二进制编码形式,实数编码可以有 效避免"汉明悬崖"现象的发生,而且,实数编码具有精度高,便于大空间搜索等优点。
[0041 ] (b)初始化群体。设定种群规模,随机生成初始化的群体。
[0042] (c)定义适应度函数,并计算每一个个体的适应度值。适应度函数对于整个遗传算 法的求解十分重要,适应度函数的选取直接影响到遗传算法的收敛速度以及能否找到最优 解。个体的优劣正是通过其对应的适应度函数值来体现的。这里,定义适应度函数为:
[0043] 这里
为均方根误差,y(n)为原始信号,为去噪后 信号。以均方根误差为目标函数,均方根误差越小,说明滤波后的信号越接近真实信号。
[0044] ⑷设定算法终止条件:目标函数€<£〇(如:£〇 = 10力,或者限定最大进化代数。如 果算法满足终止条件,则输出最优调节系数ao、最佳阈值AQ,依据定义的混合阈值函数得到 估计小波系数,小波重构便得到滤波后的数据。
[0045] (e)否则,对种群进行遗传算法操作。包括:选择、交叉、变异,选择算子采用最优保 存策略,交叉算子采用两点交叉法,变异算子采用高斯变异算子,并设定种群的交叉率、变 异率。估计小波系数L. /f,小波重构,转步骤(c)。
[0046] 同时,根据
【申请人】的研究经验,如果能够根据已知条件或先验知识确定寻优参数 的取值区间,这样将明显提升遗传算法的收敛速度。例如,在混合阈值函数的定义中,已知 调节系数aG [01],这样,在利用遗传算法求解的过程中,就可以限定a的取值范围为[01]。
[0047] (2)GEP算法对去噪后的短椭圆弧观测数据进行双向有限长预测
[0048] 基于GEP算法的短椭圆弧观测数据双向有限长预测的流程图见图3。详细步骤及方 法如下所述:
[0049] (a)输入去噪后的短椭圆弧观测数据。
[0050] (b)定义函数集{ +,-,*,/,Q}、终端符合集{x,y},设置GEP参数,包括:函数集、连接 函数、基因头部长度、基因数目、种群大小、选择策略、变异率、IS插串率、IS元素长度、RIS插 串率、RIS元素长度、基因插串率、单点重组率、两点重组率、基因重组率。产生初始种群。对 每一个染色体进行等长线性字符串编码。
[0051] (c)对每一个染色体进行解码操作。
[0052] (d)定义适应度函数,这里采用相对误差的定义形式,计算每一个染色体的适应度 值。
[0053] (e)判断是否满足算法终止条件。可通过设置最大进化代数或算法在连续多少代 以后解的适应度无明显变化时算法终止。
[0054] (f)如果满足算法终止条件,输出最优个体,即最佳的预测表达式,利用该预测表 达式对短椭圆弧观测数据进行双向有限长预测。然后结束程序。
[0055] (g)如果不满足算法终止条件,确定保存策略。如:可最优保存策略
[0056] (h)进行遗传操作。包括:选择操作、插串操作、重组操作、变异操作。
[0057] 不同于设置变异率Pm(g)为一常量,本发明提出一种自适应的Pm(g)定义方法:
[0058] Pm(g)=Pm〇(l+a)
[0059] 变异调节系数
,PmQ为预设变异率,f(g-l)为上一代的最佳适应度 值,f(g)为当前一代的最佳适应度值,NS为连续未进化的代数。这样在算法进化初期,以8_ 1)<汽8)具=0,则?"(8)=?"〇;进化的中后期4(8-1)^^(8),队>0,则?"(8)>?"(),且随着 未进化代数N s的增大,Pm(g)持续变大。
[0060] (i)经过各种遗传算子的操作,产生新一代种群。转步骤(C)。
[0061] (3)椭圆弧加权最小二乘算法的实现
[0062] 假设按照上述两个步骤得到的预处理后的短椭圆弧观测数据为(Xl y〇i = l, 2,...K,一共有K组观测数据。
[0063] (a)采用"五点定椭圆"法得到〔组椭圆弧参数。
[0064] (b)计算每组椭圆弧的中心到坐标原点的距离:
[0066] 这里,(x〇i,y〇i)表示第i组椭圆弧的中心坐标。采用中值估计法则,选择rmed = med (roi)所对应的椭圆弧参数作为初始的椭圆弧参数。
[0067] (c)假设r。服从正态分布,估计得到其归一化的概率密度函数。
[0069] 这里,u为均值,〇为标准差。
[0070] (d)按照3〇原则,对于那些分布在[u-30u+3 0]之外的数据样本,认为它们是粗大误 差,置相应的权重系数为零,予以剔除。对于那些分布在[u-30u+30]之内的数据样本,根据 得到的概率密度函数,赋予相应的权重系数。
/;,. e [u -3(7 U + 3<j] 其它
[0072] (e)定义椭圆弧的加权最小二乘目标函数。 K ,2
[0073] f{A, B, C,Z).S F) = ^ + Bxiy, + Cy; + Dx, + Eyt + F]
[0074] (f)采用经典的Levenberg-Marquardt(LM)迭代算法,对目标函数进行求解,得到 最终的短椭圆弧参数。选择由中值估计算法得到的椭圆弧初始估计参数作为LM算法的迭代 初始值,这样可以有效加速LM算法的收敛速度。
【主权项】
1. 一种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合方法,其特征在于:包括以 下步骤:(1)采用小波域阈值滤波的方法对短椭圆弧观测数据进行去噪处理;提出利用混合 阈值函数来估计小波系数,对小波阈值函数定义中的调节系数、阈值由遗传算法得到其最 佳值; (2) 构建GEP预测模型,利用提出的变异率自适应定义方法,对短椭圆弧观测数据进行 双向有限长预测; (3) 利用"中值估计"的思想,确定短椭圆弧加权最小二乘拟合算法目标函数中的加权 系数; (4) 采用加权最小二乘拟合算法对预测后的观测数据进行拟合,得到椭圆弧的特征参 数。2. 根据权利要求1所述的一种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合方 法,其特征在于:假设短椭圆弧的一组观测数据为(1 1,71)1 = 1,2...1根据广义时间序列的 定义,可视其为一时间序列y(n),n=l,2. . .N利用Mallat算法实现对y(n)的一维离散小波 变换,得到一组在各个尺度下的小波系数Wj,k,采用混合阈值函数来估计小波系数,其定义 如下:3. 根据权利要求2所述的一种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合方 法,其特征在于:遗传算法寻优的方法来得到最佳的调节系数ao,最优的阈值λ〇,具体步骤如 下: (a) 对调节系数a及阈值λ进行实数编码; (b) 初始化群体; (c) 定义适应度函数,并计算每一个个体的适应度值,定义适应度函数为:为均方根误差,y(n)为原始信号为去 噪后信号; (d) 设定算法终止条件:目标函数f<e〇(如:ε〇 = 10-5),或者限定最大进化代数;如果算 法满足终止条件,则输出最优调节系数、最佳阈值,依据定义的混合阈值函数得到估计小波 系数,小波重构便得到滤波后的数据; (e) 否则,对种群进行遗传算法操作,包括:选择、交叉、变异,选择算子采用最优保存策 略,交叉算子采用两点交叉法,变异算子采用高斯变异算子,并设定种群的交叉率、变异率; 估计小波系数,小波重构,转步骤(c)。4. 根据权利要求1所述的一种基于基因表达式编程(GEP)双向预测的短椭圆弧拟合方 法,其特征在于:基于GEP算法的短椭圆弧观测数据双向有限长预测步骤及方法如下所述: (a) 输入去噪后的短椭圆弧观测数据; (b) 定义函数集{ +,-,*,/,Q}、终端符合集{X,y},设置GEP参数,包括:函数集、连接函 数、基因头部长度、基因数目、种群大小、选择策略、变异率、IS插串率、IS元素长度、RIS插串 率、RIS元素长度、基因插串率、单点重组率、两点重组率、基因重组率;产生初始种群;对每 一个染色体进行等长线性字符串编码; (C )对每一个染色体进行解码操作; (d) 定义适应度函数,这里采用相对误差的定义形式,计算每一个染色体的适应度值; (e) 判断是否满足算法终止条件; (f) 如果满足算法终止条件,输出最优个体,即最佳的预测表达式,利用该预测表达式 对短椭圆弧观测数据进行双向有限长预测,然后结束程序; (g) 如果不满足算法终止条件,确定保存策略; (h) 进行遗传操作,包括:选择操作、插串操作、重组操作、变异操作; 不同于设置变异率Pm(g)为一常量,提出一种自适应的定义方法:Pm(g)=PmQ(l+a),:,PmQ为预设变异率,f(g-l)为上一代的最佳适应度值,f(g) 为当前一代的最佳适应度值,NS为连续未进化的代数,这样在算法进化初期,f(g_l)<f (g),Ns = 0,则 Pm(g)=Pm〇;进化的中后期,f(g-l)~f(g),Ns>0,则 Pm(g)>Pm〇,且随着未进化 代数Ns的增大,P m(g)持续变大; (i) 经过各种遗传算子的操作,产生新一代种群;转步骤(c)。
【文档编号】G06F19/00GK105930648SQ201610240893
【公开日】2016年9月7日
【申请日】2016年4月15日
【发明人】费致根, 苏锦, 贾玉珍, 徐小洁, 袁东锋
【申请人】郑州轻工业学院
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1