基于模糊聚类的有效性指标的图像分割方法与流程

文档序号:11201263阅读:738来源:国知局
基于模糊聚类的有效性指标的图像分割方法与流程
本发明属于数据挖掘领域,具体地说是一种基于模糊聚类的有效性指标的图像分割方法。
背景技术
:模糊c均值聚类是模糊聚类中使用最广泛的算法,对该算法也进行了大量的研究。通过大量的研究已知,没有一种聚类方法可以得到所有集合的最优划分;其次,很多聚类算法要事先输入聚类数,然而通常在聚类之前一个数据集的最优划分数目是未知的。通过聚类有效性指标获得最佳聚类数的过程是一种迭代的过程,通过不断改变不同的聚类初始值c,计算对应的每种划分的有效性指标值,最后分析比较得到的指标值的大小和变化,通常最值处对应最佳聚类数。也可以运用聚类有效性指标比较不同聚类算法之间的优劣,对某个数据集,固定聚类数等参数运行不同的算法,比较对应的有效性指标值可以反映算法的性能,性能好的算法可以更好的对图像进行分割。聚类有效性指标可以分为三类:内部有效性指标、外部有效性指标和相对有效性指标。rezaee在1998年提出了通过比例因子对xb指标中的紧凑度和分离度进行缩放,采用线性组合的方式获得新指标,虽然在整体性能上有了提高,但指标的结构复杂,且会出现与事实相背离的判断,性能不稳定。此后,有人不断地对该指标进行改进和完善,但是导致改进后的指标过于复杂,计算效率变低。2004年,pakhira等人提出了pbmf指标,这是一个能同时评价硬聚类和模糊聚类结果的有效性指标,该指标由三个因子组成,当类的数量较少时,第二和第三个因子发挥较大的作用,当类的数量增加时,第一个因子作用愈发明显,该指标没有充分考虑数据集的重叠。2011年h.lecapitaine等提出了osi指标,该指标为每个数据点的度量使用多个集群和分离方法,都是积于成员的聚合程度,该指标虽然考虑了数据集之间的重叠,但是,计算方法过于复杂和繁琐,使得时间复杂度和空间复杂度都很大。2015年,chih-hungwu等人提出了wli指标,很好的解决了现有指标的不足,但是对于数据结构复杂和大小集群的数据集不能达到很好的效果;2016年赵娜娜、钱雪忠等人提出了基于紧致性、重叠度和分离性的有效性指标cso,该数据集实现了对类间有交叠子类的数据集最佳聚类数的判断,但是该指标对于海量高维数据集和具有特殊形状的数据集没有取得良好的效果。技术实现要素:本发明为了克服上述现有技术存在的不足之处,提出一种基于模糊聚类的有效性指标的图像分割方法,以期能对像素点集合进行准确的划分,且适用于复杂、重叠、有噪声点的像素集合,从而能对图像进行良好的分割。为了实现上述发明目的,本发明采用如下技术方案:本发明一种基于模糊聚类的有效性指标的图像分割方法的特点是按如下步骤进行:步骤1、利用模糊c均值聚类算法对任意一幅图像x中的像素点集合{x1,x2,…,xn}划分为c个类,初始化c=2,并获得隶属度矩阵u={uij|i=1,2,…,c;j=1,2,…,n}和聚类中心v={v1,v2,···,vi,···,vc};uij表示第j个像素点xj隶属于第i个类的隶属度值,且0≤uij≤1;vi表示第i个类的聚类中心,j∈[1,n],i∈[1,c],步骤2、利用式(1)建立目标函数jfcm:式(1)中,dij表示第j个像素点xj与第i个类的聚类中心之间的距离;表示第j个像素点xj属于第i类的隶属度的m次幂,m为加权指数,表示聚类模糊程度;步骤3、设定最大的迭代次数为m,迭代的终止条件误差为ε,给定聚类数目为c,且令初始迭代次数k=0,则以隶属度矩阵u和聚类中心v作为初始隶属度矩阵u0和初始聚类中心v0;步骤4、利用式(2)更新第k次迭代的隶属度值从而得到第k次迭代的隶属度矩阵:式(2)中,表示第k次迭代中第j个像素点xj与第s个类的聚类中心之间的距离;步骤5、利用式(3)更新第k次迭代的第i个聚类中心从而得到第k次迭代的聚类中心vk:步骤6、如果||vk-vk-1||<ε,则停止迭代,否则令k+1赋值k后,返回步骤4,直到k=m为止;步骤7、利用式(4)计算c个类的类内紧致性com(c):步骤8、利用式(5)计算c个类的类间分离性sep(c):式(6)中,表示c个类的平均聚类中心,vr表示第r个聚类中心;步骤9、利用式(6)获得c个类的有效性指标vfgy(c):步骤10、将c+1赋值给c,并判断是否成立,若成立,则表示获得所有类的有效性指标,并执行步骤11;否则,返回步骤1执行;步骤11、比较所有类的有效性指标,并选择最大有效性指标所对应的聚类数和相应的隶属度矩阵对图像进行分割,从而得到图像分割结果。与已有技术相比,本发明的有益效果体现在:1、本发明采用分离性和紧凑性比例因子方法,集中了模糊聚类(fcm)指标方法的优点,同时减少了分类数较多对于实验结果的影响,使聚类结果更加准确。2、本发明通过计算每个类的聚类中心和平均聚类中心之间的距离和两个类之间最小聚类中心距离的处理步骤,解决了现有指标普遍对数据结构复杂和集群大小差异悬殊的数据集的分类结果不准确的问题,并能够在复杂分散的数据集中兼顾集群和个别数据,也充分考虑了数据集各个聚类中心的位置。3、本发明通过模糊聚类方法,能更加准确的判断聚类数,不同聚类中心之间的距离对分类准确性的影响力也越来越小,因此,本方法比其他方法更适合于多维和分布复杂的数据集。附图说明图1为本发明方法流程图;图2a为本发明二类原图像;图2b为本发明二类噪声图像;图2c为本发明二类分割图像;图3a为本发明三类原图像;图3b为本发明三类噪声图像;图3c为本发明三类分割图像;图4a为本发明自然图像原图像;图4b为本发明自然图像噪声图像;图4c为本发明自然图像分割图像;图5a为本发明mr脑图像原图像;图5b为本发明mr脑图像噪声图像;图5c为本发明mr脑图像分割图像。具体实施方式本实施例中,如图1所示,一种基于模糊聚类的有效性指标的图像分割方法是按照如下步骤进行:步骤1、利用模糊c均值聚类算法对任意一幅图像x中的像素点集合{x1,x2,…,xn}划分为c个类,初始化c=2,并获得隶属度矩阵u={uij|i=1,2,…,c;j=1,2,…,n}和聚类中心v={v1,v2,···,vi,···,vc};uij表示第j个像素点xj隶属于第i个类的隶属度值,且0≤uij≤1;vi表示第i个类的聚类中心,j∈[1,n],i∈[1,c],步骤2、利用式(1)建立目标函数jfcm:式(1)中,dij表示第j个像素点xj与第i个类的聚类中心之间的距离;表示第j个像素点xj属于第i类的隶属度的m次幂,m为加权指数,表示聚类模糊程度;本实施例中,m=2;j值最小得到的聚类中心是最优的,图像分割的效果也是最好的,图2a是二类图像的原图像,图2b是添加10%的椒盐噪声之后的图像,图2c是fcm算法对二类图像的分割效果;图3a是分为三类的原始图像,图3b为添加10%高斯噪声后的图像,图3c为fcm算法对三类图像的分割效果;试验中参数的设置,m在试验中设置范围介于1.5到2.5之间浮动设置,本发明设置为2,窗口大小设置为3×3,通过本发明的运行过程可以得到基于模糊聚类的有效性指标的图像分割方法要明显优于传统技术上的模糊c均值聚类算法。步骤3、设定最大的迭代次数为m,迭代的终止条件误差为ε,给定聚类数目为c,且令初始迭代次数k=0,则以隶属度矩阵u和聚类中心v作为初始隶属度矩阵u0和初始聚类中心v0;步骤4、利用式(2)更新第k次迭代的隶属度值从而得到第k次迭代的隶属度矩阵uk:式(2)中,表示第k次迭代中第j个像素点xj与第s个类的聚类中心之间的距离;步骤5、利用式(3)更新第k次迭代的第i个聚类中心从而得到第k次迭代的聚类中心vk:步骤6、如果||vk-vk-1||<ε,则停止迭代,否则令k+1赋值k后,返回步骤4,直到k=m为止;步骤7、利用式(4)计算c个类的类内紧致性com(c):步骤8、利用式(5)计算c个类的类间分离性sep(c):式(6)中,表示c个类的平均聚类中心,vr表示第r个聚类中心;表1本发明在wdbc实验数据表指标2类3类4类5类6类7类8类9类10类pc0.8960.7920.7690.7400.6980.6920.6700.5910.418xb10.9096.1463.5242.3931.8281.4181.1871.0931.001sc0.1690.0990.0360.0250.0190.0150.0130.0150.132pbm9.85921.84787.690140.842181.280238.340264.980245.661234.489wy4.9257.22731.18040.56540.68052.79753.18755.12359.637pbmf1557.2111893.2162794.0372949.1413213.0343214.7803281.0963321.8913456.153dunn0.0170.0060.0090.0040.0050.0040.0030.0020.001sci1.2291.1762.5372.5482.3552.3091.9541.8921.713mb12.41511.18420.44019.14717.72916.04314.22713.32211.234wli8.46018.44414.29716.20617.96620.65717.58911.3367.998fgy0.0340.0160.0120.0110.0090.0070.0050.0020.001wdbc数据库由569个数据样本组成,每个样本又包含30属性,参考聚类数为2,该数据集的维数很多,大多数指标判断的划分结果是错误的;而且存在两个类之间聚类中心距离很小的情况,导致分割不准确,而本发明的指标采用了平均聚类中心和任意两个类之间聚类中心最小值均参与分离性度量的方法,解决了上述的问题,得到了很好的分割结果。步骤9、利用式(6)获得c个类的有效性指标vfgy(c):步骤10、将c+1赋值给c,并判断是否成立,若成立,则表示获得所有类的有效性指标,并执行步骤11;否则,返回步骤1执行;为了验证所提算法在自然图像下的分割效果,采用最常使用的camerman图像进行实验。图4a自然图像camerman原图像,图4b是自然图像camerman添加10%的椒盐噪声图像,图4c是自然突袭那个的分割图像;参数设置c=3,m=2,a的大小设置为1.0,l设置为5.0,ε设置为0.001,迭代次数100次,窗口大小设置为3×3,从以下的图4a-图4c可以看出,该发明的方法更好地保持图像的细节特征而且对于天空和草地也可以分割出来。图5a-图5c为一个医学图像的例子,其中图5a为mr大脑切叶图像原图像,图5b为mr大脑切叶图像噪声图像,图5c为mr大脑切叶图像分割图像。通过本方法进行处理,也取得了良好的分割效果。步骤11、比较所有类的有效性指标,并选择最大有效性指标所对应的聚类数和相应的隶属度矩阵对图像进行分割,从而得到图像分割结果。表1给出了本文中用于比较的指标在6个数据集中的聚类结果。表2本发明在多个数据集中的实验结果data-yeast数据集是一个复杂的数据集,拥有10个分类,在同等条件下,我们系统的分析一下实验结果可以得到如下结论:指标vpc、vsc的值呈递减,而指标vpe、vsci的值呈递增,取最值的点只能在分类数的两端,我们的实验分类数是从2到15,这说明这四个指标不仅得不到正确的分类结果,而且不能适应该复杂的数据集;vwy、vwli、vpbmf指标在10附近分类数上值有跳跃性变化,甚至可以取得极值,但是它们的最值点均不在正确的分类数上,这说明这些指标对该类型的数据集有一定的处理能力;vxb指标在分类数10的地方取得极值,但是在分类数13的地方突然出现一个跳变的点,且在分类数13上的值大于分类数10的值,因此也没有取得正确的结果;vpbm指标取最值时对应的分类数为11,很接近正确的分类数,说明该指标特性良好;在其他指标均没有得到很好效果的情况下,而新指标vfgy得到了正确的结果,说明新指标具有很好的特性。本发明vfgy指标把iris数据集分为3类,说明该指标实现了有重叠数据的正确聚类;data-habe、data-pima、data-wdbc这三种数据集各自拥有不同的特点,data-habe数据集是一个样本和属性个数相对较少的数据集,data-pima数据集属性个数相对较均衡,样本数量相对大一些,data-wdbc数据集虽然样本数量不是很多,但是样本属性繁多,由此,可以得出vfgy指标具有很强的适应能力。由此,本发明对图像分割可以取得更好的效果。当前第1页12
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1