一种基于局部邻域和全局信息的模糊c均值图像分割方法
【技术领域】
[0001] 本发明涉及基于模糊数学和图像处理领域,特别是一种基于局部邻域和全局信息 的模糊C均值图像分割方法。
【背景技术】
[0002] 图像分割指的是将一幅图像分割成一系列不相交的子区域,且各个区域之间具有 不同的描述符,而区域内具有相似或者相同的特征,这些特征可以是纹理,形状,颜色等。近 年来,随着模糊理论的不断发展和完善,模糊C均值聚类算法(Fuzzy c-means,FCM)作为一 种经典的图像分割算法,已在医学图像处理、目标检测等领域得到了广泛的应用,并且取得 不错的应用效果。模糊C均值分割算法的优势在于它描述简单,而且符合人的视觉感知特 性,且易于实现。相比于其他分割算法,FCM是一种软聚类的算法,它并非只是简单的指出, 哪些像素属于哪一类,而哪些像素属于另外的类,而是采用模糊隶属度来度量,像素划分为 某一类或者某几类的归属程度,该算法可以很大程度上保留原始图像的信息。一般来说,较 理想的图像分割应该具备以下几个条件:
[0003] 1)图像进行自动分割后的若干个区域中,每个区域应该能够很好的描述一个或者 一类关键词。
[0004] 2)具有明显视觉差异的区域所描述的关键词应该具有较大的差异性。
[0005] 3)允许少量背景信息存在,但是主题的描述信息不能被背景信息所淹没。
[0006] 在图像分割中,传统的FCM算法没有包含任何空间信息,导致了其受噪声的影响非 常严重。为了解决上述问题,国内外许多学者从不同的角度考虑了像素的邻域信息,提出了 许多改进的FCM算法。在这些改进的算法中,主要是通过修改传统FCM的目标函数、修改像素 与分割中心相似性的计算方法、或者从局部邻域信息考虑又或者从简单的空间信息考虑, 这样的改进方法相比传统的模糊C均值图像分割算法有了进一步的提高。但是仍然存在的 一个问题,这些改进算法往往会出现只见森林不见树木或者只见树木不见森林,理想的分 割方法应该在局部邻域和空间信息中能够得到一个良好的均衡,这样才能既见树木又见森 林。
【发明内容】
[0007] 有鉴于此,本发明的目的是提出一种基于局部邻域和全局信息的模糊c均值图像 分割方法,以克服现有技术中存在的缺陷,并实现对待测试图片的准确分割。
[0008] 本发明采用以下方案实现:一种基于局部邻域和全局信息的模糊c均值图像分割 方法,具体包括以下步骤:
[0009 ]步骤S1 :选定一个待分割的图像数据集,确定最小分割数Cmin、最大分割数Cmax、加 权因子111、以及误差因子£;其中满足2<(^111<^}^11,11表示的是数据集的过个数,1< 111< 确定图像距离特征空间的度量方式,采用欧式特征空间距离、绝对值特征空间距离、曼 哈顿特征空间距离、卡方特征空间距离以及综合特征空间距离;对待分割的图像的特征向 量进行均衡化处理,并且初始化C = Cmin其中,C表示的是图像的分割数;
[0010] 步骤S2:初始化图像的分割中心Vi(i = l,2. . . .c),并且计算相应的模糊隶属度;
[0011] 步骤S3:根据步骤S2计算新的图像分割中心,并且判断是否达到收敛条件;如果满 足收敛条件的话,则计算当前条件下相应的有效性指标,令c = c+l;如果不满足收敛条件, 则重新迭代计算新的模糊隶属度,并以此计算新的图像分割中心;
[0012]步骤S4:判断当前的分害擞c是否大于cmax,如果满足该条件则对不同分害擞下的 有效性指标进行比较,选择最佳的分割结果;如果此时c<cmax,则返回步骤S2继续执行相应 的条件。
[0013] 进一步地,所述步骤S2具体包括以下步骤:
[0014] 步骤S21:设X = .......表示的是要进行分割的图像集合,X集合中 的每个元素 Xl(l < i <n)称之为图像样本,用若干个参数来描述该图像样本的特征,将特征 向量xi表示为.而=[·%,>%;,·…· ·.··_··%] d%与之相对应的是特征空间中的一个点或者一个 元素,其中Xlj表示的是样本Xl其第j维空间上的一个赋值;假设我们分析的对象是一幅数字 图像,那么此时的X表示的就是整幅图像的像素元素的集合,那么χυ代表的就是像素^在第 j维特征上的值。如果是一幅彩色的数字图像,那么其特征维数有5个维度,包括3个维度的 颜色通道以及2个维度的位置坐标。如果是一幅灰度数字图像,那么其特征维数有3个维度, 包括2个维度的位置坐标以及1个维度的灰度值。建立图像分割分析的一般模型:分析集合 中η个不同的图像样本的特征空间分布情况,根据某特定度量方法,将这η个不同的样本划 分到c个不同的子集,这c个子集相互之间没有交集,用数学的描述方法如下:
[0015]
[0016] 式中Ai(l < i <c)表示不同的子类,此外,用一个隶属函数来表示样本属于其中某 个类别的程度;另外根据实际应用场景的不同,又可以将划分分为硬划分和模糊划分。模糊 划分的实质是:论域中的所有子类中集合不能为空,并且其中的每一个样本都以一定的概 率属于某个子类。我们采用模糊划分:领域中的所有子类中集合不能为空,并且其中的每一 个样本都以一定的概率属于某个子类;用一个模糊矩阵U来表示,其阶数为cXn阶,并且矩 阵中的元素 Uik满足:
[0017] uikE[0,l];
[0018]
[0019]
[0020] 步骤S22:通过选择某个目标函数最小化的准则,通过不断的迭代来确定图像中像 素的模糊隶属度的值,然后分别统计该像素点在隶属度取得最大值的时候其对应的类区 域,最后将其划分到该区域中;所述准则为最小平方误差和,其数学表达式为:
[0021]
[0022] (dik)2= I |xk-vi| 12 = (xk-Vi)TA(xk-vi);
[0023] 在上述的式子之中,样本图像xk到某个分割中心^的特征空间距离用距离dlk来表 示; XdPVl都是P维的特征空间向量,即Vx,vei?p,并且A是一个阶层为pxp的矩阵,T表示 矩阵的转置,矩阵A为对称正定矩阵;特别的,当我们取A=I的时候,上述表示的就是欧式的 特征空间距离,集合中各类样本到所属分割中心特征空间距离的平方和我们用J(U,V)来表 示;分割的准则就是求目标函数的极小值,即min{J(U,V)};
[0024] 步骤S23:矩阵U中的各个列向量之间满足相互独立性,用下列的目标函数表示:
[0025]
; k 二 1 L k-1 /*-1 V
[0026] 上述式子要满足约束条件ΣΧι =1下取得极值,用拉格朗日函数法来求解: /=1
[0027]
[0028] 其中上述函数的最优化条件应该满足:
[0029]
[0030] 1234567
[0031] 通过上述式子可求得:
2 3 4
[0035]将上述的结果带入ust的表达式后有: 5
[0036]
6 为了避免分母出现0的情况,我们应该分情况加以讨论,分析的关键在于dik的取值 可能为〇,因此有,对给定集合Ik和&为: 7 Τι, = ? 1 I 1 <1 1 <1 p H^i, = Π ).
[0039]
[0041]
[0040] 因此,能够满足J (U,V)取得最小的模糊隶属度uik:
[0042] " m ,
[0043] 同样的,采用上述的分析方法,求得当J(U,V)取得最小值的时候^的表达式,由最 dJ(U W) 优化必要条件~ ~ 得到分割中心的表达式: dv::.
[0044]
[0045] 至此,传统的基于模糊C均值图像分割算法,在满足J(U,V)取得最小的情况下,可 以由上述的式子来求得最佳的分割中心和最佳的隶属度矩阵。
[0046] 接下来的步骤是本发明的关键和核心部分,也是区别传统基于模糊C均值图像分 割算法的最大不同点。
[0047] 步骤S24:首先引入全局空间信息:传统模糊C均值图像分割算法,未考虑到不同空 间的样本对整体划分结果的影响。为此我们引入一个空间影响因子,该因子的引入使得划 分的依据不止是样本个体与个体之间的关系,还需要根据个体对整体的一个影响,其目的 在于能够对被污染的数据集或者在噪声环境下具有一定的鲁棒性。用Wk来表示第k个样本 对整体分割的影响程度,wk应该满足关于全局影响因子概的选择至关重要,设 想一下,如果取wk= 1/n的时候,那么该算法就会退化为模糊C均值分割算法。为此,本发明 考虑样本空间之中样本点的密度对划分结果的影响,假设空间中的噪声点比较少,那么其 对应的密度应该比较小,对整体分类的影响的权值应该要比较小,这样的话,即使有少部分 噪声点的存在,但对于整体的分割效果并不会产生实质性的影响,因此本发明从空间密度 分布的角度出发,来定义全局影响因子wk。定义I)# =ii4-g if来表示两个样本点知和处 的特征空间距离,定义全局密度函数%,则全局影响因子%=? , 其中α2 1是一个调节参数;该定义的含义是:集合中的任意图像样本Xk如果是真实可靠的, 那么其应该具有较大的密度分布,对全局的划分结果