基于局部流形学习构图的高光谱遥感图像半监督分类方法

文档序号:6634436阅读:262来源:国知局
基于局部流形学习构图的高光谱遥感图像半监督分类方法
【专利摘要】本发明公开了一种基于局部流形学习构图的高光谱遥感图像半监督分类方法,实现步骤为:(1)准备训练样本集,包括少量的带标记数据和大量的无标记数据;(2)基于光谱角制图这种距离度量方法,对训练样本集中的每个样本点选择k个最近邻点;利用局部流形学习算法,得到图结构中各连接点之间的权值,计算图邻接矩阵,得到对应的图结构;基于图邻接矩阵,基于GFHF算法对无标记数据进行分类;(3)利用GFHF的泛化算法对图像中其他数据点进行分类。本发明将局部流形学习降维算法和半监督分类算法这两种应用广泛的算法通过“图”联系起来,对多种高光谱遥感数据分类都表现出较好的适用性,能够明显提高高光谱遥感图像的分类精度。
【专利说明】基于局部流形学习构图的高光谱遥感图像半监督分类方法

【技术领域】
[0001] 本发明属于遥感图像处理【技术领域】,具体涉及一种基于局部流形学习构图的半监 督分类方法,用于高光谱遥感图像分类。

【背景技术】
[0002] 利用遥感图像进行地物分类是根据获取的遥感信息对地物的物理属性进行识别, 分类结果可以清晰反映地物的空间分布,以进行专题地图的制作,并便于人们从中认识和 发现规律,辅助决策。地物分类在农业监测,土壤调查,矿物填图,以及城市环境监测等方面 都有重要的应用。
[0003] 高光谱遥感是具有高的光谱分辨率的遥感科学和技术,它具有"图谱合一"特性, 将代表地物性质的光谱和确定地物空间的图像结合在一起,能够获取地球表面丰富的光谱 和空间信息,使得在传统多光谱遥感中不可识别的地物,在高光谱遥感中能够被识别。因 此,高光谱遥感可以获取地物丰富的细节信息,鉴别地物间微小的差别,凭借其对地物属性 的准确描述成功应用于地物的精细分类。
[0004] 利用高光谱遥感图像进行地物分类面临的一个主要问题是分类方法通常需要足 够数量的标记数据,但是对高光谱图像获取类别标记数据,是一项耗时耗力,成本高昂的工 作,所以研究标记样本数量少情况下的半监督分类算法具有重要意义。基于图的半监督分 类算法综合利用少量带标记数据和大量无标记数据进行分类,能够明显提高标记数据少情 况下的分类效果。该算法假设分类函数在数据流形上是平滑的,其中数据流形由图表示。图 结构中数据点之间连接权值(简称"图权值")的设置是算法的关键,具有高的连接权值的 点更有可能属于同种地物类别。对于图权值设置这一关键问题,目前还没有被充分和深入 研究。
[0005] 在高光谱遥感图像分类中,目前主要使用热核函数(Heat Kernel, HK)计算图 权值,但是这种权值只能反映两点之间的关系,没有充分利用数据点所在邻域的局部结 构信息。在机器学习领域,2008年,有学者提出基于非负局部线性重构(Local Liner Reconstruction, LLR)的图权值计算方法(F. Wang and C. Zhang, "Label propagation through linear neighborhoods, ^IEEE Transactions on Knowledge and Data Engi neering, vol. 20, no. 1,pp. 55-67, Jan. 2008.),考虑了数据局部结构信息,但是对权值 进行非负约束,可能使得位于流形边界上的点的重构效果不好。2009年,Yan提出基于 稀疏表达(Sparse Representation, SR)的图权值计算方法,但是由于需要全局求解重 构权值,所以计算量大(S. Yan and H. Wang, "Semi-supervised learning by sparse representation, "in Proceedings of SIAM International Conference on Data Mining ,Nevada, USA, Apr. 2009, pp. 792-801.) 〇


【发明内容】

[0006] 为了解决现有技术的不足,本发明提供了一种基于局部流形学习构图的高光谱遥 感图像半监督分类方法,能够表示数据之间的非线性关系,其对应的图结构能够很好地描 述数据流形结构。同时,特别是在标记样本非常少的情况下,有效利用无标记数据来提高分 类精度。
[0007] 本发明为解决其技术问题所采用的技术方案是:提供了一种基于局部流形学习构 图的高光谱遥感图像半监督分类方法,具体包括以下步骤:
[0008] (1)选取训练数据集X以及测试数据集Xt,所述训练数据集X包括标记数据集X m和无标记数据集Xu:
[0009] 其中Xm是高光谱遥感图像中的m个标记数据点的集合,Xm的标记信息Y m用大小为 CXm的矩阵表示,C为地物类型的类别数量,Ym中第i行第j列元素的值Yu用来指示第j 个标记数据点,如果第j个标记数据点属于第i类,那么Yij = 1,否则Yij = 0 ;
[0010] Xu是高光谱遥感图像中随机选择的部分无标记数据点的集合,数量为u,u?m ;
[0011] 所述测试数据集Xt为高光谱遥感图像中Xu以外的其它无标记数据点的集合;
[0012] (2)计算无标记数据集Xu的分类结果Fu :
[0013] 对于训练数据集X中每一个数据点xa,Xa e X,基于光谱角制图距离度量方法搜 索xa的k个光谱特征最相似的近邻点;训练数据集X中有m+u个数据点,xa的邻域表示为 N(Xa),邻域中包含k个近邻点;
[0014] 利用LLE或LTSA局部流形学习算法,分别计算Xa与训练数据集X中的其他数据 点xb的连接权值Wab,以得到图的邻接矩阵W ;
[0015] 采用GFHF算法,利用图的邻接矩阵W计算无标记数据集Xu的分类结果F u ;
[0016] (3)计算测试数据集Xt的分类结果Ft :
[0017] 对于测试数据集Xt中的每一个数据点X(l,X(l e Xt,基于光谱角制图距离度量方法 在训练数据集X中选择其k个光谱特征最相似的近邻点,Xtl的邻域表示为N(Xtl),邻域中包 含k个近邻点;
[0018] 利用LLE或LTSA局部流形学习算法,分别计算Xtl与训练数据集X中的其他数据 点xa的连接权值WQa,
[0019] 采用GFHF的泛化算法利用各连接权值计算测试数据集Xt的分类结果Ft。
[0020] 进一步的改进是,步骤(2)中,将局部流形学习算法图结构对应的图拉普拉斯矩

【权利要求】
1. 一种基于局部流形学习构图的高光谱遥感图像半监督分类方法,其特征在于具体包 括以下步骤: (1) 选取训练数据集X以及测试数据集Xt,所述训练数据集X包括标记数据集xm和无 标记数据集xu: 其中xm是高光谱遥感图像中的m个标记数据点的集合,Xm的标记信息Ym用大小为CXm的矩阵表示,C为地物类型的类别数量,Ym中第i行第j列元素的值用来指示第j个标 记数据点,如果第j个标记数据点属于第i类,那么=1,否则=0 ; Xu是高光谱遥感图像中随机选择的部分无标记数据点的集合,数量为u,u?m; 所述测试数据集Xt为高光谱遥感图像中Xu以外的其它无标记数据点的集合; (2) 计算无标记数据集Xu的分类结果Fu: 对于训练数据集X中每一个数据点xa,xaeX,基于光谱角制图距离度量方法搜索xa的k个光谱特征最相似的近邻点;训练数据集X中有m+u个数据点,xa的邻域表示为N(xa),邻 域中包含k个近邻点; 利用LLE或LTSA局部流形学习算法,分别计算xa与训练数据集X中的其他数据点xb 的连接权值Wab,以得到图的邻接矩阵W; 采用GFHF算法,利用图的邻接矩阵W计算无标记数据集Xu的分类结果Fu ; (3) 计算测试数据集Xt的分类结果Ft: 对于测试数据集Xt中的每一个数据点X(l,X(leXt,基于光谱角制图距离度量方法在训 练数据集X中选择其k个光谱特征最相似的近邻点,X(l的邻域表示为N(X(I),邻域中包含k 个近邻点; 利用LLE或LTSA局部流形学习算法,分别计算X(l与训练数据集X中的其他数据点xa 的连接权值WQa, 采用GFHF的泛化算法利用各连接权值计算测试数据集Xt的分类结果Ft。
2. 根据权利要求1所述的基于局部流形学习构图的高光谱遥感图像半监督分类方法, 其特征在于:步骤(2)中,得到图的邻接矩阵W,将局部流形学习算法图结构对应的图拉普 拉斯矩阵L分成四部分
,其中L=I-W,I表示单位矩阵,则通过以下公式计 算无标记数据集Xu的分类结果Fu:
3. 根据权利要求1或2所述的基于局部流形学习构图的高光谱遥感图像半监督分类 方法,其特征在于:步骤(2)中,若\和&互为近邻点,或者\和&不互为近邻点,但\或 xb均是第三个数据点&的近邻点,则xa和xb之间存在连接关系,利用LLE局部流形学习算 法,通过以下公式分别计算xa与xb的连接权值Wme;)ab :
其中,的k个近邻点中包含xa和xb,Sab表示xa被其近邻点xb线性重构的系数,通过 以下公式计算:
其中N(xa)表示xa的邻域。
4. 根据权利要求3所述的基于局部流形学习构图的高光谱遥感图像半监督分类方法, 其特征在于:步骤(3)中,根据GFHF泛化算法,通过以下公式计算点X(l的分类结果& :
其中fa表示X。的一个近邻点xa的GFHF分类结果,Wme;)(la表示xa和X。之间的权值,权 值Wai6)(la利用LLE局部流形学习算法,通过以下公式计算: W(lle)〇a - S〇a... (5) 其中表示近邻点\对测试点X(l的线性重构系数,通过以下公式计算:
其中NUd)表示X。的邻域。
5. 根据权利要求1或2所述的基于局部流形学习构图的高光谱遥感图像半监督分类 方法,其特征在于:步骤(2)中,若\和&互为近邻点,或者\和&不互为近邻点,但\或 xb均是第三个数据点&的近邻点,则xa和xb之间存在连接关系,利用LTSA局部流形学习 算法,通过以下公式分别计算各个数据点xa的连接权值Watsa)ab:
其中,N〇〇表示所有包含\或&的邻域,是最大d个特征值所组成的对角矩阵,d表示特征值的数量,9?和分别是\和&在N〇〇中的局部切空间坐标,通过以下方 法求取: 首先统计N〇〇中k个数据点的协方差矩阵,然后对协方差矩阵进行特征分解,保留最 大的d个特征值对应的特征向量,该特征向量即为k个数据点的局部切空间坐标。
6. 根据权利要求5所述的基于局部流形学习构图的高光谱遥感图像半监督分类方法, 其特征在于:步骤(3)中,根据GFHF泛化算法,通过以下公式计算点X(l的分类结果& :
其中fa表示xa的GFHF分类结果,Watsa)(la表示xa和X(l之间的权值,权值Wmsa)(la利用 LTSA局部流形学习算法,通过以下公式计算:
其中,是N(X(I)内k个数据点的协方差矩阵进行特征分解得到的最大d个特征值所 组成的对角矩阵,和0a分别表示在NOO中求取的X(^Pxa的局部切空间坐标,通过以 下方法求取: 首先统计N(X(I)中k个数据点的协方差矩阵,然后对协方差矩阵进行特征分解,保留最 大的d个特征值对应的特征向量,该特征向量即为k个数据点的局部切空间坐标。
【文档编号】G06K9/62GK104408466SQ201410651950
【公开日】2015年3月11日 申请日期:2014年11月17日 优先权日:2014年11月17日
【发明者】马丽, 杨孝全, 张晓锋, 吴让仲, 罗大鹏 申请人:中国地质大学(武汉)
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1