基于流形学习的数据降维方法及装置的制造方法

文档序号:9911630阅读:585来源:国知局
基于流形学习的数据降维方法及装置的制造方法
【技术领域】
[0001] 本发明涉及一种数据降维方法及装置,尤其涉及到一种基于流形学习的数据降维 方法及装置。
【背景技术】
[0002] 近年来,随着科技的飞速发展,人们通过各种渠道获得的数据较之以往大大增加, 因此,利用数据降维技术对这些高维数据进行处理,就成了数据处理中必不可少的一个重 要组成部分。传统的降维方法(例如主成分分析、独立成分分析、线性判别分析等)能够有效 地处理具有线性结构的数据集。但当数据集具有非线性结构时,这些方法就难以发现隐藏 在高维数据中的内在低维信息。基于流形学习的数据降维方法假设高维观测数据位于嵌入 到高维欧式空间的低维流形上,因此可以有效地发现和保持在高维空间中呈现扭曲集的内 在几何结构。作为拉普拉斯特征映射的线性化版本,局部保持投影(LPP)算法在人脸识别中 取得了一定的成功,这主要就是由于它面对高维扭曲额人脸数据集可以有效地保持人脸所 在的流形结构。
[0003] 但是LPP算法在实际的人脸识别系统中,特别是面对复杂环境和海量人流应用时 存在以下不足:
[0004] 首先,在以往的LPP算法中,是将整幅人脸图像作为一个整体考虑,而最近的研究 表明,人脸由于光照条件、面部表情等因素引起的变化,往往只体现在图像的部分区域,BP 出现局部数据分散的情况,而其它部分的变化很少甚至无变化,因此,如果在LPP算法中将 整幅人脸图像作为一个整体,这种局部变化就必然会对识别结果产生很大影响。
[0005] 其次,LPP算法用高维向量表示图像数据的时候,遇到奇异矩阵的时候计算复杂度 会随着图像维数的增加呈指数增长,这必然大量耗费了计算资源和降低了算法的运行速 度,导致整个系统性能降低。
[0006] 在"基于流形学习的数据降维方法及其在人脸识别中的应用,王建中,2010年6月" 这篇文献中,尽管对上述缺点进行了实现,比如将人脸进行等大小的划分,然后使用LPP算 法对人脸图像数据的降维处理,在使用最近邻分类算法对人脸图像分类以及使用加权的方 法对人脸图像进行识别,但是仍然存在一些不足,本申请就是在此基础上,对其做进一步的 改进。

【发明内容】

[0007] 为了克服现有技术的不足,本发明的目的提供一种基于流形学习的数据降维方法 及装置,使人脸图片保留更多的关键特征信息,并应用于人脸识别系统中提高识别的精确 度,降低了整个系统的消耗。
[0008] 为解决上述问题,本发明所采用的技术方案如下:
[0009] 本发明公开了一种基于流形学习的数据降维方法,包括以下步骤:
[0010] S101:将待检测人脸图像对安照一定的规则划分为K个子图像,然后将K个子图像转 化为相对应的子模式,将所述子模式的向量记为Xi(i = l,2,…,K);
[0011] S102:根据公式YFWjXi求出Yi;所述Yi是Xi的低维向量表示,所述WiT是通过最大 间距准则和局部保持投影算法推导得出;
[0012] S103:根据最近邻分类算法为待检测人脸图像X对其子模式的低维向量¥1进行分 类,依据训练集中的K个子模式集合,共得到K个识别结果;所述训练集是依据所述规则划分 为K个子模式集合的预设的人脸图像的集合;
[0013] S104:依据加权的方法,将K个识别结果进行计算后得到所述待检测人脸图像X属 于第c个人的可能性为:
[0014]
[0015] 然后得出待检测人脸图像X的识别结果为:Identity(X) =argmax(pc);
[0016] 其中所述的Wgl是第i个子模式集合的识别权值,其计算公式为
其中是为所述训练集中第i个子模式集合的每一个样本的近邻中和其处于同类的样 本的个数,所述Xu是所述训练集中第i个子模式集合的一个样本,所述样本是指每一个子模 式集合的向量的坐标表示;j的取值在1到N之间,N是指所述训练集中预设人脸图像的总个 数。
[0017] 进一步,所述规则为将人脸图像等条纹划分。
[0018] 进一步,所述WJ是通过最大间距准则和局部保持投影算法推导得出的具体步骤 是:
[0019] 根据最大间距准则和局部保持投影算法相结合得到新的局部保持投影算法的目 标公式为:
[0020]
其中D是对角矩阵,L、D都是已知的;m是所有训练集中的所有样本的平均向量,ΠΗ是所述训 练集中第i类子模式的所有样本的平均向量,Sb是类间散步矩阵,Sw是类内散步矩阵,m属于 所述训练集中第i类子模式的样本个数;i的取值为1到K之间;由此公式可得WJ的唯一确定 值。
[0021] 本发明还公开了一种基于流形学习的数据降维装置,其特征在于,包括以下装置:
[0022] 划分模块,用于将待检测人脸图像对安照一定的规则划分为K个子图像,然后将K个 子图像转化为相对应的子模式,并将所述子模式的向量记为Xi(i = l,2,…,K);
[0023] 数据降维模块,用于通过公SYpWjXi求出Υ1;所述低维向量表示,所述 W/是通过最大间距准则和局部保持投影算法推导得出;
[0024] 分类识别模块,用于根据最近邻分类算法为待检测人脸图X对其子模式的低维向 量¥1进行分类,并依据训练集中的K个子模式集合共得到K个识别结果;所述训练集是依据 所述规则划分为K个子模式集合的预设的人脸图像的集合;
[0025] 获取识别结果模块,依据加权的方法,将K个识别结果进行计算后得到所述待检测 人脸图像X属于第c个人的可能性为:
[0026] ▲人.J=;.
[0027] 然后得出待检测人脸图像X的识别结果为:Identity(X) =argmax(pc);
[0028]其中所述的Wgl是第i个子模式集合的识别权值,其计算公式为:
其中是为所述训练集中第i个子模式集合的每一个样本的近邻中和其处于同类的样 本的个数,所述Xu是所述训练集中第i个子模式集合的一个样本,所述样本是指每一个子模 式集合的向量的坐标表示;j的取值在1到N之间,N是指所述训练集中预设人脸图像的总个 数。
[0029]进一步,所述规则为将人脸图像等条纹划分。
[0030] 相比现有技术,本发明的有益效果在于:本发明采用等条纹的方式来划分人脸图 像,这种划分方式能够极大保留人脸各部分的纹理结构,进而保留了关键特征信息。同时将 最大间距准则运用到局部保持投影算法中,还结合最近邻分类算法得出人脸图像的识别结 果,比现有传统的LPP算法的识别准确率更高,同时提高了传统LPP算法的计算效率,降低了 系统消耗;系统的识别精度高达90%以上,满足了复杂环境下的识别要求。
【附图说明】
[0031] 图1是本发明提供的一基于流形学习的数据降维方法的流程图;
[0032] 图2是本发明提供的一人脸识别智能安防系统的数据处理流程图。
【具体实施方式】
[0033]下面,结合附图以及【具体实施方式】,对本发明做进一步描述:
[0034] 如图1所示,本发明提供了一种基于流形学习的数据降维方法,包括以下步骤:
[0035] S101:将待待检测人脸图像对安照一定的规则划分为K个子图像,然后将K个子图像 转化为相对应的子模式,所述子模式的向量记为:Xi(i = 1,2,…,K)。
[0036] 所述按照一定的规则划分的方式是将人脸图像等条纹划分,这样的划分方式能够 极大的保留人脸各个部分的纹理结构,从而保留了更多的关键特征信息;同时划分的子图 像数据越低,所计算也就比其他流形数据降维方法要低的多。
[0037] S102:根据公式Y^W^Xi求出Yi;所述Yi是Xi的低维向量表示,其中所述WiT是通过 最大间距准则和局部保持投影算法推导得出。
[0038] 本步骤中,公式是指将高维空间数据到低维空间数据之间的映射。对于 局部保持投影算法(LPP)的目标函数为:
[0039]
(a)嗔中Sjk为Xij和X ik的相似度。
[0040] 最大间距准则(MMC)是将原始样本投影到低维子空间中,使得同类别数据样本更 加紧凑,不同类别的数据样本尽可能地分开;其转换后要求在低维空间内保持类间距离最 大化。则MMC的目标函数是:
[0041] J=maxtr(Sb-Sff) (b),
[0042] 其中,
,111是所有训练集中 的所有样本的平均向量,mi是所述训练集中第i类子模式的所有样本的平均向量,Sb是类间 散步矩阵,Sw是类内散步矩阵,m属于所述训练集中第i类子模式的样本个数;所述样本是指 所述训练集中的每一个子模式中的一个样本,也即是指每一个子模式中的向量的坐标表 示,对于每一个子模式都是一个样本集;i的取值为1到K之间;所述样本是指子图像中的向 量的坐标表示。
[0043] 在本发明所述方法中,将MMC应用到LPP算法中,也即是公式(b)应用到LPP算法公 式(a)中得出新的LPP的目标公式:
[0044]
[0045] 其中D是对角矩阵,L、D是已知的。以上推导过程是本领域技术人员能够很好的推 导出来的,这里不再详细叙述。
[0046] 从(c)公式中能够唯一确定WiT的值;
[0047] 为了唯一地确定W/,用拉格朗日橙子求(c)
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1