一种人脸图像的年龄估计方法
【专利摘要】本发明的一种人脸图像的年龄估计方法,该方法包括五个部分:(1)图像的分块;(2)用PCA算法学习分块处理后的矩阵得到卷积操作的卷积核;(3)然后用PCA算法学习得到的卷积核进行卷积操作;(4)用二值化的方式在第二个卷积层后面进行非线性处理;(5)用直方图统计的方法进行特征抽取。该方法提取特征后用非线性支持向量回归K?SVR(Kernel function Support Vector Regression)来估计年龄值,经过实验表明可以大大提高年龄估计的准确率。
【专利说明】
-种人脸图像的年龄估计方法
技术领域
[0001] 本发明设及人脸年龄估计领域,特别是一种基于深度学习模型的人脸图像的年龄 估计方法。
【背景技术】
[0002] 在人脸年龄自动估计系统中,通常分为两个阶段,第一个阶段是提取年龄特征,第 二个阶段是估计年龄,通常研究的重点是如何提取到最佳的年龄特征。现有年龄估计系统 中,学习或提取年龄特征的方法一般可W分为手动提取年龄特征和自动学习年龄特征。手 动提取年龄特征具有代表性的方法有18?化〇。日16111日巧?日11日^3,1^8?)、5^1'(5。日16- Invariant FeaUire Transform,SIFT)、子空间模型等,手动提取特征存在的缺点为受到人 为主观选择的影响。尽管手动选择特征在某些领域可能取得非常好的效果,主要是因为可 W针对某一特定的数据类型选择适应的特征,但是面对着新的数据或者新的条件下,手动 选择特征方式不一定能适合,所W运种方法很难适应实际中的应用。
[0003] 近今年来兴起的深度学习,也用来学习或提取年龄特征。深度学习是机器学习中 的一个领域,其动机在建立、模拟人脑进行分析的神经网络,它模仿人脑的机制来解释数 据。深度学习结构含有多隐层,其通过组合低层特征形成更加抽象的高层表示属性类别或 特征,W发现数据的分布特征表示。但现有的深度学习结构当隐层数增多时参数急剧增加, 对运算性能提出了较高的要求。运也是在使用深度学习所面临和需要解决的问题。
【发明内容】
[0004] 本发明的主要目的在于克服现有技术中的上述缺陷,提出一种基于深度学习 DLPCA化t模型的人脸图像的年龄估计方法,该方法能够提供一种高效的学习年龄特征,有 效的解决模型参数过多问题,并且实现快速学习和高精度估计年龄。
[0005] 本发明采用如下技术方案:
[0006] -种人脸图像的年龄估计方法,其特征在于:
[0007] 1)将输入的人脸图像进行预处理后,再分块,对每一个块进行去均值化,依次处理 所有输入的人脸图像,从而得到一个包含所有块的大矩阵;
[000引2)用PCA算法从大矩阵中学习得到第一层卷积操作的卷积核;
[0009] 3)将第一层卷积操作后的输出特征maps进行分块和去均值化处理,得到另一大矩 阵,采用PCA算法从该大矩阵中学习得到第二层卷积操作的卷积核;
[0010] 4)将第二层卷积操作后输出的特征maps进行非线性处理;
[0011] 5)把转换后的输出值分成若干块,对每一个块用直方图进行统计,将所有块连接 成一个向量,得到输入图像的特征;
[0012] 6)将输入图像的特征用非线性支持向量回归来估计年龄。
[0013] 优选的,在步骤1)中所述的预处理为二值化、平滑和规范化,得到灰度图像。
[0014] 优选的,在步骤1)中,假设输入图像经过预处理后,得到大小为mXn像素的灰度图 像,将所有得到的灰度图像分别进行分块,假设每一个块的大小为PlXp2,分块过程中的步 伐为S1 = S2=1,则第i-th张输入图像的分块结果表示为口。,.…,口其中
对心里的每一个块进行去均值化后为4=[兩1馬2,....,兩。,,,,,>巧''&, 依次处理所有输入图像得到一个大矩阵,其表示为^ =[是1,4],.…,屯。,,,,]e 其中 U ' ..J ) 巧AP嗦示每一个块的大小为P1P2 X 1,原々巧表示矩阵A的大小为P1P2 XNmini,i的取值范围 为
[0015] 优选的,在步骤2)中,所述的用PCA算法从大矩阵中学习得到第一层卷积操作的卷 积核,具体如下,假设第1层的卷积核个数为^,PCA算法是使得下列目标函数重构误差最 小,其目标函数为:
[0016]
[0017]其中向为单位矩阵,其大小为^ ,求解该目标函数即为对矩阵AAT进行特征值 分解,选取Li个最大的特征值所对应的特征向量作为卷积操作的卷积核其表达式如下:
[001 引
[0019] 其中W泌如。的表示把化於X玲转变成矩阵V e 格式,Pi(XXT)表示求解矩阵AAT 的主特征向量。
[0020] 优选的,在步骤3)中,假设第二个卷积层的卷积操作为其中0,1表 示第一个卷积层的输出值,Wi2是卷积核。
[0021] 优选的,在步骤4)中,所述的非线性处理包括先二值化,再转换为十进制数值,表 达式为
中S表示二值化处理,马的取值范围为[0,沪-1;。
[0022] 优选的,在步骤6)中,采用非线性支持向量回归里的核函数选择径向基函数。
[0023] 由上述对本发明的描述可知,与现有技术相比,本发明具有如下有益效果:
[0024] 本发明的方法,基于深度学习模型进行特征提取,用非线性支持向量回归K-SVR 化ernel化nction Support Vector Regression)来估计年龄值,能有效的解决模型参数 过多问题,并且实现快速学习和高精度估计年龄。
【附图说明】
[00巧]图1是本发明的深度学习模型流程图,其中patch-mean removal表示去均值化、 Convolutional Layer Cl表不第一个卷积层、Convolutional Layer C2表不第二个卷积 层、Binary quantization and mapping表不二值化及其映身才、Concatenated image bIock-wiSe hiStogram表示连接图像中所有块的直方图统计。
[00%]图2是输入图像分块(patch)处理示意图。
[0027] 图3是把求得特征向量转变成卷积核的窗口形式。
[0028] 图4是第一个卷积层操作示意图。
[0029] 图5是第二个卷积层操作示意图。
[0030]图6是非线性层操作的示意图。
[0031 ]图7是特征抽取层进行分块示意图。
[0032] 图8是两个年龄公开数据库MORra和FG-NET的样本示意图。
[0033] 图9为在两个公开数据库MOWH和FG-NET部分估计年龄值。
【具体实施方式】
[0034] W下通过【具体实施方式】对本发明作进一步的描述。
[0035] 在图1中,可知,本发明是基于深度学习模型化PCANet的年龄估计方法,该深度学 习模型包含S层,分别是卷积层(The Convolutional Layer)、非线性层(The Nonlinear Process Layer)、特征抽取层(Fea1:ure F*ooling Layer)。
[0036] 参照图I至图7,本发明的一种人脸图像的年龄估计方法,包括如下步骤:
[0037] 1)将输入的人脸图像进行预处理,包括二值化、平滑和规范化,得到大小为mXn像 素的灰度图像,将所有得到的灰度图像分别进行分块,如图2所示,假设每一个块的大小为 Pl Xp2,分块过程中的步伐为S1 = S2=1,分块过程也可W看做是用一个窗口大小为Sl = S2= 1来对图像的行和列进行扫描。则第i-th张输入图像的分块结果表示为
I其中'
对Ai里的每一个块进行去
均值化后为4 =[而為,2:,....馬J E巧AA,依次处理所有输入图像得到一个大矩阵,其表示 为:
[003引 (X)
[0039] 其中及W':表示每一个块的大小为plP2Xl,ir|P:xv"''。l表示矩阵A的大小为plp2X Nnum, i的取值范围为
[0040] 2)用PCA算法从大矩阵A中学习得到第一层卷积操作的卷积核。其中卷积核个数就 是PCA用算法求得特征向量。如图3所示,是把求解到的特征向量转变成卷积核W的窗口形 式。假设第1层的卷积核个数为^,PCA算法是使得下列目标函数重构误差最小,其目标函数 为: 幽]
(2):
[0042]其中^为单位矩阵,其大小为,求解该目标函数其实就是对矩阵AAT进行特 征值分解,选取^个最大的特征值所对应的特征向量作为卷积操作的卷积核,其表达式如 下:
[00创 C 3}
[0044] 其中W表示把V € 转变成矩阵於"":格式,Pl(XXT)表示求解矩阵AAT 的主特征向量。
[0045] 图4是第一个卷积层操作示意图,假设输入图像为{/j;;;,,使用PCA算法学习得到第 一个层卷积操作的卷积核为Wii, 1 = 1,2, ....,Li,使用不同的卷积核去和输入图像进行卷 积时,就可W得到不同的特征maps。所W第一个卷积层的卷积输出可W写成:
[0046]
(4)
[0047] 其中,*表示卷积操作,输出特征maps辑的大小和输入Ii一样,原因是在进行卷积 操作时对输入图像进行边缘补零操作,使得卷积后的大小和输入的一样。
[004引3)将第一层卷积操作后的输出特征maps进行分块和去均值化,得到另一大矩阵, 采用PCA算法从该大矩阵中学习得到第二层卷积操作的卷积核。假设第二个卷积层的卷积 操作3
其中终表示第一个卷积层的输出值,Wi2是卷积核。具体的:图5表 示第二个卷积层操作示意图,第一个卷积层的输出种作为第二个卷积层的输入,和第一层 卷积一样做同拴的極化.诵讨对输入的冲讲行分块和去均值化后可W表示为:
[0049]
城
[(K)加]其中1=1 .2.....W同掉的方击处理所有第二层的输入,可W得到
[0051 ] 路
[0化2] ,用PCA算法求解矩阵Y的主特征值所对应的特 征向量作为第二个卷积层的卷积核Wi2。所W第二个卷积层的卷积输出为:
[005;3]
妨
[0054] 4)图6表示非线性层操作示意图,将第二层卷积操作后输出的特征maps进行非线 性处理,包括:先二值化,再转换为十进制数值,表达式为
[0055]
( 8 )
[0化6] 其中S表示二值化处理,爲的取值范围为[O,2": -1;,
[0057] 5)把转换后的输出值分成若干块,对每一个块用直方图进行统计,将所有块连接 成一个向量,得到输入图像的特征。具体为:参照图7,为特征抽取层进行分块示意图,非线 性层的输出砖作为特征抽取层的输入值,把聋分成Z块,其大小为hlXh2。对每一个块使用直 方图统计的方法进行统计,然后把所有的块连接成一个向量的形式,其表示为 公£份加(《),依次处理谭,1 = 1,2,....山,最终可W得到输入图像Ii的特征为:
[0058
(9)
[0059] W同样的方式处理所有输入的样本,最终可W提取到输入样本的特征,然在使用 非线性支持向量回归。
[0060] 6)将输入图像的特征用非线性支持向量回归K-SVR(Kernel function Supportive Vector Regression,K-SVR)来估计年龄。采用非线性支持向量回归里的核函 数选择径向基函数RBF(Radial-Basis Rmction)。
[OOW] 举例说明
[0062]参照图8,人脸年龄公开数据库MORPH和FG-肥T,运两个数据库里的人脸图像都有 相对应的年龄信息。MORPH数据库包含55332张人脸图像,同时也包含着不同种族的人,年龄 从16岁到77岁。FG-NET数据库有1002张人脸图像,里面的图像具有高度可变性(如光照、姿 势、表情等),数年龄从0岁到69岁。
[0063] 对MORPH数据库随机选取5000张图像作为训练集5000张图像作为测试集,而对于 小的FG-NET数据库则随机选取80 %的图像作为训练集,剩下的20 %作为测试集。所有的图 像基于预处理后变成大小为28巧8的灰度图像。最终预测结果分别为:在MORPH数据库里的 年龄平均绝对误差达到4.72(年龄),在FG-肥T数据库串的年龄平均绝对误差达到4.66(年 龄),其中平均绝对误差的计算为
\表示真实年龄值,Pk估计出来的年 龄值。图9为在两个公开数据库MORra和FG-NET部分估计年龄值。
[0064] 上述仅为本发明的【具体实施方式】,但本发明的设计构思并不局限于此,凡利用此 构思对本发明进行非实质性的改动,均应属于侵犯本发明保护范围的行为。
【主权项】
1. 一种人脸图像的年龄估计方法,其特征在于: 1) 将输入的人脸图像进行预处理后,再分块,对每一个块进行去均值化,依次处理所有 输入的人脸图像,从而得到一个包含所有块的大矩阵; 2) 用PCA算法从大矩阵中学习得到第一层卷积操作的卷积核; 3) 将第一层卷积操作后的输出特征maps进行分块和去均值化处理,得到另一大矩阵, 采用PCA算法从该大矩阵中学习得到第二层卷积操作的卷积核; 4) 将第二层卷积操作后输出的特征maps进行非线性处理; 5) 把转换后的输出值分成若干块,对每一个块用直方图进行统计,将所有块连接成一 个向量,得到输入图像的特征; 6) 将输入图像的特征用非线性支持向量回归来估计年龄。2. 如权利要求1所述的一种人脸图像的年龄估计方法,其特征在于:在步骤1)中所述的 预处理为二值化、平滑和规范化,得到灰度图像。3. 如权利要求1所述的一种人脸图像的年龄估计方法,其特征在于:在步骤1)中,假设 输入图像经过预处理后,得到大小为mXn像素的灰度图像,将所有得到的灰度图像分别进 行分块,假设每一个块的大小为 PlXp2,分块过程中的步伐为S1 = s2=l,则第i-th张输入图 像的分块结果表示为对 &里的每一个块进行去均值化后为孑,依次处理所有输入图像得 到一个大矩阵,其表示为J = [ΧρΙ,·…,其中表示每一个块的大小 为PiP2 X 1,表示矩阵A的大小为plP2 X Nnum,i的取值范围为1彡i彡N。4. 如权利要求1或3所述的一种人脸图像的年龄估计方法,其特征在于:在步骤2)中,所 述的用PCA算法从大矩阵中学习得到第一层卷积操作的卷积核,具体如下,假设第1层的卷 积核个数为Li,PCA算法是使得下列目标函数重构误差最小,其目标函数为:其中匕为单位矩阵,其大小为Li X U,求解该目标函数即为对矩阵AAT进行特征值分解, 选取1^个最大的特征值所对应的特征向量作为卷积操作的卷积核其表达式如下:其中表示把e胪%转变成矩阵v e 格式,pi (XXT)表示求解矩阵AAT的主 特征向量。5. 如权利要求4所述的一种人脸图像的年龄估计方法,其特征在于:在步骤3)中,假设第二个卷积层的卷积操作, \,其中〇丨表示第一个卷积层的输出值,是卷 、 ^ ?-1 积核。6. 如权利要求5所述的一种人脸图像的年龄估计方法,其特征在于:在步骤4)中,所述 的非线性处理包括先二值化,再转换为十进制数值,表达式,,其中δ 表示二值化处理,5)的取值范围为[0,-f]。7.如权利要求1所述的一种人脸图像的年龄估计方法,其特征在于:在步骤6)中,采用 非线性支持向量回归里的核函数选择径向基函数。
【文档编号】G06K9/00GK105956571SQ201610317460
【公开日】2016年9月21日
【申请日】2016年5月13日
【发明人】杜吉祥, 郑德鹏, 翟传敏, 范文涛, 王靖, 刘海建
【申请人】华侨大学