用于从人脸图像的数据提取人脸特征的方法和系统的利记博彩app

文档序号:10617912阅读:487来源:国知局
用于从人脸图像的数据提取人脸特征的方法和系统的利记博彩app
【专利摘要】本发明公开了一种用于从人脸图像的数据提取人脸特征的方法和系统。该系统可包括:第一特征提取单元,其被配置成对人脸图像的数据进行滤波形成第一层次(dimension)的、第一多个通道的特征图,并将该特征图下采样为第二层次的特征图;第二特征提取单元,其被配置成对第二层次的特征图进行滤波,以形成第二层次的、第二多个通道的特征图,并将第二多个通道特征图下采样为第三层次的特征图;以及第三特征提取单元,其被配置成对第三层次的特征图进行滤波以进一步减少位于人脸区域以外的高响应,从而在减少人脸图像的身份内差异的同时维持在人脸图像的身份之间的辨别力。
【专利说明】
用于从人脸图像的数据提取人脸特征的方法和系统
技术领域
[0001] 本申请涉及一种用于从人脸图像的数据提取人脸特征的方法和系统。
[0002] 发明背景
[0003] 在许多实际应用中,姿势和光照变化成为影响人脸辨识的瓶颈。目前已经提出了 许多现有的工作来解决此类变化。姿势不变的方法可一般分成两种:基于2D的类型和基于 3D的类型。在第一种类型中,通过2D图像匹配或者通过使用一些基础或范本对测试图像进 行编码来处置姿势。例如,在一种常规的方式中,使用立体匹配来计算两张人脸之间的相似 性,然后给出训练图像的测试人脸组合,并且接着利用线性回归系数作为用于人脸辨识的 特征。基于3D的方法通常捕获3D人脸数据或从2D输入来估计3D模型,并且尝试将其与2D探 针人脸图像匹配。此类方法使合成探针人脸的任何视图成为可能,从而使得这些方法通常 对姿势变化更稳健。
[0004] 光照不变(illumination-invariant)方法通常对光照如何影响人脸图像作出假 设,并使用该假设来模型化和移除光照效应。举例来说,在本领域中已设计出基于投影仪的 系统以捕获在少量光照下画廊里的每个对象的图像,所捕获的图像可以线性地组合以生成 任意光照下的图像。在该增强的画廊中,采用了稀疏编码来执行人脸辨识。
[0005] 以上方法具有某些限制性。例如,捕获3D数据需要额外成本和资源,而从2D数据推 断出3D模型是一个不适定的问题。由于统计的光照模型常常是从受控的环境来总结,所以 无法在实际应用中对其进行很好的概括。

【发明内容】

[0006] 在一个方面中,本申请提供了一种用于从人脸图像的数据提取脸特征的方法,包 括:
[0007] 1)对所述人脸图像的数据进行滤波形成第一多个通道的、第一层次的特征图;
[0008] 2)根据〇(x)=max(0,x)的规则计算每个所述特征图,其中X表示所述第一层次的 特征图;
[0009] 3)对所计算的特征图下采样,形成第二层次的特征图;
[0010] 4)对经下采样形成的特征图进行滤波,形成第二层次的、第二多个通道的特征图;
[0011] 5)根据〇(X)=max(0,X)的规则计算所述第二层次的特征图中的每个特征图,其中 X表示所述第二多个通道的特征图;
[0012] 6)对计算的第二多个通道的特征图进行下采样,形成第三层次的特征图;以及
[0013] 7)对所述第三层次的特征图中的每个特征图进行滤波以减少人脸区域以外的高 响应,
[0014] 借以,减少所述人脸图像的身份内差异并且在所述人脸图像的身份之间维持辨别 力。
[0015] 在另一个方面中,本申请提供了一种用于从人脸图像的数据提取人脸特征的系 统,包括:
[0016] 第一特征提取单元,被配置成对所述人脸图像的数据进行滤波形成第一层次的、 第一多个通道的特征图,并将所述特征图下采样为第二层次的特征图;
[0017] 第二特征提取单元,被配置成对所述第二层次的特征图进行滤波以形成第二层次 的、第二多个通道的特征图,并将所述第二多个通道的特征图下采样成第三层次的特征图;
[0018] 第三特征提取单元,被配置成对所述第三层次的特征图进行滤波,以进一步减少 位于人脸区域以外的高响应,从而减少人脸图像的身份内差异同时在所述人脸图像的身份 之间维持辨别力。
[0019] 在一个实施例中,上述方法可由计算机中的一或多个处理器来实施或实行。
[0020] 在一个实施例中,第一特征提取单元包括第一滤波器矩阵、第一非线性激活单元 和第一下采样单元矩阵。第一滤波器矩阵被配置成对人脸图像的数据进行滤波使得每个特 征图具有:位于人脸区域以外的、用于主要捕获人脸图像的姿势信息的大量高响应;以及位 于人脸区域内部的、用于捕获人脸图像的人脸结构的多个高响应。第一下采样单元矩阵被 配置成将特征图下采样为第二层次的特征图。第一非线性激活单元被配置成非线性地联接 第一滤波器矩阵和第一下采样单元矩阵。
[0021] 在另外的实施例中,第二特征提取单元包括第二滤波器矩阵21,第二滤波器矩阵 被配置成对来自第一特征提取单元的每个特征图进行滤波以减少位于人脸区域以外的高 响应,从而在舍弃大多数姿势变化的同时保持人脸图像的人脸结构。第二特征提取单元进 一步包括:第二非线性激活单元以及第二下采样单元矩阵。第二下采样单元矩阵被配置成 将特征图下采样为第二层次的特征图,其中第二非线性激活单元被配置成非线性地联接第 二滤波器矩阵和第二下采样单元矩阵。
[0022] 在其它方面中,本申请提供了计算机可读媒体,所述计算机可读媒体用于存储用 于执行以下步骤的指令:
[0023] 1)对所述人脸图像的数据进行滤波形成第一层次的、第一多个通道的特征图;
[0024] 2)根据〇(x)=max(0,x)的规则计算每个所述特征图,其中X表示所述第一层次的 特征图;
[0025] 3)对所计算的特征图下采样,形成第二层次的特征图;
[0026] 4)对经下采样形成的特征图进行滤波,形成第二层次的、第二多个通道的特征图;
[0027] 5)根据σ(X)= max(0,X)的规则计算所述第二层次的特征图中的每个特征图,其中 X表示所述第二多个通道的特征图;
[0028] 6)对计算的第二多个通道的特征图进行下采样,形成第三层次的特征图;以及
[0029] 7)对所述第三层次的特征图中的每个特征图进行滤波以减少人脸区域以外的高 响应,
[0030] 借以,减少所述人脸图像的身份内差异并且在所述人脸图像的身份之间维持辨别 力。
【附图说明】
[0031] 图1示出了用于从人脸图像的数据提取人脸特征的过程的流程图。
[0032]图2示出了根据本申请的实施例的用于从人脸图像的数据提取人脸特征的系统的 架构。
[0033]图3示出了根据本申请的实施例的用于从人脸图像的数据提取人脸特征的例示性 系统的框图。
[0034]图4示出了根据本申请的一个实施例的用于训练权值中的参数的流程。
【具体实施方式】
[0035]下面将详细参考例示性实施方式,并根据附图来描述本发明的具体实施例。如果 合适,在整个附图中使用相同附图标号来指代相同或相似部分。
[0036]图1示出了用于从人脸图像的数据提取人脸特征的过程100的流程图。在过程100 中,一个人的具有任意姿势和光照变化的人脸图像将被用作输入,并且以该人的规范视角 重建其人脸以作为目标(见图2)。首先,经由特征提取层对输入图像进行编码,该特征提取 层具有三个局部连接层和交替堆叠的两个池化层,稍后将论述这些层。每个层以不同尺度 来捕获人脸特征。第一局部连接层输出第一多个(例如,32个)特征图。每个特征图具有位于 人脸区域以外的、主要捕获姿势信息的大量高响应,以及具有位于人脸区域内部的、用于捕 获人脸结构的一些高响应。在第二局部连接层输出的特征图中,位于人脸区域以外的高响 应已显著减少,这指示其舍弃了大多数姿势变化并同时保持了人脸结构。第三局部连接层 输出稀疏的并保留了身份特征的FIP特征。FIP特征可用来以规范的视角恢复人脸图像。 [0037]在一个实施例中,过程100包括步骤slOl,在该步骤中,对人脸图像的数据进行滤 波以形成第一层次(dimension)的、第一多个通道的特征图。接着,通过σ(χ) =max(0,x)来 计算每个特征图,其中X表示每个第二层次的特征图。将所计算的特征图进一步下采样形成 第二层次的特征图。在该步骤中,对人脸图像的数据进行滤波,使得每个特征图具有:1)位 于人脸区域以外的、用于主要捕获人脸图像的姿势信息的大量高响应;以及2)位于人脸区 域内部的、用于捕获人脸图像的人脸结构的多个高响应。
[0038] 举例来说,/表示在任意姿势和光照下的人脸图像的数据矩阵,其具有原始层次 (例如,96X96)。出于描述的目的,以下内容基于96X96的原始层次。可将数据矩阵/的原始 层次滤波形成32个通道的特征图。
[0039] 在一个实施例中,经由含有32个子矩阵的权值矩阵W1将X*3转换为32个特征图/通道 中:
[0040] W'-fW,1 ; W* W]2] VW,;1 e Κβ?·,?(,?
[0041] 其中no表示数据矩阵的原始层次(即,n〇 = 96)。
[0042] 每个子矩阵是稀疏的,以保持图像数据的局部连接结构。直观地,子矩阵中的每行 表示中心在像素 X*3处的小滤波器,使得除属于该滤波器的元素之外这行中的所有元素均 等于零。特别而言,W1的权值不共享,这些行的非零值也不同。因此,权值矩阵W1产生32个特 征图{<}=,每个特征图具有no层次。
[0043] 接着,使用矩阵V1 (其中Vij e {〇,1})来将这些特征图中的每个下采样为48X48特 征,以减少需要学习的参数的数目并获得更稳健的特征。可以将X的每个4计算为:
[0044]
(1)
[0045] 其中〇(x)=max(0,x)是特征强度不变的经修正的线性函数。因此其对形状和光照 变化较稳健。可以通过将所有串联在一起、获得ηι = 48Χ48Χ32层次的较大特征 图来获得X1。
[0046] 在一个实施例中,在步骤slOl之前,过程100可根据〇(x)=max(0,x)的规则非线 性地激活人脸图像的数据,其中X表示人脸图像的每个数据。在另一个实施例中,可在步骤 sl〇l之前将人脸图像转换成灰阶图像。
[0047]在步骤S102中,将所计算的每个特征图进一步滤波为第二层次的、第二多个通道 的特征图,并且通过σ(X) =max(0,X)来进一步计算每个经滤波的特征图,其中X表示第二层 次的每个特征图。接着,将上述特征图进一步下采样为第三层次的特征图。
[0048] 具体而言,每个#被滤波为具有32个子矩阵死HV%2e的xf
[0049]
.(2)
[0050] 其中,使用V2将xf下采样到24X24层次。方程式2意指第一层中的每个小特征图乘 以32个子矩阵并接着将其相加。在这里,每个子矩阵具有如上文所述的稀疏结构。我们可以 将方程式(2)重新用公式表示成矩阵形式:
[0051] x2 = V2〇(ffV) (3)
[0052] 其中,疋2=俩2:;...;咬'^呢 2'^股4_押并且2=[4;...;4]€股" 1。通过重复甿达32 次来简单地获得》f。因此,X2具有n2 = 24 X 24 X 32的层次。
[0053]在步骤sl03中,过程100对从步骤sl02获得的第三层次的特征图中的每个特征图 进行滤波以减少位于人脸区域以外的高响应,从而减少人脸图像的身份内差异并维持人脸 图像的身份之间的辨别力。所获得的人脸特征在本公开中也被称为FIP(face identitypreserving; 人脸身份保留) 特征。
[0054]在一个实施例中,过程100对从步骤sl02接收到的每个特征图进行加权,并在步骤 S104中将经加权的特征图转换到无姿势和光照变化的正面人脸图像。
[0055] 具体而言,X2将转换到x3(即,FIP特征),x3与X2的大小相同。
[0056] x3 = o(ffV) (4)
[0057] 其中,r3 -二],V时 e E24 2切并且,Y2 = [xf;…;4 ] e RS2。
[0058] 接着,在步骤sl06中,过程100经由权值矩阵ff4 elT#'将FIP特征x3转换到正面人 脸图像y:
[0059] y = o(ff4x3) (5)
[0060] 已论述了用于从人脸图像的数据提取人脸特征的方法。下文中参考图2和图3论述 用于从人脸图像的数据提取人脸特征的系统,其中图2示出了根据本申请的实施方式的用 于从人脸图像的数据提取人脸特征的系统200的架构,而图3示出了根据本申请的实施例的 用于从人脸图像的数据提取人脸特征的例示性系统200的框图。
[0061] 如图2所示,系统200包括特征提取层和特征。如上文中所提及,一个人的具有任意 姿势和光照变化的人脸图像将被用作系统200的输入。系统200以同一人的规范视角重建人 脸以作为目标。首先,经由特征提取层对输入图像进行编码,该特征提取层具有三个局部连 接层和交替堆叠的两个池化层。每个层以不同尺度来捕获人脸特征。第一局部连接层输出 第一多个(例如,32个)特征图。每个特征图具有位于人脸区域以外的、用于主要捕获姿势信 息的大量高响应,以及具有位于人脸区域内部的、用于捕获人脸结构的一些高响应。在第二 局部连接层输出的特征图中,位于人脸区域以外的高响应已被显著减少,这表明其舍弃了 大多数姿势变化并同时保持了人脸结构。第三局部连接层输出稀疏的并保留身份的FIP特 征。FIP特征可用来以规范视角恢复人脸图像。
[0062]更具体而言,如图3中所示,系统200可包括第一特征提取单元10、第二特征提取单 元20和第三特征提取单元30。第一特征提取单元10被配置成将人脸图像的数据滤波为第一 层次的、第一多个通道的特征图,并将特征图下采样为第二层次的特征图。第二特征提取单 元11被配置成对第二层次的特征图进行滤波,从而形成第二层次的、第二多个通道的特征 图,并将第二多个通道特征图下采样从而形成第三层次的特征图。第三特征提取单元12被 配置成对第三层次的特征图进行滤波以进一步减少位于人脸区域以外的高响应从而减少 人脸图像的身份内差异并同时维持在人脸图像的身份之间的辨别力。
[0063]如图3中所示,系统200进一步包括布置在第一特征提取单元10和第二特征提取单 元11之间的第一非线性激活单元20以及布置在第二特征提取单元11和第三特征提取单元 12之间的第二非线性激活单元21。第一和第二非线性激活单元被配置成分别根据σ( χ) = max(0,X)的规则非线性地联接第一、第二和第三特征提取单元,其中X是所提取的特征图。 [0064]在一个实施例中,第一特征提取单元10包括第一滤波器矩阵11、第一非线性激活 单元12和第一下采样单元矩阵13。第一滤波器矩阵11被配置成对人脸图像的数据进行滤 波,使得每个特征图均具有位于人脸区域以外的、用于主要捕获人脸图像的姿势信息的大 量高响应,以及具有位于人脸区域内部的用于捕获人脸图像的人脸结构的多个高响应。第 一非线性激活单元12被配置成非线性地联接第一滤波器矩阵11和第一下采样单元矩阵13。 第一下采样单元矩阵13被配置成将特征图下采样为第二层次的特征图。第一滤波器矩阵 11、第一非线性激活单元12和第一下采样单元矩阵13合作以根据如上述公式(5)描述的规 则继续进行其功能。
[0065]第二特征提取单元20包括第二滤波器矩阵21、第二非线性激活单元22和第二下采 样单元矩阵23。第二滤波器矩阵21被配置成对来自第一特征提取单元的每个特征图进行滤 波以减少在人脸区域以外的高响应,从而舍弃大多数姿势变化并同时保持人脸图像的人脸 结构。第二下采样单元矩阵23被配置成将特征图下采样为第二层次的特征图。第二非线性 激活单元22被配置成非线性地联接第二滤波器矩阵21和第二下采样单元矩阵23。第二滤波 器矩阵21、第二非线性激活单元22和第二下采样单元矩阵23合作以根据如上所述的公式 (2)到(4)的规则继续进行上文所提及的功能。
[0066]另外,系统200可进一步包括重建单元40,该重建单元被配置成对从第三特征提取 单元30接收到的每个特征进行加权,并根据如上所述的公式(5)的规则将经加权的特征转 换为无姿势和光照变化的正面人脸图像。
[0067]此外,在一个实施例中,系统200可进一步包括非线性预激活单元50,该非线性预 激活单元在将人脸图像的数据输入到第一特征提取单元之前处理人脸图像的数据。非线性 预激活单元50可进一步被配置成将图像转换成灰阶图像。
[0068]分别用第一权值矩阵W1、第二权值矩阵W2、第三权值矩阵W3来执行在三个层中进 行滤波的过程(即,步骤S101-103,单元10-20),并且用第四权值矩阵W4来实行转换。本申请 基于最小二乘方字典学习来设计一种监督方法。特别而言,通过以下步骤来训练矩阵W1、 W2、W3和W4:基于最小二乘方字典学习来初始化W1、W2、W3和W4的参数,接着通过对重建图像 和实测值(ground truth)之间的相加平方的重建误差进行反向传播来更新所有参数。
[0069] 图4示出了用于初始化W1、W2、W3和W4的参数的流程。给定f3 =丨.rfK:是一组FIP特 征并且?={^匕是一组目标图像(其中m表示训练示例的数目),在第一步骤中,提供固定矩 阵〇,根据以下规则用X0和Y来初始化W1:
[0070]
(6)
[0071] 其中= ^匕是一组输入图像,并且I I · I |F是弗罗贝尼乌斯范数。
[0072] 在第二步骤中,该方法提供固定矩阵P以根据以下规则用W1X0和Y来初始化W2:
[0073] n
,u (7)
[0074] 其中W1是固定的。
[0075]在第三步骤中,该方法提供固定矩阵Q以根据以下规则用W2W1X0和Y来初始化W3: [0076]
(8)
[0077] 在第四步骤中,该方法根据以下规则用W3W2W1X0和Y来初始化W4:
[0078]
(9)
[0079] 对于更新而言,所提议的方法在初始化之后通过将重建误差的损失函数最小化来 更新所有权值矩阵:
[0080] E(X°-,W)=\\Y-Y\\^ (10)
[0081] 其中WHW1,· · ·,W4},,= {x,°}、f =汉}以及Y={yi}分别是一组输入图像,一组 目标图像和一组经重建构的图像。其使用随机梯度下降法来更新W,其中在第k个迭代中W 1, i = 1... 4的更新规则是:
[0082] (11)
[0083] (12)
[0084] 其中,Δ是动量变量,e是学习率,并且| = 是导数,其被计算作为反向 V-W 传播误差e1和先前层的特征的外积。在该深度网络中,存在e1的三种不同表达式。首先, 对于转换层而言,基于线性修正函数的导数来计算e4:
[0085]
(13)
[0086] 其中< = · L表示向量的第j个元素。
[0087] 类似地,e3的反向传播误差被计算为:
[0088]
(14)
[0089] 其中<=[沙'、:],。
[0090] 在本公开中,e1和e2是以与e3相同的方式来计算的,因为它们两者采用相同的激活 函数。由于进行了下采样,因此存在细微差异。对于这两个层而言,我们必须对相应的反向 传播误差e进行上采样,使得其具有与输入特征相同的层次。本申请需要加强权值矩阵以在 每个梯度步骤之后具有局部连接的结构。为此,如果对应矩阵元素假设为没有连接,则将这 些元素设定为零。
[0091] 可使用某种硬件、软件或其组合来实施本发明的实施方式。另外,本发明的实施方 式可适合计算机程序产品,该计算机程序产品体现在含有计算机程序代码的一或多个计算 机可读存储媒体(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上。举例来说,可由一 或多个处理器实施上文所提及的方法以实行存储在计算机可读媒体中的指令。具体而言, 媒体可存储:用于检索一对人脸图像的指令;用于将每个人脸图像分割成图像的多个分块 的指令,一个图像中的每个分块和另一图像中的对应分块形成一对分块;用于确定每对分 块的第一相似性的指令;用于从所有对分块确定所述一对人脸图像的第二相似性的指令; 以及用于使用第一相似性和第二相似性的指令;以及用于辨识人脸图像的指令。
[0092] 在以上描述中,出于说明的目的,在单个实施例中集合了本发明的各个方面、步骤 或部件。本公开不应该被解释为需要所要求保护主题的所有的公开的变化。所附权利要求 书也应该被理解为合并到例示性实施例的描述中,其中每个权利要求本身应被认为是本公 开的独立的实施方式。
[0093] 此外,从本公开的说明书和实践考虑,本领域的技术人员将显而易见的是,在不背 离如本公开的范围的情况下,可以对所公开的系统和方法作出各种修改和变化。因此,说明 书及其中的实施例仅视作示例性的,本公开的真正保护范围由所附权利要求书及其等同来 指示。
【主权项】
1. 一种用于从人脸图像的数据提取人脸特征的方法,包括: 1) 对所述人脸图像的数据进行滤波形成第一多个通道的、第一层次的特征图; 2) 根据〇(x)=max(0,x)的规则计算每个所述特征图,其中X表示所述第一层次的特征 图; 3) 对所计算的特征图下采样,形成第二层次的特征图; 4) 对经下采样形成的特征图进行滤波,形成第二多个通道的、第二层次的特征图; 5) 根据〇(x)=max(0,x)的规则计算所述第二层次的特征图中的每个特征图,其中X表 示所述第二多个通道的特征图; 6) 对计算的第二多个通道的特征图进行下采样,形成第Ξ层次的特征图;W及 7) 对所述第Ξ层次的特征图中的每个特征图进行滤波W减少人脸区域W外的高响应, 借W,减少所述人脸图像的身份内差异并且在所述人脸图像的身份之间维持辨别力。2. 根据权利要求1所述的方法,其中,所述步骤1)进一步包括: 对所述人脸图像的数据进行滤波,使得所述第一多个通道的特征图中的每个均具有: 位于所述人脸区域W外的大量高响应,其主要捕获所述人脸图像的姿势信息;W及 位于所述人脸区域内部的多个高响应,其捕获所述人脸图像的人脸结构。3. 根据权利要求1或2所述的方法,其中,所述步骤7)进一步包括: 对从步骤6)接收到的每个所述特征图进行滤波W减少位于所述人脸区域W外的高响 应,从而在舍弃大多数姿势变化的同时保持所述人脸图像的所述人脸结构。4. 根据权利要求3所述的方法,其中,所述步骤7)进一步包括: 对从步骤6)接收到的每个所述特征图进行加权;W及 将经加权的特征图转换为无姿势和光照变化的正面人脸图像。5. 根据权利要求1到4中的任一项所述的方法,在步骤1)之前进一步包括: 将所述人脸图像转换成灰阶图像。6. 根据权利要求4所述的方法,其中,分别用第一权值矩阵Wi、第二权值矩阵W2、第Ξ权 值矩阵W3来实行步骤1)、4)和7)中的滤波操作,并且用第四权值矩阵W4来实行所述转换, 其中,通过W下步骤来训练所述矩阵Wi、W2、W3和W4:基于最小二乘方字典学习来初始化 Wi、W2、W3和W4的参数,并且接着通过对重建图像和实测值之间的相加平方的重建误差进行 反向传播来更新所有的所述参数。7. 根据权利要求6所述的方法,其中, 给定X3二记促是一组FIP特征而F =拓指是一组目标图像,其中m表示训练示例的数 目,所述初始化的操作包括: 提供固定矩阵0,根据W下规则用X呀日Y来初始化Wi:其中义° =诗促是一组输入图像,并且 I · I If是弗罗贝尼乌斯范数, 提供固定矩阵P,根据W下规则用WiX呀日Y来初始化W2: 其中Wi是固定的,提供固定矩阵Q,根据W下规则用W2W4呀日Υ来初始化W3:W及 根据W下规则用W3wVx哺Y来初始化W4:8. -种用于从人脸图像的数据提取人脸特征的系统,包括: 第一特征提取单元,被配置成对所述人脸图像的数据进行滤波形成第一多个通道的、 第一层次的特征图,并将所述特征图下采样为第二层次的特征图; 第二特征提取单元,被配置成对所述第二层次的特征图进行滤波W形成第二层次的、 第二多个通道的特征图,并将所述第二多个通道的特征图下采样成第Ξ层次的特征图; 第Ξ特征提取单元,被配置成对所述第Ξ层次的特征图进行滤波,W进一步减少位于 人脸区域W外的高响应,从而减少人脸图像的身份内差异同时在所述人脸图像的身份之间 维持辨别力。9. 根据权利要求8所述的系统,其中,所述第一特征提取单元包括第一滤波器矩阵; 所述第一滤波器矩阵被配置成对所述人脸图像的数据进行滤波使得所述第一多个通 道的特征图中的每个均具有: 位于所述人脸区域W外的大量高响应,其主要捕获所述人脸图像的姿势信息;W及 位于所述人脸区域内部的多个高响应,其捕获所述人脸图像的人脸结构。10. 根据权利要求9所述的系统,所述第二特征提取单元进一步包括: 第一非线性激活单元;W及 第一下采样单元矩阵,其被配置成将所第一多个通道的特征图下采样为所述第二层次 的特征图, 其中,所述第一非线性激活单元被配置成非线性地联接所述第一滤波器矩阵11和所述 第一下采样单元矩阵。11. 根据权利要求8所述的系统,所述第二特征提取单元包括: 第二滤波器矩阵,被配置成对来自所述第一特征提取单元的每个所述特征图进行滤波 W减少位于所述人脸区域W外的高响应从而舍弃大多数姿势变化并同时保持所述人脸图 像的所述人脸结构。12. 根据权利要求11所述的系统,其中,所述第二特征提取单元进一步包括: 第二非线性激活单元;W及 第二下采样单元矩阵,被配置成将所述特征图下采样为所述第二层次的特征图, 其中,所述第二非线性激活单元被配置成非线性地联接所述第二滤波器矩阵和所述第 二下采样单元矩阵。13. 根据权利要求10或12所述的系统,其中第一非线性激活单元和所述第二非线性激 活单元中的每个均被配置成执行所述函数〇(x)=max(0,x),其中X是所述第一非线性激活 单元和所述第二非线性激活单元中的每个的输入。14. 根据权利要求8所述的系统,其进一步包括: 重建单元,被配置成对每个所述特征图进行加权并将经加权的特征图转换为无姿势和 光照变化的正面人脸图像。15.根据权利要求8所述的系统,其进一步包括: 非线性预激活单元,被配置成在将所述人脸图像的数据输入到所述第一特征提取单元 之前将所述人脸图像的数据转换成灰阶图像。
【文档编号】G06K9/46GK105981050SQ201380081289
【公开日】2016年9月28日
【申请日】2013年11月30日
【发明人】汤晓鸥, 朱臻垚, 罗平, 王晓刚
【申请人】北京市商汤科技开发有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1