一种人脸图像中快速定位人眼的方法
【技术领域】
[0001] 本发明属于计算机视觉与图像处理领域,具体是一种人脸图像中快速定位人眼的 方法,应用于人眼识别领域中。
【背景技术】
[0002] 不管是人与人之间交流,还是人机交互的过程中,人眼作为面部最重要的特征之 一,对人眼的定位有着非常重要的作用。在互联网时代伊始,隐私信息的保护和其安全性就 开始成为了热点问题,而虹膜识别作为比指纹安全性更高的一种方法,进入了人们的视野。 虹膜识别的编码空间丰富,每个人的虹膜纹路都独一无二并且容易区分。不仅如此,人体中 的虹膜在不同光照条件下可以表现出不同的性状,因此只有活体虹膜可以通过检测,这就 杜绝了类似复制指纹之类的安全隐患,使得虹膜识别成为了目前安全性最高的身份识别技 术。但人们希望在友好的用户体验下获得尽可能高的安全性。一个用户友好的例子就是人 脸识别,在开放式的场合(如安检、门禁),人脸可以在用户并不察觉的情况下被硬件设备捕 获,因此不会给用户带来额外负担。
[0003] 在人机交互领域,人眼定位也有着广泛的应用。随着GoogleGlass等头戴式可穿 戴设备的出现,人们开始寻求除了键盘鼠标组合之外的新颖交互方式,距离设备最近的人 眼就成为了其中的热门备选。目前已经有一些近距离的硬件设备问世,例如PupilLabs公 司开发了一个采用头戴式组件和一些摄像头组成的类似眼镜的设备,用来捕捉用户的眼球 运动。这些人眼追踪技术可以让人们在不使用双手的情况下使用双眼控制浏览网页,可以 辅助玩家对游戏中的人物运动进行控制,还可以运用于虚拟现实等应用场景中。而人眼中 心的定位是这类人机交互技术中的重要一环。当人眼目光在屏幕上移动的时候,眼球的转 动十分微小,因此若要实现网页浏览甚至在屏幕上的点击操作等精细控制的话,精确的人 眼定位技术将不可或缺。
[0004] 人眼定位在其他领域也有广泛的应用。例如针对疲劳驾驶引起的恶性交通事故, 许多研究使用车载设备观察司机的眼球移动、眼睑关闭、面部表情、头部移动等方式判断司 机是否疲劳驾驶,并在出现疲劳驾驶时采取必要措施。近十几年来,人眼定位受到越来越多 学术界和工业界的关注。
[0005] 目前在人眼定位方面已经有许多相对成熟的方法。如:M.Ressel在Proceedings ofthe1996ACMconferenceonComputersupportedcooperativework上发表的"An integrating,transformation-orientedapproachtoconcurrencycontrolandundo ingroupeditors"利用霍夫变换对规则的几何物体进行识别,在图中定位人眼。 M.AsadifardandJ.Shanbezadeh在ProceedingsoftheInternational multiConferenceofngineersandComputerScientists上发表的"Automaticadaptive centerofpupildetectionusingfacedetectionandcdfanalysis',利用主动形状模 型(ASM)将面部特征点作为整体建模,利用特征点相互之间的关系实现定位。最近几年,随 着机器学习算法在诸多领域深度和广度的增加,其在人眼定位方面的应用也越来越多。 如:。根据Haar特征与Adaboost分类器在人脸检测中出色的表现,Y.Maetal在AutomaticFaceandGestureRecognition,2004.Proceedings.SixthIEEE InternationalConference上发表的"Robustpreciseeyelocationunder probabilisticframework"利用相似的方法人眼定位,通过级联多个简单的分类器,强调 之前的分类器中的错误不断训练新的分类器,最终组合出强分类器。尽管这些方法相对成 熟,但各有不用的优点和不足,缺点主要集中在,对于复杂度不高的方法,其精确度不能突 破瓶颈,而对于精确度能够达到要求的方法,其复杂度过高又使得实时性达不到要求。人眼 定位的很多场景都是对实时性和准确性有较高要求的,这就需要找到一种能够在两方面都 表现出色的方法。
【发明内容】
[0006] 为了解决如上问题,本发明提供了一种人脸图像中的快速定位人眼方法。
[0007] 本发明的技术解决方案如下:
[0008] 一种人脸图像中快速定位人眼的方法,其特点在于,包括如下步骤:
[0009] 步骤1、以随机森林机器学习算法为基础,训练得到一定数量决策树,通过集成技 术形成随机森林;
[0010] 步骤2、输入待测人脸图像,并转化为灰度图,即是二维矩阵;
[0011] 步骤3、利用步骤1中的得到的随机森林,对步骤2得到灰度值的二维矩阵的使用多 级定位结构,即从一个固定的人眼粗定位区域开始,依据当前的定位结果,作为下一次定位 区域的中心,逐级缩小搜索范围,不断迭代直到最后一级完成后返回定位结果,确定人眼的 位置坐标;
[0012] 步骤4、将步骤3中有随机森林中多颗决策树得到多个人眼坐标加权平均,得到最 终人眼定位的结果。
[0013] 所述步骤1中以随机森林机器学习算法为基础的训练过程,具体步骤如下:
[0014] 1.1),将输入的人脸样本灰度图像做归一化处理,图片的左上角、右上角、右下角 的坐标分别为(〇,〇)、(1,〇)、(1,1)。
[0015] 1.2),作为随机森林的"种子",对样本做多样化处理,在标准样本的基础上,进行 随机化处理,分别在横坐标、纵坐标方向以及图片尺寸上做一定范围内的随机偏移,同时在 一定角度内做随机转动,生成多姿态的训练样本;
[0016] 1.3 ),将1.2)得到的二维矩阵,取其最直接的特征值,图像中像素点的灰度坐标 值,作为输入,人眼的坐标作为输出,决策树是一颗满二叉树,即在根节点和每一个中间结 点训练并保存基于不同点坐标之间灰度差分κω-κω和一个阈值τ,我们定义对图像I的 二值测试(binarytest)为:
[0017]
[0018] 优先的,此二叉树为决策树,我们通过自适应梯度提升决策树算法得到,具体步骤 如下:
[0019] 首先,初始化拟合误差函数:
[0020]
[0021] 其中,F(x)是决策树函数,Σ?Ι? 为拟合误差;
[0022] 进一步地,计算向负梯度方向计算伪残差,即
[0023]
[0024]其中,我们定义损失函数为,
[0025]L(yi,F(xi)) =l/2(yi-F(xi))2
[0026] 代入得到,
[0027] ^ =
[0028]进一步地,更新拟合伪残差:
[0029]
[0030]其中,h(xi;a)为拟合结果,例如第一次的拟合结果为hUi;*^)[0031 ]进一步的,更新权重和拟合残差乘数:
[0032]
[0033]
[0034] 进一步地,更新模型,m=l-M,M次后迭代结束:
[0035]Fm(x) =Fm-i(x)+yPmh(x;am)
[0036] 其中,1〈γ<0,γ即是学习率,γ的大小决定了迭代的收敛速度。
[0037] 1.4),使用1.3)的方法,将η张图片分为两类,分别挂载到根节点的左右两个子节 点上,在随后的第一层,有根据二值测试分为一共四类图片,以此类推,到达适当树深时截 止;
[0038] 1.5),针对1.4)中的分类效果,同时也可以用估计的聚集程度,即误差的平方和来 表征,因此训练的目的为最小化以下误差:
[0039]
[0040] 其中Si和Sr分别为按照杲柙特祉和阈值分类产生的左、石于节点中坐标组成的集 合。训练停止的条件为到达指定树的深度时或者指定误差大小。
[0041] 由于需要定位图片的预测结果是同一类样本的坐标的平均,所以是对预测结果的 一个估计,所以这个估计的聚集程度越多,进行预测的可信度也越高,证明训练的效果越 好,其中,估计的聚集程度可以用方差来表示,但是考虑到需要保证每个节点上挂载的图片 的数量,即尽量保证分类的平均,因此使用误