基于最大方向编码的人脸表情特征提取及识别方法

文档序号:9453434阅读:559来源:国知局
基于最大方向编码的人脸表情特征提取及识别方法
【技术领域】
[0001] 本发明属于数字图像处理技术领域,具体涉及对图像的人脸表情特征提取及人脸 表情识别处理。
【背景技术】
[0002] 表情是人类用来表达情绪的一种基本方式,是非语言交流中的一种有效手段。人 们可通过表情准确而微妙地表达自己的思想感情,也可通过表情辨认对方的态度和内心世 界。人脸表情识别所要研究的就是如何自动、可靠、高效地利用人脸表情所传达的信息。人 脸表情可以分为6种基本情感类别:惊奇、恐惧、厌恶、愤怒、高兴、悲伤,和一种最为普遍的 表情类别:中性。其中中性是人脸表情进行转换的中间过程和所有人一般状态下所表现出 来的最为普遍的表情类别。一个人脸表情识别系统(FER) -般包括3个环节,即人脸检测、 表情特征提取、表情分类。其中人脸检测目前已经成为了一个单独的研究方向,现有的研究 已经在该方面上研究出了一些成果。表情特征提取是FER系统中最重要的部分,有效的表 情特征提取工作将使识别的性能大大提高。
[0003]目前常用的人脸面部表情识别算法有:
[0004] (1)基于人脸动作编码系统FACS和运动单元AU的算法,可参考文献:J.Hamm, C.G.Kohler,R.C.Gur,andR.Verma,"Automatedfacialactioncodingsystemfor dynamicanalysisoffacialexpressionsinneuropsychiatricdisorders,',Journal ofNeuroscienceMethods,vol. 200,no. 2,pp.237-256,2011 ;
[0005] (2)基于主成分分析PCA的算法,可参考文献:YongCY,SudirmanR,Chew KM.FacialExpressionMonitoringSystemUsingPCA-BayesClassifier[C].Future ComputerSciencesandApplication(ICFCSA),2011InternationalConference on.IEEE,2011 :187-191;
[0006] (3)基于LDP的算法,可参考文献:T.Jabid,M.H.Kabir,and0?Chae,"Robust facialexpressionrecognitionbasedonlocaldirectionalpattern,'TTRIJournal, vol. 32,no. 5,pp.784-794,2010。
[0007] 上述人脸面部表情提取方法都在一定程度上存在问题。方法(1)需要准确的五官 定位及面部追踪才可以获得较好的效果,且对于噪声光照敏感,易受到干扰;方法(2)虽然 拥有较小的计算量和特征维度,但是会忽略局部特征,局部特征在识别过程中也是非常重 要的部分,因此对于识别精度有一定的影响;方法(3)虽然较前述两个有所改进,但是随着 所取最大值个数的提升,其编码组合数目会大幅增加,用于区域图像分块处理之后,其整幅 图像的特征维度会急剧增加;且LDP也仅是用周围像素与中心像素进行比较,直接取周围 像素的最大运算值进行编码,非理想条件下,对噪声也不具有一定的抗力。LDP编码由如下 公式计算而得:
[0008]
车中叫表示经过Kirsch算 子运算后各像素点的八方向的响应值的绝对值,k表示取最大值的个数,mk表示mi中最大 的第k个值。随着k的增大其特征维度会急剧增大,且抗干扰的能力不高。

【发明内容】

[0009] 本发明针对上述存在的问题,公开了一种基于最大方向编码的人脸表情特征提取 方法,能够有效的提取有用信息并减少计算量,提高抗干扰能力。
[0010] 本发明的基于最大方向编码的人脸表情特征提取方法,包括下列步骤
[0011] 对输入的待处理人脸图像进行预处理,得到待提取图像,所述预处理包括:图像灰 度化处理、尺寸归一化处理;
[0012] 分别以待提取图像的各像素点为中心,计算各中心像素点的八个方向响应值,并 对各响应值所在位置进行二进制编码,例如从000到111 ;
[0013] 查找各中心像素点的最大响应值、最小响应值,并记最大响应值所在位置编码为 Max,最小响应值所在位置编码为Min;
[0014] 判断与最小响应值的差值是否小于预设阈值Th(经验值,通常可设置为 200-300),若是,则当前中心像素点的编码值为0,若采用6位的二进制编码,则其编码值为 〇的编码为〇〇〇〇〇〇 ;否则,当前中心像素点的编码设置为:Max为高位,Min为低位的串接 码;将各中心像素点的编码的十进制值作为其特征值,即得到待提取图像的各像素点的特 征值并输出。
[0015] 本发明改进了LDP的原始编码模式,首先,不直接使用所计算出来的响应值进行 编码,而是利用最大最小响应值所在位置,将位置参数作为编码值进行编码,从而可以将 原来八位的二进制编码缩减为六位的二进制编码值,降低了特征维度和后续识别的运算时 间;其次因为对于中心像素而言,其八方向的响应值并不具有同等的地位,从而才会产生各 个方向不同的响应值,因此可以利用最大最小响应值的所在方向来确定一个目标像素,这 比直接选取最大三个响应值进行编码的LDP方法更加精确,原始方法可能会出现完全不同 像素成为了同一种编码的情况,利用周围像素的明暗信息所代表的方向性进行编码可以排 除部分偶然重合的情况,提高编码准确度;最后,为了排除部分噪声对于编码方式的影响, 加入了门限值,当最大最小响应值之差达到门限值之后才进行编码,门限的引入排除了部 分内在外在误差,提高了人脸表情特征提取方法的抗干扰能力。
[0016] 基于本发明的表情特征提取方法,本发明还公开了一种基于最大方向编码的人脸 表情识别方法,包括下列步骤:
[0017] 步骤1 :输入人脸图像,基于本发明的表情特征提取方法得到各人脸图像的像素 点的特征值;
[0018] 步骤2 :基于各人脸图像的像素点的特征值进行SVM训练,得到SVM分类器;
[0019] 步骤3 :输入待识别人脸图像,基于本发明的表情特征提取方法得到待识别人脸 图像的像素点的特征值,并基于步骤2得到的SVM分类器输出当前待识别人脸图像的表情 识别结果。
[0020] 综上所述,由于采用了上述技术方案,本发明的有益效果是:降低了LDP原始编 码的特征维度和计算量以及编码准确度,提高了人脸表情特征提取及表情识别的抗干扰能 力。
【附图说明】
[0021] 图1是【具体实施方式】中,人脸表情识别流程示意图;
[0022] 图2是【具体实施方式】中,本发明改进的LDP编码(DLDP编码)示意图。
【具体实施方式】
[0023] 为使本发明的目的、技术方案和优点更加清楚,下面结合实施方式和附图,对本发 明作进一步地详细描述。
[0024] 为了方便描述,首先给出【具体实施方式】所涉及的相关专业术语的简要描述:
[0025] (l)Haar-like特征。哈尔特征(Haar-like)是用于物体识别的一种数字图像特 征,哈尔特征使用检测窗口中指定位置的相邻矩形,计算每一个矩形的像素和并取其差值, 然后用这些差值来对图像的子区域进行分类。
[0026] (2)图像二值化。就是将图像上的像素点的灰度值设置为0或255,也就是将整个 图像呈现出明显的黑白效果。在灰度图像中,常采用一个字节表示一个像素点,其灰度级为 0~255,其二值化方法为构造用一个二进制位表示一个像素点的图像,设置二值化阈值T, 将大于T的像素点设置为1,小于等于T的点设为0。
[0027] (3)Adaboost算法。Adaboost是一种迭代算法,其核心思想是针对同一个训练集 训练不同的弱分类器,然后把这些弱分类器集合起来,构成一个强分类器。常用于人脸检测 与定位。
[0028] (4) :Kirsch算子。Kirsch算子是R.Kirsch提出来一种边缘检测新算法,它采用 8个模板对图像上的每一个像素点进行卷积求导数,这8个模板代表8个方向,对图像上的 8个特定边缘方向做出最大响应,运算中取最大值作为图像的边缘输出。
[0029] (6):直方图均衡化。直方图均衡化的基本思想是把原始图的直方图变换为均匀分 布的形式,这样就增加了象素灰度值的动态范围从而可达到增强图像整体对比度的效果。
[0030] (7) :SVM。SVM(SupportVectorMachine,支持向量机)是一个有监督的学习模 型,通常用来进行模式识别、分类、以及回归分
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1