一种针对人像视频系统的关键帧获取方法
【技术领域】
[0001]本发明涉及视频处理技术领域,尤其是涉及一种针对人像视频系统的关键帧获取方法。
【背景技术】
[0002]人像视频系统中人脸识别是最核心的模块。在大部分人像系统中,对于经过人员,都会得到对应的轨迹。单个人员的轨迹可以表示为K帧图像上的矩形框的集合。人像视频系统中人脸识别模块输入的是一个人的轨迹,输出该人的身份。
[0003]相对于人像图像系统的识别模块,人像视频系统的主要区别是它需要挑选合适的帧上的人脸进行识别。最简单的方式是对K帧图像都进行识别,这会导致系统速度变慢,因为识别模块的时间开销是非常大的(I帧I秒时间,而一个人每秒中有24帧图像)。常见做法是选择最正脸的P帧(P约等于3),这样保证速度,但是识别性能会受影响。
[0004]因此,需要开发一种既能保证处理效率,又影响识别性能的新方法。
【发明内容】
[0005]本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种针对人像视频系统的关键帧获取方法,通过该方法选取关键帧后再进行人脸识别,既保证了速度,又具有较高的识别性能。
[0006]本发明的目的可以通过以下技术方案来实现:
[0007]—种针对人像视频系统的关键帧获取方法,包括以下步骤:
[0008]I)获取视频图像,对每帧图像均进行关键点检测;
[0009]2)根据所检测的关键点对每帧图像进行属性分类,并计算各属性下的置信度;
[0010]3)根据每帧图像在不同属性下的置信度选取P帧关键帧,作为人脸识别的基础。
[0011]所述步骤I)中,关键点检测具体为:
[0012]首先利用HoG与SVM结合方法进行第一轮关键点检测,每个关键点都保留K种选项;然后利用全局形状信息,在Κ?Φ可能中找出最像人脸的形状,作为最终的关键点,N为关键点数目。
[0013]所述属性包括光照强烈、光照昏暗、光照不均、模糊分类、张嘴分类、闭眼分类、姿态估计和尺寸。
[0014]所述计算各属性下的置信度具体为:
[0015]a)光照强烈:基于LBP和Gray Grid特征向量,使用Boosting分类器得到光照强烈的置信度SI ;
[0016]b)光照昏暗:基于LBP和Gray Grid特征向量,使用Boosting分类器得到光照昏暗的置信度S2 ;
[0017]c)光照不均:基于LBP和Gray Grid特征向量,使用Boosting分类器得到光照不均的置信度S3
[0018]d)模糊分类:基于LPSS、梯度直方图、色彩饱和度分布和局部自相关性特征向量,使用boosting分类器得到模糊的置信度S4 ;
[0019]e)张嘴分类:使用LBP与SVM结合方法进行张嘴分类,得到置信度S5 ;
[0020]f)闭眼分类:使用LBP与SVM结合方法进行闭眼分类,得到置信度S6 ;
[0021]g)姿态估计:使用POSIT方法估计X轴、Y轴和Z轴的旋转角度,通过LogisticFunct1n将各方向轴旋转角度转换成置信度S7、S8和S9 ;
[0022]h)尺寸:先将实际人脸尺寸除以标准尺寸,再转化成置信度S10。
[0023]所述标准尺寸取为150pixelsX 150pixels。
[0024]所述步骤3)中,选取P帧关键帧的具体过程为:
[0025]301)将每帧图像不同属性下的置信度组合,作为该帧图像的特征向量(Slk, S2k,…,SlOk),k 表示第 k 帧;
[0026]302)将所述特征向量输入第一 SVM分类器中,计算每帧图像在该第一 SVM分类器中的得分Score,以Score最大的帧作为第一帧关键帧选出;
[0027]303)将未选出的帧和上一步骤中已选出的帧的特征向量组合作为该未选出的帧的新特征向量输入第二 SVM分类器,计算各未选出的帧的在该第二 SVM分类器中的得分Score,以Score最大的帧作为第二帧关键帧选出;
[0028]304)采用与步骤303)相同方法选出剩余P_2帧。
[0029]所述P取为3。
[0030]与现有技术相比,本发明具有以下优点:
[0031](I)本发明在已知关键点的情况下,对图像进行了属性分类,获取各属性下的置信度,根据该置信度选取关键帧,提高了所选取的关键帧的精度;
[0032](2)本发明在选取关键帧时不仅考虑各帧本身的特征向量,还对已选出的帧的特征向量进行综合考虑,参考了不同帧之间的协同合作信息,进一步提高了所选取关键帧的精度,保证了识别性能;
[0033](3)本发明通过选取关键帧进行识别,保证了识别速度。
【附图说明】
[0034]图1为本发明的结构示意图。
【具体实施方式】
[0035]下面结合附图和具体实施例对本发明进行详细说明。本实施例以本发明技术方案为前提进行实施,给出了详细的实施方式和具体的操作过程,但本发明的保护范围不限于下述的实施例。
[0036]如图1所示,本实施例提供一种针对人像视频系统的关键帧获取方法,该方法考虑了多张图像间因素的影响,也考虑到不同帧之间协同合作的信息,具体步骤如下:
[0037]步骤SI,获取视频图像,对每帧图像均进行关键点检测。关键点检测过程的输入是图像和人脸框的位置,输出是关键点位置。这里利用HoG+SVM做第一轮关键点检测,每个关键点都保留K种选项;然后利用全局形状信息,在K~N种可能中找出最像人脸的形状,获取关键点,N是关键点数目。
[0038]步骤S2,根据所检测的关键点对每帧图像进行属性分类,并计算各属性下的置信度,这里的属性包括光照强烈、光照昏暗、光照不均、模糊分类、张嘴分类、闭眼分类、姿态估计和尺寸,具体置信度的计算如下:
[0039]a)光照强烈:基于LBP和Gray Grid特征向量,使用Boosting分类器得到光照强烈的置信度SI ;
[0040]b)光照昏暗:基于LBP和Gray Grid特征向量,使用Boosting分类器得到光照昏暗的置信度S2 ;
[0041]c)光照不均:基于LBP和Gray Grid特征向量,使用Boosting分类器得到光照不均的置信度S3