基于似物性估计的快速行人检测方法
【技术领域】
[0001]本发明涉及计算机视觉和模式识别领域,具体而言涉及一种基于似物性估计的快速行人检测方法。
【背景技术】
[0002]计算机视觉近几年来一直是研究的热点和难点,而行人检测作为高层视觉任务的基础,已成为计算机视觉领域中至关重要的研究问题。
[0003]计算机视觉即通过机器视觉来模仿人眼的视觉系统,认知心理学和神经生物学的研究发现,人类在识别一个具体的物体是什么之前具有一种很强的感知物体的能力。对一幅复杂的图像来说,人类的视觉系统在一开始的反应时间内只会关注其中的某些部分,并忽略图像中其余不显著的部分。这进一步说明在识别一个具体事物之前,在人类的视觉系统中存在一个简单的视觉注意机制,该机制用来筛选出最有可能含有物体的区域。
[0004]近年来大部分比较前沿的行人检测方法都是基于滑动窗口方法来产生候选目标窗口,再将这些大量的候选目标窗口直接送去分类器计算得到检测结果。这种传统的滑动窗口行人检测方法不仅违背了人类视觉注意机制,而且相当耗时。本文引入似物性(Objectness)的概念,似物性即是对一个检测窗口中包含物体的可能性的描述,本发明通过建立一个似物性估计模型,对滑动窗口产生的候选窗口做了初筛选,并预测得到候选目标区域,大大缩小了行人检测的搜索范围,同时我们选用简单高效的固定窗口大小下梯度幅值特征(Normed gradients)来描述检测窗口的似物性,使得整个似物性估计流程在确保目标覆盖率不降低的前提下速度比同类算法的执行速度快很多。
【发明内容】
[0005]本发明目的在于提供一种基于似物性估计的快速行人检测方法,以克服现有基于滑动窗口的行人检测方法检测速度过慢的问题。
[0006]本发明的上述目的通过独立权利要求的技术特征实现,从属权利要求以另选或有利的方式发展独立权利要求的技术特征。
[0007]为达成上述目的,本发明提出一种基于似物性估计的快速行人检测方法,包括以下步骤:
[0008]1)准备似物性估计所需的检测窗口正负样本集,并归一化到同一尺度;
[0009]2)设置似物性估计函数,利用正负样本训练得到判别模型;
[0010]3)对输入图像进行多尺度缩放,并用固定大小的滑动窗口产生大量的检测窗口 ;
[0011]4)利用步骤2)中训练好的模型对所有检测窗口进行似物性估计,根据估分结果,筛选得到一个最有可能包含行人目标的候选窗口集;
[0012]5)根据候选目标窗口集预测得到候选目标区域;
[0013]6)在目标区域内使用行人H0G特征和SVM分类器完成行人检测。
[0014]应当理解,前述构思以及在下面更加详细地描述的额外构思的所有组合只要在这样的构思不相互矛盾的情况下都可以被视为本公开的发明主题的一部分。另外,所要求保护的主题的所有组合都被视为本公开的发明主题的一部分。
[0015]结合附图从下面的描述中可以更加全面地理解本发明教导的前述和其他方面、实施例和特征。本发明的其他附加方面例如示例性实施方式的特征和/或有益效果将在下面的描述中显见,或通过根据本发明教导的【具体实施方式】的实践中得知。
【附图说明】
[0016]附图不意在按比例绘制。在附图中,在各个图中示出的每个相同或近似相同的组成部分可以用相同的标号表示。为了清晰起见,在每个图中,并非每个组成部分均被标记。现在,将通过例子并参考附图来描述本发明的各个方面的实施例,其中:
[0017]图1是基于似物性估计的行人检测流程图。
[0018]图2是模型w的训练流程图。
[0019]图3是窗口合并结果示意图。
[0020]图4是窗口合并规则中不同参数α的性能比较示意图。
【具体实施方式】
[0021]为了更了解本发明的技术内容,特举具体实施例并配合所附图式说明如下。
[0022]在本公开中参照附图来描述本发明的各方面,附图中示出了许多说明的实施例。本公开的实施例不必定意在包括本发明的所有方面。应当理解,上面介绍的多种构思和实施例,以及下面更加详细地描述的那些构思和实施方式可以以很多方式中任意一种来实施,这是因为本发明所公开的构思和实施例并不限于任何实施方式。另外,本发明公开的一些方面可以单独使用,或者与本发明公开的其他方面的任何适当组合来使用。
[0023]本发明所提出的基于似物性估计的行人检测方法,主要包括基于NG特征的似物性估计模型的建立、根据似物性估计的结果预测得到候选目标区域、在候选目标区域内使用行人H0G特征和SVM分类器完成行人检测三个主要部分。这里的似物性估计即是对检测窗口中包含行人目标的可能性进行评估打分。
[0024]下面结合附图,对本发明的一些示范性实施例加以说明。
[0025]根据本发明的实施例,提出一种基于似物性估计的快速行人检测方法,以克服现有基于滑动窗口的行人检测方法检测速度过慢的问题。结合图1所示,该方法的实现大致包括以下6个步骤:
[0026]1)准备似物性估计所需的检测窗口正负样本集,并归一化到同一尺度;
[0027]2)设置似物性估计函数,利用正负样本训练得到判别模型;
[0028]3)对输入图像进行多尺度缩放,并用固定大小的滑动窗口产生大量的检测窗口 ;
[0029]4)利用步骤2)中训练好的模型对所有检测窗口进行似物性估计,根据估分结果,筛选得到一个很小的最有可能包含行人目标的候选窗口集;
[0030]5)根据候选目标窗口集预测得到候选目标区域;
[0031]6)在目标区域内使用行人H0G特征和SVM分类器完成行人检测。
[0032]上述方法中,所述步骤1)具体为:
[0033]11)将行人数据库中包含行人目标的窗口和随机采集的背景窗口分别作为行人窗口数据集和背景窗口数据集;
[0034]12)将行人窗口数据集和背景窗口数据集中的所有窗口 resize到8*8的尺度大小;
[0035]13)计算所有resize后的窗口的梯度幅值特征(NG),即每个窗口对应一个64 (8*8)维的NG特征,最终得到NG特征的正负样本集。
[0036]对于NG特征的解释:NG (Normed Gradients)特征即是将检测窗口归一化到统一的一个很小的尺寸(8*8)时,提取得到的梯度幅值特征,一个检测窗口即对应一个64维的NG特征。
[0037]本发明选择NG特征来描述一个待检测窗口的似物性的原因:由于一般物体都具有轮廓闭合性的特征,当把检测窗口 resize到一个很小的尺寸时,物体的梯度分布呈现出较为杂乱的模式,而背景的较为单一和清楚,因此选用简单高效的NG特征来描述一个检测窗口的似物性。
[0038]如图2的流程图所示,上述方法中,所述步骤2)具体为:
[0039]21)设置得分函数,利用正负样本集训练一个线性分类的支持向量机SVM,得到判别丰吴型;
[0040]22)由于不同尺寸窗口包含行人目标的可能性不同,针对每一种预定的窗口尺寸,设置重计算线性得分函数,并单独训练得到其对应的系数和偏移量;
[0041]这里预定的窗口尺寸,我们根据行人尺寸范围,预定检测窗口尺寸{(Η。)},ff0, H0e {10,20,40,80,160,320},W。,H。分别表示检测窗口的宽和高。
[0042]上述方法中,所述步骤21)具体为:
[0043]211)将正负样本的标签分别设为1和-1 ;
[0044]212)利用带有标签的正负样本训练一个线性分类的支持向量机SVM,得到判别模型w。设置得分函数如下:
[0045]Sl= <w, gl>(1)
[0046]1 = (i, x, y)(2)
[0047]其中别表不窗口的得分,64维的NG特征。1表不窗口位置,(x, y)表不窗口位置坐标,i表示窗口尺寸。
[0048]上述方法中,所述步骤22)具体为:
[0049]221)构建窗口尺寸i下的子正负样本集:对于每一种窗口尺寸i,在步骤11)中生成的正负样本集中提取出窗口大小为i子正负样本集;
[0050]222)对于每一种窗口尺寸i,利用该尺寸下的子正负样本集以步骤11)中计算得到的得分作为一维特征输入,通过一个线性SVM训练得到重计算得分函数中对应系数与偏移量V1、tl,如下公式(3),其中81表示输入的窗口得分,ο:表示重计算后的最终似物性估分。
[0051]Oj= V ;.Sj+t;(3)
[0052]上述方法中,所述步骤3)具体为:
[0053]31)根据预定检测窗口尺寸{(ff0, H0)}, ff0,H0e {10,20,40,80,160,320},对输入图片进行36个(6*6)尺度的缩放。例如:原图片大小为500*500,为了使得8*8的滑动窗口在缩放以后的图片中滑动产生的检测窗口实际尺寸为10*10,则需要将原图片缩放到400*400 ;
[0054]32)用8*8的滑动窗口在步骤31)中生成的每一个缩放尺度下滑动产生大量8*8的检测窗口。这里检测窗口对应的实际尺寸都是我们预定的大小:KW。,H。)},W。,H0e {10,20,40,80,160,320}。
[0055]上述方法中,所述步骤4)具体为:
[0056]41)计算所有待检测窗口的NG特征;
[0057]42)用公式⑴计算得到所有待检测窗口的估分s1;
[0058]43)根据待检测窗口对应于原图的实际尺寸,用公式(3)计算