基于单目摄像头的手势识别方法
【技术领域】
[0001]本发明设计图像识别技术领域,特别涉及一种基于单目摄像头的手势识别方法。
【背景技术】
[0002]现有的肢体识别技术,通常是利用双目摄像头采集用户的肢体图像。由于用户的肢体图像是夹杂在大量的背景图像之中,从背景图像中分离出用户的肢体图像比较困难。此外,由于用户在操控设备等情况下,通常是采用手势进行表达,因此准确的从背景图像中分离出手势图像,对于解决实际问题更有意义。并且,现有的图像采集设备通常为双目图像采集设备。
[0003]如何利用单目图像采集设备且准确从背景图像中识别分离出手势图像,是当前图像识别技术中需要解决的技术问题。
【发明内容】
[0004]本发明的目的旨在至少解决所述技术缺陷之一。
[0005]为此,本发明的目的在于提出一种基于单目摄像头的手势识别方法,通过单目摄像头采集用户的手掌位置区域信息,实现手势智能识别,并利用回调函数调用手势对应操作,进行交互输出,具有识别精度高、硬件设备结构简单的特点。
[0006]为了实现上述目的,本发明的实施例提供一种基于单目摄像头的手势识别方法,包括如下步骤:
[0007]步骤S1,利用单目摄像头拍摄视频,获取所述单目摄像头采集的视频帧;
[0008]步骤S2,对所述视频帧进行图像特征分析,以判断所述视频帧中是否存在手掌部区域图片;
[0009]步骤S3,如果存在所述手掌部区域图片,则获取当前时刻下的所述手掌部区域位置,并存储至全局缓存内,重复步骤S1至步骤S3,获取预设时长内多个时刻的所述手掌部区域位置,将每个时刻及对应的手掌部区域位置存储至所述全局缓存内;
[0010]步骤S4,对所述多个时刻的所述手掌部区域位置进行分析,获取所述预设时长内手掌部区域的相对位置,根据所述手掌部区域的相对位置识别出对应的手势操作;
[0011]步骤S5,将识别得到的手势操作与多个预定义手势进行比较,获取相匹配的预定义手势,调用所述匹配的预定义手势对应的回调函数,以完成相应的控制动作,其中,每个预定义手势、回调函数和控制动作一一对应。
[0012]进一步,在所述步骤S1中,在所述单目摄像头拍摄视频之前,对所述单目摄像头进行初始化,设定所述单目摄像头的分辨率。
[0013]进一步,在所述步骤S2中,对所述视频帧进行图像特征分析,包括如下步骤:
[0014]提取所述视频帧的图像特征;
[0015]利用分类器对所述图像特征进行分类筛选,根据筛选结果判断所述视频中是否存在手掌部区域图片,如果存在,则执行步骤S3,否则丢弃该视频帧。
[0016]进一步,还包括如下步骤:在所述分类器对所述图像特征进行分类筛选之前,获取样本数据,训练所述样本数据以选取所述分类器,并对所述分类器进行初始化,其中,所述样本数据包括正样本图片和负样本图片,所述正样本图片为包括手掌区域的图片样本,所述负样本图片为不包括手掌区域的图片样本。
[0017]进一步,获取所述正样本图片,包括如下步骤:由人工从预选样本图片集合中筛选出包括手掌区域的图片,并在所述图片上标注手掌所在的区域,保存标注信息,得到正样本图片。
[0018]进一步,获取所述负样本图片,包括如下步骤:
[0019]由人工从预选样本图片集合中筛选出不包括手掌区域且实际应用中的背景图片;
[0020]对所述背景图片进行分割以满足所述正样本图片的尺寸;
[0021]对所述背景图片中重复的特征进行去除,得到负样本图片。
[0022]进一步,训练所述样本数据以选取所述分类器,包括如下步骤:
[0023]分别提取所述正样本图片和负样本图片的图像特征;
[0024]将所述正样本图片和负样本图片的图像特征合并生成训练样本集;
[0025]对所述训练样本集进行抽取以得到检测样本集;
[0026]利用训练样本集对分类器进行训练,并利用所述检测样本集对训练后的分类器进行测试得到当前分类器的准确率;
[0027]迭代设置训练参数得到多个分类器的准确率,并选取准确率最高的分类器作为所述步骤S2中采用的所述分类器。
[0028]进一步,还包括如下步骤:对所述全局缓存中的数据进行定期更新和删除。
[0029]进一步,在所述步骤S3中,复制对所述手掌部区域位置对应的手掌部区域图片至所述全局缓存内,并为所述手掌部区域图片生成唯一的全局UUID,作为该手掌部区域图片名称。
[0030]根据本发明实施例的基于单目摄像头的手势识别方法,通过单目摄像头采集用户的手掌位置区域信息,实现手势智能识别,并利用回调函数调用手势对应操作,进行交互输出,具有识别精度高、硬件设备结构简单的特点。本发明实现运用摄像机和计算机视觉算法来翻译身体语言,借此丰富机器与人之间的沟通桥梁,手势识别技术容许人不需要额外的工具就可以与机器沟通。
[0031]本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
【附图说明】
[0032]本发明的上述和/或附加的方面和优点从结合下面附图对实施例的描述中将变得明显和容易理解,其中:
[0033]图1为根据本发明实施例的基于单目摄像头的手势识别方法的流程框图;
[0034]图2为根据本发明实施例的基于单目摄像头的手势识别方法的流程图;
[0035]图3为根据本发明实施例的初始化摄像头和分类器的流程图;
[0036]图4为根据本发明实施例的获取视频帧的图像特征及分类器筛选的流程图;
[0037]图5为根据本发明实施例的手势判断的流程图;
[0038]图6为根据本发明实施例的手部区域图片取样保存流程图;
[0039]图7为根据本发明实施例的正样本图片获取流程图;
[0040]图8为根据本发明实施例的负样本图片获取流程图;
[0041]图9为根据本发明实施例的正负样本特征提取流程图;
[0042]图10为根据本发明实施例的分类器训练流程图。
【具体实施方式】
[0043]下面详细描述本发明的实施例,实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本发明,而不能理解为对本发明的限制。
[0044]下面参考图1至图10对本发明实施例的基于单目摄像头的手势识别方法进行说明。
[0045]如图1所示,本发明实施例的基于单目摄像头的手势识别方法,包括如下步骤:
[0046]步骤S1,利用单目摄像头拍摄视频,获取单目摄像头采集的视频帧。
[0047]本发明采用单目摄像头作为人机接口,通过单目摄像头读取用户手势进行交互输入。
[0048]在单目摄像头拍摄视频之前,首先对单目摄像头进行初始化,设定单目摄像头的分辨率。
[0049]图3为根据本发明实施例的初始化摄像头和分类器的流程图。
[0050]步骤S301,加载配置文件。
[0051 ]启动程序从配置文件读取配置产生。
[0052]步骤S302,判断是否加载成功,如果是,则执行步骤S304和步骤S305,否则执行步骤 S303。
[0053]步骤S303,提示加载配置文件失败。
[0054]提示初始化失败并报对应错误.。步骤S304,初始化摄像头。
[0055]通过配置参数初始化摄像头,配置摄像头的分辨率。
[0056]步骤S305,初始化分类器。
[0057]用户可以距离单目摄像头一定距离,进行手势挥动操作。由