本发明涉及视频图像处理技术领域,尤其涉及一种视频图像目标检测与分割方法及系统。
背景技术:
运动目标检测与跟踪是计算机视觉领域的热点问题,广泛应用于视频监控、人机交互、虚拟现实和图像压缩等。而要在各种复杂的环境中和不同的条件下(如遮挡、光照变化等)都对目标进行准确的跟踪是目前广大研究工作者共同关注的焦点,也是目前实际应用中一个亟待解决的难题。
在视频监控、目标跟踪、运动分析等实际应用系统中,往往要求能够实时检测和分割出目标。运动目标检测是视频序列运动分析与理解的基础,是底层的处理过程,是目标分类、目标跟踪等处理步骤的基础。运动目标检测的主要任务是将运动目标从视频序列中“提取出来”。
背景差分法的实现可以分为已知背景和统计背景两种。已知背景是指在开始进行运动目标检测前预先设定好运动目标的活动背景,在检测的过程中通过当前帧与背景的差分获得运动目标的模版,借助于形态学的开闭运算等方法进行滤波去噪和轮廓平滑。为后续的处理程序提供处理的对象以完成图像的分割和跟踪。在统计背景的背景差分实现中,没有预先设定目标的运动场景,一种比较简单的实现是将连续若干帧的灰度图像叠加,然后进行中值滤波,确定目标的运动场景(背景图像),然后将当前帧与背景图像进行差分,通过形态学等方法的滤波、去噪、平滑,获取运动目标的轮廓。
帧间差分法主要是利用视频序列中连续的两帧或几帧图像的差异来进行目标检测和提取。计算第k帧图像与第k-t帧图像之间的差分,得到差分后的图像Dk,然后对差分后的图像Dk进行二值化,当差分图像中某一像素的值大于某一给定阈值时,该像素为目标像素,反之则认为是背景像素。然后对阈值化后的图像进行连通性分析,当某一连通区域的面积大于某一给定阈值,则认为该区域为目标所占的区域。
光流是指空间中物体被观测面上的像素点运动产生的瞬时速度场,包含了物体表面结构和动态行为等重要信息。基于光流法的运动目标检测采用了运动目标随时间变化的光流特性,由于光流不仅包含了被观测物体的运动信息,还携带了物体运动和景物三位结构的丰富信息,这种方法不仅适用于运动目标的检测,还可以在运动目标跟踪方面使用,甚至在摄像头存在运动的情况下也能检测出独立运动的目标。
现有技术存在以下缺点:
(1)背景差分法的优点就是算法简单,运算速度较快,基本能够满足实时检测的需要,存在的主要问题就是如果采用己知背景实现的话,需要人工干预,预先设定背景图像,自适应能力较差,而统计背景差分法相比较来说不需要人工干预,自适应能力有了很大提高。这两种背景差分法的共同缺点就是对运动目标的空间信息没有充分利用,差分得到的轮廓图像很不准确。
(2)帧间差分法对背景变化的限制比较严格,有时提取的目标与真实轮廓之间差异较大,因此使得该方法的应用受到了较大的限制。
(3)光流法在实际的应用中,由于遮挡、多光源、透明性及噪声等原因,使得光流场基本方程—灰度守恒的假设条件无法满足,不能正确求出光流场,计算方也相当复杂,计算量巨大,不能满足实时的要求。
技术实现要素:
本发明的目的在于克服现有技术的不足,本发明提供了一种视频图像目标检测与分割方法及系统,可以提升帧间差分法的准确性,减少帧间差分法使用时的限制,可以使得图像跟踪和图像分割更加准确。
为了解决上述问题,本发明提出了一种视频图像目标检测与分割方法,所述方法包括:
获取视频图像,根据视频图像获得差分图像;
对差分图像进行插值处理,获得插值处理后的图像;
对插值处理后的图像进行二值化处理,获得二值化图像;
对二值化图像进行连通性检测及判别,获得运动目标的检测结果。
优选地,所述获取视频图像,根据视频图像获得差分图像的步骤,包括:
获取视频图像,并获取视频图像中的第k帧图像;
对第k帧图像进行延时处理,获取第k-1帧图像;
对第k帧图像和第k-1帧图像进行差分处理,获得差分图像。
优选地,所述获取视频图像,根据视频图像获得差分图像的步骤,包括:
获取视频图像,并获取视频图像中的第k帧图像;
对第k帧图像进行延时处理,获取第k-1帧和第k-2帧图像;
对第k帧图像、第k-1帧图像、第k-2帧图像进行差分处理,获得差分图像。
优选地,在所述对插值处理后的图像进行二值化处理的步骤之后,还包括:
对二值化图像进行形态学滤波处理,获得滤波处理后的二值化图像。
相应地,本发明还提供一种视频图像目标检测与分割系统,所述系统包括:
获取模块,用于获取视频图像,根据视频图像获得差分图像;
插值模块,用于对差分图像进行插值处理,获得插值处理后的图像;
二值化模块,用于对插值处理后的图像进行二值化处理,获得二值化图像;
检测模块,用于对二值化图像进行连通性检测及判别,获得运动目标的检测结果。
优选地,所述获取模块包括:
获取单元,用于获取视频图像,并获取视频图像中的第k帧图像;
延时处理单元,用于对第k帧图像进行延时处理,获取第k-1帧图像;
差分处理单元,用于对第k帧图像和第k-1帧图像进行差分处理,获得差分图像。
优选地,所述获取单元还用于获取视频图像,并获取视频图像中的第k帧图像;所述延时处理单元还用于对第k帧图像进行延时处理,获取第k-1帧和第k-2帧图像;所述差分处理单元还用于对第k帧图像、第k-1帧图像、第k-2帧图像进行差分处理,获得差分图像。
优选地,所述系统还包括:滤波模块,用于对二值化图像进行形态学滤波处理,获得滤波处理后的二值化图像。
实施本发明实施例,可以提升帧间差分法的准确性,减少帧间差分法使用时的限制,可以使得图像跟踪和图像分割更加准确。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1是本发明实施例的视频图像目标检测与分割方法的流程示意图;
图2是本发明实施例的视频图像目标检测与分割系统的结构组成示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
图1是本发明实施例的视频图像目标检测与分割方法的流程示意图,如图1所示,该方法包括:
S1,获取视频图像,根据视频图像获得差分图像;
S2,对差分图像进行插值处理,获得插值处理后的图像;
S3,对插值处理后的图像进行二值化处理,获得二值化图像;
S4,对二值化图像进行连通性检测及判别,获得运动目标的检测结果。
图像插值是一个图像数据再生的过程,利用已知像素点的灰度值产生未知像素点的灰度值,由原始图像数据再生出具有高分辨率的图像数据。
目前,插值算法大致可划分为两类,一个是线性方法,另一个是非线性方法。比较常用的线性插值方法有:最近邻插值、双线性插值、双三次插值。中值滤波、有理滤波是较早的用于图像处理的非线性方法。而近年来出现了诸如小波插值、分形插值、向量有理插值等非线性方法。
设被采样函数用f(x)表示,插值函数用g(x)表示,插值节点用xk表示,对于等距节点插值函数可表达为:
g(x)=∑cku(x-xk)
其中u(x)为插值核函数,ck为插值系数,起选取与采样点有关,并且满足
g(xk)=f(xk)
常用的几种线性插值算法的不同就在于u(x)表达式的不同,从而在求插值函数时取的采样点个数不同。
(1)最近邻插值。最近邻插值法也称为点位移法,插值点的值等于它最近邻已知点的值。该算法可由下列插值多项式表示:
即最近邻插值的核函数为:
(2)双线性插值。已知位于单位正方形顶点的四个像元灰度值,根据这4个像素点的灰度值来求正方形内任意一点的灰度值f(x,y),这可由下面的双线性方程得到:
f(x,y)=ax+by+cxy+d
已知四个顶点的f(x,y)值满足上述方程,从而可以确定a,b,c,d的值,从而产生双线性插值函数:
f(x,y)=[f(1,0)-f(0,0)]x+[f(0,1)-f(0,0)]y+[f(1,1)+f(0,0)-f(1,0)-f(0,1)]xy+f(0,0)
双线性插值相当于用三角形函数对采样图像进行卷积,其卷积核表达式为:
(3)三次B样条插值。B样条函数方法定义的B样条舍入误差小,计算稳定,运算量小,计算速度快。其具体表达式为:
具体实施中,S1包括:
获取视频图像,并获取视频图像中的第k帧图像;
对第k帧图像进行延时处理,获取第k-1帧图像;
对第k帧图像和第k-1帧图像进行差分处理,获得差分图像。
另外,使用三帧差分进行计算,采取三帧进行运算,可以提高帧间差分法的准确性,S1进一步包括:
获取视频图像,并获取视频图像中的第k帧图像;
对第k帧图像进行延时处理,获取第k-1帧和第k-2帧图像;
对第k帧图像、第k-1帧图像、第k-2帧图像进行差分处理,获得差分图像。
进一步地,在S3之后还包括:
对二值化图像进行形态学滤波处理,获得滤波处理后的二值化图像。
在本发明实施例中,首先第k帧图像fk经过延时处理得到第k-1帧图像fk-1,接着将两帧图像进行差分得到差分图像Dk。然后,使用上面提到的插值方法,获取一个新的图像Gk,之后再对图像Gk进行二值化以及形态学滤波处理得到了二值化图像。最后经过连通性检测并对二值化图像进行判别进而达到了运动目标检测的目的。
相应地,本发明实施例还提供一种视频图像目标检测与分割系统,如图2所示,该系统包括:
获取模块1,用于获取视频图像,根据视频图像获得差分图像;
插值模块2,用于对差分图像进行插值处理,获得插值处理后的图像;
二值化模块3,用于对插值处理后的图像进行二值化处理,获得二值化图像;
检测模块4,用于对二值化图像进行连通性检测及判别,获得运动目标的检测结果。
进一步地,获取模块1包括:
获取单元,用于获取视频图像,并获取视频图像中的第k帧图像;
延时处理单元,用于对第k帧图像进行延时处理,获取第k-1帧图像;
差分处理单元,用于对第k帧图像和第k-1帧图像进行差分处理,获得差分图像。
使用三帧差分进行计算,采取三帧进行运算,可以提高帧间差分法的准确性,具体地,获取单元还用于获取视频图像,并获取视频图像中的第k帧图像;延时处理单元还用于对第k帧图像进行延时处理,获取第k-1帧和第k-2帧图像;差分处理单元还用于对第k帧图像、第k-1帧图像、第k-2帧图像进行差分处理,获得差分图像。
具体实施中,该系统还包括:滤波模块,用于对二值化图像进行形态学滤波处理,获得滤波处理后的二值化图像。
具体地,本发明实施例的系统相关功能模块的工作原理可参见方法实施例的相关描述,这里不再赘述。
实施本发明实施例,可以提升帧间差分法的准确性,减少帧间差分法使用时的限制,可以使得图像跟踪和图像分割更加准确。
本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成,该程序可以存储于一计算机可读存储介质中,存储介质可以包括:只读存储器(ROM,Read Only Memory)、随机存取存储器(RAM,Random Access Memory)、磁盘或光盘等。
另外,以上对本发明实施例所提供的视频图像目标检测与分割方法及系统进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。