基于多特征融合的简单背景下的叶片识别方法
【技术领域】
[0001] 本发明属于计算机图像处理领域,涉及一种基于多特征融合的简单背景下的叶片 识别方法。
【背景技术】
[0002] 随着图像获取设备及互联网的迅速发展,海量的图像数据正在生成,而这些图像 所包含的信息也变得越来越重要。如何利用计算机视觉、机器学习等技术方便、快速地检索 图像,也逐渐变成了研宄热点。
[0003] 从上世纪70年代开始,图像检索这个领域已经十分活跃。首先主要是基于文本的 图像检索技术,将图像与对其的文本描述存储至数据库中,而查询时是根据对图像的文本 描述进行检索。但是慢慢的基于文本的图像检索技术的问题就越来越多了。由于当时的技 术受限必须由人工来对图像进行进行关键字的标注工作,非但十分耗时耗力,而且人工的 标注往往存在一些偏差,最终导致错误的检索结果。同时,图像中包含的视觉特征在该技术 下也被完全忽略了。
[0004] 到了上世纪90年代,为了克服基于文本的图像检索技术产生的一系列问题,基于 内容的图像检索技术诞生了。基于内容的图像检索技术不需要对图像进行人工标注,而是 利用计算机视觉技术对越图像提取其视觉特征,例如颜色、形状和纹理等,然后再对特征进 行匹配,最后返回用户相似的图像。现在,该技术已经得到了广泛应用,包括公安部门指纹 图像的分析、卫星云图的分析等。
[0005] 现在,基于内容的细粒度的图像检索正在兴起。传统的基于内容的图像检索旨在 对不同大类的物体图像进行分类,而人们越来越希望能对于同一大类物体的图像进行检 索,例如鸟类、真菌等,于是基于内容的细粒度图像的检索应运而生。
[0006] 植物作为人类赖以生存的元素,自然是人类关注的焦点,人类对于通过计算机而 非人工来自动完成对植物图像的鉴别、分类以及检索工作的需求也越来越迫切。
【发明内容】
[0007] 本发明的目的在于克服现有技术的不足,提供一种基于多特征融合的简单背景下 的叶片识别方法。
[0008] 本发明的目的是通过以下技术方案来实现的:一种基于多特征融合的简单背景下 的叶片识别方法,包括以下步骤:
[0009] (1)经过大津阈值法将叶片图像中的叶片与背景分割开来获得叶片;
[0010] (2)对分割得到的叶片图像提取多个叶片特征,包括多尺度三角特征、定向片段直 方图、基于轮廓关键点的特征以及叶片的几何特征;
[0011] (3)在进行叶片识别时,将多个叶片特征通过基于位置敏感哈希(LSH)方法映射 到哈希表,每个叶片特征都通过K近邻得出与它最匹配的候选特征列表;使用加权置信评 分得到最后的识别结果;
[0012] (4)对步骤3得到的识别结果通过潜在语义分析算法进行进一步重排序,提高识 别效果。
[0013] 进一步地,所述步骤1中,大津阈值法使用某一个阈值将灰度图像根据灰度大小, 分成目标部分和背景部分两类,在这两类的类内方差最小和类间方差最大的时候,得到的 阈值是最优的二值化阈值;具体包括以下子步骤:
[0014] (1. 1)将简单背景下的叶片图像转换为灰度图;
[0015] (1. 2)计算灰度图的平均灰度:对于一张大小为MXN的图像,统计获得灰度为i 对应的像素个数为rV则平均灰度值u可由下式得出:
【主权项】
1. 一种基于多特征融合的简单背景下的叶片识别方法,其特征在于,包括w下步骤: (1) 经过大津阔值法将叶片图像中的叶片与背景分割开来获得叶片; (2) 对分割得到的叶片图像提取多个叶片特征,包括多尺度=角特征、定向片段直方 图、基于轮廓关键点的特征W及叶片的几何特征; (3) 在进行叶片识别时,将多个叶片特征通过基于位置敏感哈希(LSH)方法映射到哈 希表,每个叶片特征都通过K近邻得出与它最匹配的候选特征列表;使用加权置信评分得 到最后的识别结果; (4) 对步骤3得到的识别结果通过潜在语义分析算法进行进一步重排序,提高识别效 果。
2. 根据权利要求1所述的一种基于多特征融合的简单背景下的叶片识别方法,其特征 在于,所述步骤1具体包括W下子步骤: (1. 1)将简单背景下的叶片图像转换为灰度图; (1. 2)计算灰度图的平均灰度:对于一张大小为MXN的图像,统计获得灰度为i对应 的像素个数为ni,则平均灰度值U可由下式得出:
(1. 3)计算求解最佳阀值t的相关变量;记t为目标与背景的分割阀值,目标像素占的 比例为Wi,目标像素的平均灰度为Ui,则
其中Wi是灰度值大于t的统计值;
同理可得到背景像素占的比例W2及平均灰度U2; (1. 4)求解最佳阀值t;遍历步骤1. 3中得到的t,使得下式最大: G=Wi* (Ui-U) 2+"2* (U2-U) 2 (1. 5)将根据阀值t获得的背景像素赋予白色。
3. 根据权利要求1所述的一种基于多特征融合的简单背景下的叶片识别方法,其特征 在于,所述步骤2中,所述多尺度=角特征具体为:形状边界由N个均匀地分布在叶片轮廓 上的采样点Pi,...,Pw的序列表示,然后将该些采样点按照顺时针的顺序进行排列;每个采 样点Pi由在不同尺度下的Ns个S角形进行表示;引入d(k)用于表示在尺度k中的S角形 点之间的距离,由边界点的数量进行表述,其中1《k《化;选择在Pi两侧的化个点组成的 两个集合来描述Pi,化的选择取决于是否寻求捕获本地或全局信息;距离d(k)为均匀的或 对数的海一个边界点Pi与化个立角形相关联,该些立角形由边界点Pwoo、P山及Pwoo组 成;使用S角形边长和角度特征(TSLA) ; A)=(巧1作7;),...,巧心/(7,八'、)); 假设Lik,L2K和L3k是由边界点Pi-doo、P山及Pwoo组成的;角形於;条边,且长度从小到大 排列,设Mk=Lik/Lsk、Nk=L2k/L3k,假设0为S角形7l的顶点Pi的角度的绝对值,则於的TSLA特征可表述为S元组(Mk,Nk,0 )。
4. 根据权利要求1所述的一种基于多特征融合的简单背景下的叶片识别方法,其特征 在于,所述步骤2中,所述定向片段直方图具体为;任何轮廓都是一连串连续的元素成分组 成的,一个元素成分可W是一个像素;对于轮廓上的每个像素,通过计算两个变量的均值来 关联方向信息,该两个变量为从原始图像计算出的梯度的角度0W及0的导数0';变量 0的值是绝对的,它对应于原始图像的梯度角度;该些角度被投影到一个量化的[〇,2n