一种基于汉明嵌入核的图像概念检测方法及其汉明嵌入核的利记博彩app

文档序号:8339989阅读:674来源:国知局
一种基于汉明嵌入核的图像概念检测方法及其汉明嵌入核的利记博彩app
【技术领域】
[0001] 本发明属于图像概念检测技术领域,尤其涉及一种基于汉明嵌入核的图像概念检 测方法及其汉明嵌入核。
【背景技术】
[0002] 概念检测作为基于内容的图像检索最基本的一步,在过去几年里已经进行了深入 的研宄,并且提出了许多有效的方法和特征。对于分类器,SVM(支持向量机)已经被广泛 地应用。为了提升SVM的性能,一个能够准确地描述图像样本之间距离的方法起着关键的 作用。
[0003] 在表示图像的各种特征中,视觉词袋特征(Bag-of-Visual-Words,BoW)由于其高 效性以及利用图像局部信息区分不同概念的能力,取得了巨大的成功。在典型的BoW特征 提取过程中,首先检测图像的局部兴趣点(也称作关键点),并用一个128维的尺度不变特 征变换(Scale-Invariant Feature Transformation,SIFT)描述符描述关键点的描述符。 这些关键点然后根据其SIFT描述符被聚类为不同的视觉单词,从而构建视觉词典。最后, 对每个图像,通过映射其中每个关键点到其最相似的视觉单词,并统计每个单词对应的关 键点的数量,生成该图像在视觉词典上的直方图,也即BoW特征用于表示图像内容。在SVM 分类过程中,BoW特征用于计算不同图像之间的距离,进而将含有不同概念的图像进行区 分。
[0004] 在构建视觉词典的过程中,对SIFT描述符的聚类相当于把对应的128维空间分割 为不同的泰森分区(Voronoi cell),其中每个分区对应一个视觉单词。对给定图像,通过 统计分配到每个分区的关键点数量从而生成BoW特征。这种方法只是简单地认为落在一个 分区的所有点都是相同的,这样会导致不同图像样本之间的距离度量不是很准确。参阅图 3a,在三个图像(IpIdPI 3)中,从每个图像得到四个点映射到相同的视觉单词(或者说在 同一个泰森分区中)。根据传统BoW方法,因为只是对每个分区中的关键点计数,所以三个 图像被认为是相同的,它们之间的距离全部为0。但在给定的分区中,IJPI 3之间的距离很 显然要比1:和12之间的距离要大。BoW模型并没有考虑这个差异,它假设同一分区中的所 有点都是相同的。这是因为关键点SIFT描述符的详细信息在映射到视觉单词的过程中被 丢失。典型地,通过分割128维SIFT描述符空间至200到5000个分区中生成视觉词典和 BoW特征,因此每一个分区的尺寸都会非常大,映射到相同视觉单词的点之间的差异也会非 常大。由于忽略了这些差异,BoW方法在很大程度上丢失了 SIFT描述符的区分能力,导致 对不同图像样本之间的距离估计精确度大幅降低,从而最终会影响分类器的性能。
[0005] 为了克服现有技术的上述缺陷,本发明提出了一种基于汉明嵌入核的图像概念检 测方法及其汉明嵌入核。

【发明内容】

[0006] 本发明提出了一种基于汉明嵌入核的图像概念检测方法,包括如下步骤:
[0007] a.提取两幅以上训练图像的局部兴趣点,利用尺度不变特征描述符来描述所述局 部兴趣点的视觉信息,根据所述描述符利用k-means算法将所有局部兴趣点进行聚类获得 多个类;构建视觉词典,所述视觉词典中的每个视觉单词对应于一个类或者尺度不变特征 空间中的一个泰森分区;
[0008] b.对每一幅图像,根据所述描述符将所述局部兴趣点分配至不同的视觉单词或泰 森分区,统计分配到每个视觉单词的局部兴趣点的数量,形成所述图像的视觉词袋特征;
[0009] C.生成每个局部兴趣点的二进制签名,对汉明嵌入核进行离线训练;
[0010] d.依据步骤b和步骤C建立两幅以上待检测图像的局部兴趣点的二进制签名; [0011] e.对于同一个泰森分区中的局部兴趣点,计算两个局部兴趣点的二进制签名之间 的汉明距离,作为所述局部兴趣点之间的距离;
[0012] f.对于同一个泰森分区内不同待检测图像的局部兴趣点集,根据所述汉明距离计 算所述局部兴趣点集中任意局部兴趣点之间的欧式距离;
[0013] g.依据所述欧氏距离,利用Hungarian算法寻找所述局部兴趣点集之间的最优匹 配,计算所述局部兴趣点集之间的距离;
[0014] h.基于所述距离计和所述局部兴趣点集之间的距离生成汉明嵌入核,所述汉明嵌 入核以如下公式表不
【主权项】
1. 一种基于汉明嵌入核的图像概念检测方法,其特征在于,包括如下步骤: a. 提取两幅以上训练图像的局部兴趣点,利用尺度不变特征描述符来描述所述局部兴 趣点的视觉信息,根据所述描述符利用k-means算法将所有局部兴趣点进行聚类获得多个 类;构建视觉词典,所述视觉词典中的每个视觉单词对应于一个类或者尺度不变特征空间 中的一个泰森分区; b. 对每一幅图像,根据所述描述符将所述局部兴趣点分配至不同的视觉单词或泰森分 区,统计分配到每个视觉单词的局部兴趣点的数量,形成所述图像的视觉词袋特征; c. 生成每个局部兴趣点的二进制签名,对汉明嵌入核进行离线训练; d. 依据步骤b和步骤c建立两幅以上待检测图像的局部兴趣点的二进制签名; e. 对于同一个泰森分区中的局部兴趣点,计算两个局部兴趣点的二进制签名之间的汉 明距离,作为所述局部兴趣点之间的距离; f. 对于同一个泰森分区内不同待检测图像的局部兴趣点集,根据所述汉明距离计算所 述局部兴趣点集中任意局部兴趣点之间的欧式距离; g. 依据所述欧氏距离,利用Hungarian算法寻找所述局部兴趣点集之间的最优匹配, 计算所述局部兴趣点集之间的距离; h. 基于所述距离计和所述局部兴趣点集之间的距离生成汉明嵌入核,所述汉明嵌入核 以如下公式表示:/?(/p,./q)= 其中,σ是表示一个自由参数,s 表示视觉词典的大小,c表示一个视觉单词,15和I,分别表示两个图像,K/p, 表示图像 15和I ,中分配到视觉单词c上的局部兴趣点集之间的距离; i. 利用所述汉明嵌入核为每一个概念u训练一个支持向量机,所述支持向量机用于将 所有图像分为含有概念u的图像和不含概念u的图像;利用所述支持向量机对任一给定图 像进行概念检测,输出所述图像中含有概念u的概率值。
2. 如权利要求1所述的基于汉明嵌入核的图像概念检测方法,其特征在于,所述步骤c 对汉明嵌入核进行离线训练包括如下步骤: cl.生成正交投影矩阵P (lbX S),其中Ib表示二进制签名的长度,S表示视觉词典中视 觉单词的总数;生成SXS的高斯矩阵,对所述高斯矩阵进行因式分解得到所述正交投影矩 阵的前Ib行元素; c2.随机生成特征向量,所述特征向量被映射到所述视觉词典中的视觉单词;对于给 定一个描述符r,由所述特征向量映射到视觉单词,并通过所述正交投影矩阵P投影产生Ib 维的投影分量 c3.对于每个视觉单词,依据所有投影分量tH十算I b维的中值,产生SX I b的矩阵M, 所述矩阵M中的每一行关联视觉词典中的一个单词。
3. 如权利要求1所述的基于汉明嵌入核的图像概念检测方法,其特征在于,所述步骤d 建立两幅以上待检测图像的局部兴趣点的二进制签名包括如下步骤: dl.将描述符r映射建立到视觉单词wi; d2.利用正交投影矩阵P投影所述描述符r,产生Ib维的投影向量t、 d3.通过比较向量f与矩阵M的第i行元素计算二进制签名,所述二进制签名以如下 公式表示:
式中,bk(r)表示二进制签·^,1?衣不仅影丨叫重r屮的弟k τ兀系,M i.k衣不所述矩阵M 中坐标为(i,k)的元素。
4. 如权利要求1所述的基于汉明嵌入核的图像概念检测方法,其特征在于,二进制签 名之间的汉明距离以如下公式表示:
其中,h(r)、h(r')分别表示两个描述符r和r'所对应的二进制签名的第j个二进 制位,Ib为二进制签名的长度,'为异或运算符。
5. 如权利要求1所述的基于汉明嵌入核的图像概念检测方法,其特征在于,每个局部 兴趣点和另一个待检测图像中最邻近的局部兴趣点的二进制签名的汉明距离以如下公式 表不:
i = l,2,…,m,j = l,l,…,n,k=l,l,…,m-n,m>n; 式中,pci(i = 1,2,...,m)和qcj(j = 1,2,...,n)分另Ij表示两个待检测图像中映射到 视觉单词c的局部兴趣点,Vk表示为了保证两个图像中的点能够一一对应所加入的虚拟点, d(pci,qci)表示pci和q cJ之间的距离,H(p ci,qcJ)表示pci和q cJ对应的二进制签名之间的汉 明距离,Ib表示二进制签名的长度,d(p ei,vk)表示PcJP V k之间的距离。
6. 如权利要求1所述的基于汉明嵌入核的图像概念检测方法,其特征在于,利用 Hungarian算法寻找所述局部兴趣点集之间的最优匹配,对任意两个局部兴趣点之间的二 进制签名的汉明距离设置权重值并加和得到所述欧氏距离,所述欧式距离以如下公式表 示:
式中,Φ (Pcd)表示局部兴趣点集之间的最优匹配,d(Pc;i,Φ (Pj)表示Pcd与其匹配的 局部兴趣点之间按照步骤e所计算的距离,m表示图像Ip中映射到视觉单词C的局部兴趣 点的个数。
7. -种汉明嵌入核,其特征在于,所述汉明嵌入核以如下公式表示:
其中,σ表示一个自由参数,s表示视觉词典的大小,c表示一个视觉单词,4 (/ρ,/q) 表示图像15和I ,中映射到视觉单词c上的局部兴趣点集之间的距离。
8. 如权利要求7所述的汉明嵌入核,其特征在于,利用所述汉明嵌入核为每一个概念u 训练一个支持向量机,所述支持向量机用于将所有图像分为含有概念u的图像和不含概念 u的图像;利用所述支持向量机对任一给定图像进行概念检测,输出所述图像中含有概念u 的概率值,实现对图像概念的自动检测。
【专利摘要】本发明公开了一种基于汉明嵌入核的图像概念检测方法,包括提取训练图像的局部兴趣点,通过SIFT建立视觉词典;生成局部兴趣点的二进制签名,对汉明嵌入核进行离线训练;生成局部兴趣点的二进制签名;计算二进制签名之间的汉明距离;计算任意局部兴趣点之间的欧氏距离;寻找局部兴趣点之间的最优匹配;生成汉明嵌入核;以及利用汉明核进行图像概念检测。本发明对汉明嵌入进行改进并融入SVM内核用于图像概念检测,增强了视觉词袋模型对不同图像内容和概念的区分能力。本发明还公开了一种汉明嵌入核。
【IPC分类】G06K9-62
【公开号】CN104657742
【申请号】CN201510035277
【发明人】王峰, 秦督
【申请人】华东师范大学
【公开日】2015年5月27日
【申请日】2015年1月23日
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1