一种基于跨类别迁移主动学习的图像分类方法
【技术领域】
[0001] 本发明涉及图像分类领域,尤其涉及一种基于跨类别迀移主动学习的图像分类方 法。
【背景技术】
[0002] 随着互联网上图像数据的大规模增长,图像分类技术受到广泛的关注和应用。现 有的图像分类技术主要通过有监督学习的方法训练出目标类别的分类模型,即需要为各个 分类模型收集足量的、高质量的有标注数据进行模型训练。这种方式适用与简单的分类任 务和类别比较少的场景。但是随着分类任务的复杂化,比如类别数量多、类别专业化、特殊 化等,为目标类别收集足量的有标注数据的成本大大上升。所以,如何尽可能地节省标注成 本,用尽可能少的有标注数据来训练出准确的分类模型,在学术界和工业界都是一个重要 的研究课题。
[0003] 为了减少数据的标注成本,有两种常用的解决方案。第一种是主动学习 (Active Learning)。主动学习的基本思想是:数据具有不同的信息量,如果学习算法能够挑选出那 些最具信息量的数据来进行标注,那么即使只有很少的数据被标注了,这些数据所拥有的 信息也能保证学习出的分类模型足够精确。另一种是迀移学习 (Transfer Learning)。迀移 学习的基本思想是:对于目标领域和任务,往往可以找到一些和它不同但是相关的辅助领 域和任务,在辅助领域中拥有足量的有标注数据。即使只在目标领域中只有少量的数据,也 能通过从辅助领域中迀移足量的知识来学习出准确的分类模型。当然,研究者们两种方案 结合在一起,即迀移主动学习 (Transfer Active Learning),通过同时从辅助领域迀移知 识和选择最优信息量的数据进行标注,也取得了一些不错的成果。但是,现有的迀移主动学 习方法都有一个非常强的假设:目标领域和辅助领域所具有的数据的类别是完全一致的, 只是数据在这些类别上的概率分布有差异。显然,这个假设在实际应用中太过苛刻了。对于 目标领域,如果它包含大量的类别,或者所包含的类别的特殊性很强,要构建出一个类别与 之完全相同的辅助领域也是一个成本很高的过程,这样违背了迀移主动学习的初衷。
[0004] 从目前的研究来看,现有的迀移主动学习方法都只能处理目标领域和辅助领域的 类别完全一模一样的情况,针对二者完全不同的解决方案还没有,但后者却是实际应用中 更常见的情况。所以,如何在目标领域与辅助领域的类别相关但是不同的情况下,有效地从 辅助领域迀移有价值的信息、同时在目标领域选择最有信息量的样本进行标注,以尽可能 在极低的标注成本下训练足够准确的分类模型,仍需要进一步的研究。
【发明内容】
[0005] 本发明旨在提供一种基于跨类别迀移主动学习的图像分类方法,以解决目前在目 标领域与辅助领域的类别相关但是不同的情况下,有效地从辅助领域迀移有价值的信息、 同时在目标领域选择最有信息量的样本进行标注,以尽可能在极低的标注成本下训练足够 准确的分类模型的问题。
[0006] 本发明的发明目的是通过下述技术方案来实现的:
[0007] 一种基于跨类别迀移主动学习的图像分类方法,包括如下步骤:
[0008] 步骤S1:利用特征抽取工具分别对辅助类别数据中的图像与目标类别数据中的有 标注图像和无标注图像进行向量化特征表示,得到辅助类别图像特征向量和目标类别图像 特征向量;
[0009] 步骤S2:分别针对辅助类别数据和目标类别数据构建出辅助类别属性表示和目标 类别属性表示;
[0010] 步骤S3:利用步骤S1中得到的辅助类别图像特征向量和目标类别图像特征向量, 以及步骤S2中得到的辅助类别属性表示和目标类别属性表示构造目标函数;
[0011] 步骤S4:利用迭代式的优化方法求解上一步得到的目标函数,并得到生成函数;
[0012] 步骤S5:利用上一步得到的生成函数以及步骤S2中得到的目标类别属性表示,直 接产生各个目标类别对应的分类模型;
[0013] 步骤S6:判断步骤S5中得到的分类模型的准确性是否符合要求,如果符合结束本 次学习,如果不符合转下一步;
[0014] 步骤S7:利用步骤S5中得到的分类模型,计算目标类别数据中所有无标注图像的 不确定性,并按不确定性从大到小进行排序;
[0015] 步骤S8:选取上一步中不确定性最大的无标注图像进行标注,将无标注图像转化 为有标注图像;
[0016] 步骤S9:对目标类别数据中图像的权重进行更新;然后转步骤S3。
[0017]进一步的,所述步骤S2:分别针对辅助类别数据和目标类别数据构建出辅助类别 属性表示和目标类别属性表示中,利用维基百科上学习出的单词表示作为类别属性表示。
[0018]进一步的,所述步骤S3中构造出的目标函数为:
[0021]其中,α和β是控制各部分在目标函数中权重的超参数;
[0022]
表示一个矩阵所有元素的平方和;
[0023] = OtXt, = 〇tYt为加权的数据,执=…,θΠ?)表示目标类别数据 中各个图像的权重;
[0024] xs = …为步骤S1中所述的辅助类别图像特征向量X〖构成的矩阵;
[0025] Xt = …,4t]为步骤S1中所述的目标类别图像特征向量X丨构成的矩阵;
[0026] ^ = Lyi-yi y;u为辅助类别数据中每个图像所对应的类别向量y〖构成的矩 阵;
[0027] As = [a^ai…a【s ]为辅助类别数据中每个辅助类别属性向量a〖构成的矩阵,所 述辅助类别属性向量#为所述步骤S2中辅助类别属性表示的一种表示方法;
[0028] At = [3?2,…<3^ ]为目标类别数据中每个目标类别属性向量a[构成的矩阵,所 述目标类别属性向量a丨为所述步骤S2中目标类别属性表示的一种表示方法;
[0029] Yt = 为待预测的目标类别数据中每个图像所对应的类别向量yf构 成的矩阵;
[0030] V为待预测的生成函数的参数;
[0031] yf为目标类别数据中无标注图像所对应的类别向量;
[0032] £为目标类别数据中的有标图像集,1/为目标类别数据中无标图像集。
[0033]进一步的,所述步骤S4:利用迭代式的优化方法求解上一步得到的目标函数,并得 到生成函数,具体包括如下步骤:
[0034] (1)优化Yt:将V固定,所述目标函数对于Yt为行解耦,对矩阵式目标函数的每一行 进行单独处理,目标函数对于目标类别数据中无标注图像对应的类别向量#的部分如下:
[0036]优化Yt的公式如下:
[0038] (2)优化V:在Yt固定的条件下,进行如下定义:
[0040]目标函数进行如下近似:
[0042] 上式对于V的导数如下:
[0044] 再令上述导数为0,可以得到优化V的公式如下:
[0045] ν=(Χ,Χ+βΙ)-YYAU'A)-1
[0046] 按上述方法不断迭代优化V和ft直至目标函数的值收敛,同时得到生成函数参数 V。
[0047] 再利用生成函数参数V得到生成函数g(ac)=acV',其中ac为图像的类别属性表示。
[0048] 进一步的,所述步骤S5中各个目标类别对应的分类模型的计算公式为:
[0049] fc(x) = x\g'(ac)
[0050] 具中 =.
[0051] 进一步的,所述步骤S7中计算目标类别数据中所有无标注图像的不确定性的方法 采用最优比次优法,具体步骤如下:
[0052]步骤S7. 1 :计算出无标注图像在各个目标类别的分类模型上的响应值 〇jC = fc(x)=对外~),,其中ac = af,xf为无标注图像的特征向量,并对响应值0jc从高至ij低 进行排序;
[0053] 步骤S7.2:找出两个最大的响应值0jC jP〇jC2 ;
[0054] 步骤S7.3:根据两个最大的响应值〇jCl和之差衡量无标注图像的不确定性,无 标注图像的不确定性u〇4;) = Ad'-"。
[0055] 进一步的,所述步骤S9中对目标类别数据中图像的权重进行更新,所述权重可由 如下公式进行更新:
[0057] 其中δ是一个比例因子。
[0058]本发明的有益效果:
[0059] (1)本发明提出学习出一个生成函数,该函数利用类别的属性信息作为输入,输出 对应类别的分类模型的参数,通过结合辅助类别和目标类别进行学习,该生成函数能够有 效地将有价值