一种用稀疏原型表示的团队行为分类的迁移学习方法
【技术领域】
[0001] 本发明涉及图形处理技术领域,具体地,涉及一种用稀疏原型表示的团队行为分 类的迀移学习方法。
【背景技术】
[0002] 从少数训练样本中学习视觉分类模型是计算机视觉中的一个重要挑战。为了使机 器实现与人类似的性能,视觉分类的学习方法需要充分利用从以前学过的类别中获得的先 验知识并利用未标记的数据来发现环境中的结构。半监督学习方法可以从未标记的数据找 到结构并使用该结构来提高监督任务的性能 [1],但一般不利用从以前的监督任务学到的先 验知识。
[0003] 迀移学习方法的共同目标是从前面的任务发现表示,实现通过少数样本学习未来 的相关任务。现有的迀移学习方法经常学习先验模型或分类参数的线性流形[2, 3],发现共 同特征的稀疏集[4],或使用基于相关任务的分类输出的表示[5],但一般不利用未标记的数 据。
[0004] 在实现本发明的过程中,发明人发现现有技术中至少存在操作过程复杂、使用不 方便和可靠性低等缺陷。
【发明内容】
[0005] 本发明的目的在于,针对上述问题,提出一种用稀疏原型表示的团队行为分类的 迀移学习方法,以实现操作过程简单、使用方便和可靠性高的优点。
[0006] 为实现上述目的,本发明采用的技术方案是:一种用稀疏原型表示的团队行为分 类的迀移学习方法,包括:
[0007]a、使用未标记的数据集来计算原型表示;这里,未标记的数据是相对于行为识别 过程中已经标注的训练样本数据而言的,该词在人工智能、模式识别中已经有大量应用。
[0008]b、基于原型表示的计算结果,使用相关问题的数据来选择原型中最有识别力的一 个子集;这里,相关问题的数据是指在团队行为识别过程中与某一行为具有相关性的其它 行为构成的数据。最有识别力的指的是对某一行为而言识别能力最强的。
[0009]c、为选定的原型创建了一个基于内核距离的新的表示。这里,新的表示,是指新的 行为的表示。
[0010] 进一步地,所述步骤a,具体包括:
【主权项】
1. 一种用稀疏原型表示的团队行为分类的迁移学习方法,其特征在于,包括: a、 使用未标记的数据集来计算原型表示; b、 基于原型表示的计算结果,使用相关问题的数据来选择原型中最有识别力的一个子 集; C、为选定的原型创建了一个基于内核距离的新的表示。
2. 根据权利要求1所述的用稀疏原型表示的团队行为分类的迁移学习方法,其特征在 于,所述步骤a,具体包括: 给定一个未标记的数据集U= (Xi,X2,X3,…,Xp}和核函数义X义 计算基于到数据集U中未标记的数据点的核距离的原型表示。
3. 根据权利要求2所述的用稀疏原型表示的团队行为分类的迁移学习方法,其特征在 于,所述计算基于到数据集U中未标记的数据点的核距离的原型表示的操作,进一步包括: 山通过计算数据集U中的所有点的核矩阵K来创建原型表示,即数据集U中Xi和Xj.的 核矩阵为Ku=k(x。Xj); 口)创建一个由K中的所有特征向量对应的非零特征值组成的投影矩阵A(特征向量是 通过对K执行SVD获得);新的原型表示由式(1)给出: Z(x) =it(x) (1) 其中,Mx)=比(X,Xi),k(x,X2),…,k(x,Xp)]T,U。
4. 根据权利要求2或3所述的用稀疏原型表示的团队行为分类的迁移学习方法,其特 征在于,所述步骤b,具体包括: 使用了从相关问题得到的训练集的集合C= {Ti,T2,…,Tm}来发现有识别力的原型,其 中,7; = {(坏,片),咕饥,...,说.1':)}; 寻找原型空间中的稀疏表示,该表示是C中所有问题的联合优化。
5. 根据权利要求4所述的用稀疏原型表示的团队行为分类的迁移学习方法,其特征在 于,所述寻找原型空间中的稀疏表示的操作,进一步包括: (1)考虑学习结构原型空间的单个分类器的事件; f(x) =w^z(x) (2) 其中,z(x) =ATiD(X)是算法第一步描述的表示。稀疏原型是一种拥有很少数目的非 零系数的原型; 给定一个n个样本的训练集,在该样环境中的参数估计的自然选择采用式(3)优化参 数来实现:
(3) 式(3)的左项用于估计训练样本过程中分类器引起的误差,该误差根据损失函数1来 估计;式(3)的右项是能够促进稀疏的系数向量的li范数,常数A指定数据的稀疏和逼近 误差之间的权衡系数; 口)使用C中的训练集来学习原型空间中的联合稀疏分类器;学习后的分类器共享大量 非零系数,即行为原型; 定义一个pXm的系数矩阵W,其中,Wa对应于第k个行为中的第j个系数,W的第k列 行为k的系数集,用Wk表示;同时,第j行对应于横跨m个行为的原型j的系数;该矩阵中 m个分类器相应表示为: f,(x) =w/z(x) (4) W中的非零行数对应于m个分类器中任意分类器使用的原型总数,将选择最优的系数 矩阵矿;
(5) 其中,||W|L是一个统计非零行的伪范数; 式巧)中的左项最小化每个分类器在其相应的训练集产生的损失的加权和,其中,入k为第k个行为的损失的权重;式巧)中的右项最大限度地减少了一些相关的问题的非零系 数的原型的数目; 使用同时稀疏逼近的伪范数r。的凸松弛来代替直接求解方程,(1 1,Im)范数采用
式妨可W改写为:
(6) (6)式右项通过结合系数矩阵的li范数和1m范数来促进联合稀疏; 樹当使用较链损失时,式(6)作为一个线性规划:
(7) 当j= 1:P和k= 1:m时k=l:m和i=l:n时 乂如片f)M-句,ff>0 (9) 公式巧)中的约束界定横穿m个行为的第j个原型的系数存在于在区间;约 束方程(9)对每个行为的训练样本的标准松弛变量进行约束。
6.根据权利要求5所述的用稀疏原型表示的团队行为分类的迁移学习方法,其特征在 于,所述步骤C,具体包括: 采用式(7)计算出的最优的系数矩阵和阔值,创建一个新的基于到有关原型的一个子 集的内核距离的表示,定义相关原型集为:
(10) 本发明的技术方案,采用矩阵A中所有列对应5R中的指数来构造一个新的投影矩阵B, 其中A是算法第一步计算出的矩阵巧是一个pXh矩阵,其中A=|W|;新的稀疏原型表示为; v(x) =it(x) (11) 当给定一个新的目标行为时,用V(X)在训练和测试集中投影每一个样本;
【专利摘要】本发明公开了一种用稀疏原型表示的团队行为分类的迁移学习方法,包括:使用未标记的数据集来计算原型表示;基于原型表示的计算结果,使用相关问题的数据来选择原型中最有识别力的一个子集;为选定的原型创建了一个基于内核距离的新的表示。本发明所述用稀疏原型表示的团队行为分类的迁移学习方法,可以克服现有技术中操作过程复杂、使用不方便和可靠性低等缺陷,以实现操作过程简单、使用方便和可靠性高的优点。
【IPC分类】G06K9-00, G06K9-62
【公开号】CN104794488
【申请号】CN201510185557
【发明人】王智文, 夏冬雪, 欧阳浩, 陈劲飙
【申请人】广西科技大学
【公开日】2015年7月22日
【申请日】2015年4月17日