一种基于梯度下降法的多视图gepsvm网页分类算法

文档序号:10656140阅读:505来源:国知局
一种基于梯度下降法的多视图gepsvm网页分类算法
【专利摘要】本发明提出了一种基于梯度下降法的多视图GEPSVM网页分类算法,包括MvGDSVM网页分类模型参数训练步骤和网页数据分类步骤;MvGDSVM网页分类模型参数训练步骤包括:步骤A:输入网页训练样本数据;步骤B:对网页训练样本数据进行预处理;步骤C:训练MvGDSVM网页分类模型参数;网页数据分类步骤包括:步骤a:输入待测网页样本数据;步骤b:对待测网页样本数据进行标准化预处理;步骤c:通过MvGDSVM网页分类模型对待测网页样本数据进行分类。本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法,通过引入一个多视图协同规范化项来最大化不同视图间分类的一致性,从而有效地结合了两个单视图的提高性的广义特征值最接近支持向量机,最后利用共轭梯度下降法来求解生成的优化问题。
【专利说明】
-种基于梯度下降法的多视图化PSVM网页分类算法
技术领域
[0001] 本发明设及网页分类技术领域,尤其设及一种基于梯度下降法的多视图GEPSVM网 页分类算法(简称MvGDSVM网页分类算法)。
【背景技术】
[0002] 近年来,随着互联网的普及,网络信息呈指数级增长,它已经成为人们获取信息的 重要手段。面对海量而又内容复杂的网络信息,很多时候无法准确定位自己想要的信息,而 通过网页的分类,可W从海量的网络信息中迅速、准确的获取用户感兴趣的信息。
[0003] 目前,现有的广义特征值最接近支持向量机(Generalized eigenvalue proximal support vector machine,GEPSVM)W及提高性的广义特征值最接近支持向量机(Improved generalized eigenvalue proximal support vector machine,IGEPSVM)都是简单有效的 分类方法。
[0004] 1.广义特征值最接近支持向量机
[0005] a)线性的 GEPSVM
[0006] 广义特征值最接近支持向量机是监督学习中一种简单且有效的二分类方法,利用 两个超平面来对数据点进行分类。其中每一个超平面离两类数据的其中一类尽量近,离另 外一类尽量远。广义特征值最接近支持向量机通过解一对广义特征值问题来获得运两个非 平行的超平面。
[0007] 假设在实空间Rd中,有n个标签为yi(i = l,2,. . .,n)G{ + l,-l}的样本点。其中,矩 阵Je度"ixd表示属于+1类的样本在第一个视图上的特征,矩阵公e/T"'表示属于-1类的样 本在第二个视图上的特征(ni+n2 = n)。
[000引在实空间Rd中定义两个超平面:
[0009]
CD
[0010] GEPSVM在最接近超平面上擬弃了标准的SVM中两个超平面平行的条件,而要求:第 一个超平面离类+1的样本点尽可能近,离类-1的样本点尽可能远;第二个超平面离类-1的 样本点尽可能近,离类+1的样本点尽可能远。GEPSVM的决策目标产生了如下一对优化问题:
[0015]
(4)
[0011] (2)
[0012]
[001引 巧)
[0014] 其中M」陵示2-范数。W上的两个优化问题可W被简化成:
[0016] 和
[0017] (5)
[001引 :)和(5)可W被规范化成:
[0019] (贷》
[0020]
[0021] (7)
[0022] 其中e是个非负的权重系数。
[0023] 做出如下定义:
[0024]
化)
[00剧其中G和H是两个在上的对称矩阵,Zi和Z2是两个在R"喘超平面参数。那 么优化问题(6)和(7)可W简写成:
[0026] (9)
[0027]
[002引 (1的
[0029] 上面的优化问题(9)和(10)是完全瑞利商的,所W它们的全局最优解可W通过求 解W下相关的广义特征值问题得到
[0030] (G+e Dzi = AHzi, Zi^O (11)
[0031] 和
[0032] 巧+ei)z2 = AGz2,Z2 声 0. (12)
[0033] 第一个和第二个最优接近超平面分别是广义特征值问题(11)和(12)对于最小特 征值相对应的特征向量。
[0034] 显然,对于一个测试样本X,线性的GEPSVM的预测函数是
[0035]
(13)
[0036] 其中I .是个绝对值函数,I"",,I表示X到第一个分类超平面的垂直距离, Ii Wj Il ^^^^^^^表示^到第二个分类超平面的垂直距离。运个预测函数表明如果样本^离第一个 Il ^2 Il 分类超平面比较近,它就被分到类+1,否则它被分到类-1。
[0037] b)核方法的 GEPSVM
[0038] 线性的GEPSVM可W通过核方法来泛化到非线性的情况。考虑一下两个核生成的超 平面代替平面(I):
[0039]
, (14)
[0040] 其中
《是个核函数。在本文中,主要考虑常用的高斯核(Gaussian kernel),它的第ij(i = l,2,...,ni,j = l,2,...,n)个元素如下给出:
[0041 ] , (巧)
[0042] t注意到其实平面(1)是一个(14)的 特殊情况:假设使用一个线性核
[0043] 后面训练得到两个超平面的过程与线性的GEPSVM的训练过程形式相同。
[0044] 对于一个测试样本X,核的GEPSVM的预测函数是
[0045]
(巧)
[0046] 其中iy_点叫表示X到第一个基于核的分类超平面的距离, yjUi KiC 乂 脚 表示X到第二个基于核的分类超平面的距离。运个预测函数表明如果样 小!; Ki、C,C )!i; 本X离第一个分类超平面比较近,它就被分到类+1,否则它被分到类-I。
[0047] 2.提高性的广义特征值最接近支持向量机 [004 引 a)线性的 IGEPSVM
[0049] GEPSVM的决策目标产生了如下一对优化问题:
[(K)加] (17)
[0化1 ]
[0052] 。8)
[0化3]其中II. M表示2-范数。
[0054] GEPSVM在广义特征值分解时会产生奇异值问题,为了克服运个缺陷,IGEPSVM使用 减来代替GEPSVM中的除来衡量两类样本到分类超平面之间的距离差。那么优化问题(17)和 (18)可W被转化成:
[005引 。9)
[0化6]
[0057] 口0)
[005引其中V是个权重系数。为了消去超平面变量(wi,丫 I) (i = I,2)的范数,引入一个 Ti化onov规范化项。然后通过如下的定义:
[0化9]
[0060]然后优化问题(19)和(20)可W被规范化成:
[0061 ] (21)
[0062]
[0063] (22)
[0064] W上的两个优化问题是完全瑞利商的。式(21)的拉格朗日函数可W写成:
[00化]
(23)
[0066] 其中Al和A2是拉格朗日乘子。令式(23)关于变量(zi,ai)求偏导后的值为零,得到 W下等式
[0067] 2(G+eI-vH)z 广 2 入IZ = O.
[0068] 所W优化问题(21)的全局最优解可W通过求解下面的特征值问题求得
[0069] (G+eI-vH)zi = Aizi.(24)
[0070] 相似的,优化问题(22)的全局最优解可W通过下面的特征值问题求得
[0071] (H+eI-vG)z2 = Aiz2.(25)
[0072] 第一个和第二个最优接近超平面分别是特征值问题(24)和(25)对于最小特征值 对应的特征向量。
[0073] 显然,对于一个测试样本X,线性的IGEPSVM的预测函数是
[0074]
[0075] b)核的 IGEPSVM
[0076] 线性的IGEPSVM可W通过核方法来泛化到非线性的情况。考虑一下两个核生成的 超平面代替平面(1):
[0077] (紙)
[007引
[0079] 后面的训练过程与线性的IGEPSVM的训练过程形式相同。而核的IGEPSVM的预测准 则和核的GEPSVM相同。
[0080] 但目前,现有的不管是广义特征值最接近支持向量机,还是提高性的广义特征值 最接近支持向量在网页分类的应用都不是很广泛。因为运两个算法都是单视图的分类算 法,有着一定的局限性。它们都不能充分利用网页的多个视图上的特征信息,在网页上的分 类精度还有提高的空间。

【发明内容】

[0081] 本发明提出一种多视图GEPSVM算法用于网页分类,能够充分利用网页的多个视图 信息,来提高分类性能。
[0082] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,包括MvGDSVM网 页分类模型参数训练步骤和网页数据分类步骤;
[0083] 所述MvGDSVM网页分类模型参数训练步骤包括:
[0084] 步骤A:输入网页训练样本数据;
[0085] 步骤B:对所述网页训练样本数据进行预处理;
[0086] 步骤C:训练MvGDSVM网页分类模型参数;
[0087] 所述网页数据分类步骤包括:
[0088] 步骤a:输入待测网页样本数据;
[0089] 步骤b:对所述待测网页样本数据进行标准化预处理;
[0090] 步骤C:通过MvGDSVM网页分类模型对所述待测网页样本数据进行分类。
[0091] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,所述步骤B中的 预处理包括:
[0092] 步骤BI:确定所述网页训练样本数据每个视图上的特征向量;
[0093] 步骤B2:对所有所述网页训练样本数据的每个视图上的特征向量分别作标准化处 理。
[0094] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,所述步骤C中,通 过多视图协同规范化项来最大化不同视图间分类的一致性。
[00M]本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,所述步骤C包括:
[0096] 步骤Cl:在每个视图上最大化两类样本与超平面之间的距离差,同时最小化在同 一个网页训练样本上两个假设函数作用在不同视图上的结果;
[0097] 步骤C2:使用共辆梯度下降法优化目标函数,给出目标函数的梯度。
[0098] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,所述步骤C进一 步包括:
[0099] 步骤C3:利用MvGDSVM求得分类超平面参数;
[0100] 步骤C4:分别计算每个视图上网页训练样本到两个超平面的垂直距离,得到决策 函数的预测结果。
[0101] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,所述步骤b中标 准化预处理包括:
[0102] 步骤bl:确定待测网页样本数据每个视图上的特征向量;
[0103] 步骤b2:对所有待测网页网页数据的每个视图上的特征向量分别作标准化处理。
[0104] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,所述步骤C中对 所述待测网页数据进行分类包括:
[0105] 步骤Cl:利用训练样本数据得到的MvGDSVM分类模型的最佳参数,分别计算每个视 图上样本到两个超平面的垂直距离;
[0106] 步骤c2:利用训练时得到的最佳预测函数来对待测网页样本数据进行分类。
[010 引
[0107]本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,线性的MvGDSVM 中,每个视图上网页样本到两个超平面的垂直距离如下式:
[0109]
[0110] 其中,view 1和view 2分别表示第一个视图和第二个视图;distil表示网页样本 数据在第一个视图上到第一个超平面的垂直距离,distl2表示网页样本数据在第一个视图 上到第二个超平面的垂直距离;dist21表示网页样本数据在第二个视图上到第一个超平面 的垂直距离,dist22表示网页样本数据在第二个视图上到第二个超平面的垂直距离;Xi表 示网页样本数据第一个视图上的特征向量,X2表示网页样本数据第二个视图上的特征向 量;第一个视图的第一个超平面参数表示为(W1,丫 1),第二个超平面参数表示为(ui,Ci);第 二个视图的第一个超平面参数表示为(W2,丫 2 ),第二个超平面参数表示为(U2,(2 )。
[0111] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,核的MvGDSVM中, 每个视图上网页样本到两个超平面的距离如下式:
[0112]
[0113]
[0114] 其中
矩阵表示第一类网页样本数据在第一个视图上的特征; 矩阵4 表示第一类网页样本数据在第二个视图上的特征;矩阵公1 表示第二类 网页样本数据在第一个视图上的特征;矩阵馬€表示第二类网页样本数据在第二个 视图上的特征;K为核函数。
[0115] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法中,所述决策函数的 预测结果如下式:
[0116]
[0117]
[011 引
[0119] 其中,J;为第一个视图上的决策函数的预测结果;£是第二个视图上的决策函数 的预测结果;来是结合两个视图的决策函数的预测结果。
[0120] 本发明提出的基于梯度下降法的多视图GEPSVM网页分类算法,通过引入一个多视 图协同规范化项来最大化不同视图间分类的一致性,从而有效地结合了两个单视图的提高 性的广义特征值最接近支持向量机(IGEPSVM)。最后利用共辆梯度下降法来求解生成的优 化问题。
【附图说明】
[0121] 图1为本发明基于梯度下降法的多视图GEPSVM网页分类算法的流程框架图。
【具体实施方式】
[0122] 结合W下具体实施例和附图,对发明作进一步的详细说明。实施本发明的过程、条 件、实验方法等,除W下专口提及的内容之外,均为本领域的普遍知识和公知常识,本发明 没有特别限制内容。
[0123] 本发明提出了一种基于梯度下降法的多视图GEPSVM网页分类算法,包括MvGDSVM 网页分类模型参数训练步骤和网页数据分类步骤。
[0124] 本发明中,MvGDSVM网页分类模型参数训练步骤包括:
[0125] 步骤A:输入网页训练样本数据;
[0126] 步骤B:对所述网页训练样本数据进行预处理;
[0127] 步骤C:训练MvGDSVM网页分类模型参数;
[01 %]本发明中,所述网页数据分类步骤包括:
[0129] 步骤a:输入待测网页样本数据;
[0130] 步骤b:对所述待测网页样本数据进行标准化预处理;
[0131] 步骤C:通过MvGDSVM网页分类模型对所述待测网页样本数据进行分类。
[0132] 本发明提出的MvGDSVM网页分类算法,分为线性和非线性的两种情况:1.线性的 MvGDSVM
[0133] 考虑一个网页数据的二分类问题,给定n个标签为yi(i = l,2, . . .,n) G { + 1,-1}的 网页样本点。对网页训练样本数据预处理后,得到所有网页训练样本的在每个视图上的特 征向量。其中矩阵4 e巧"表示属于类+1的样本点在第一个视图上的特征,矩阵4 €巧" 表示属于类+1的样本点在第二个视图上的特征。矩阵巧.€度"2^|表示属于类-1的样本点在第 一个视图上的特征,矩阵马6贷"2^2表示属于类-1的样本点在第二个视图上的特征。显然,ni +n2 = n〇
[0134] 对于每个视图,分别给出如下两个超平面的定义:
[0135]
[0136]
[0137] 其中xi(X2)表示X的第一个(第二个)视图的特征。
[0138] 本发明给出如下定义:
[0140] 其中,Gi和出是在上的对称矩阵瓜和也是在点+"XW;+"上的对称矩阵。Zi (27)
[0139] 和Pl是两个在度的超平面参数,Z2和P2是两个在巧上的超平面参数。
[0141] 为了结合两个视图的特征,引入如下的多视图协同规范化项:
[0142]
[0143] 通过结合两个单视图的IGEPSVM,本发明给出MvGDSVM的第一个优化问题:
[0144] (28)
[0145] 其中v,S是非负的权重参数。
[0146] 上面的优化问题的目标函数可W被理解成:在每个视图上最大化两类样本与超平 面之间的距离差,与此同时最小化在同一个训练样本上两个函数+71和xjw; +朽作用 在不同视图上的结果。
[0147] 上面的优化问题(28)可W被简化成:
[014 引
[0149] 本发明中,使用共辆梯度下降法去优化目标函数Fi(zi,Z2),然后分别给出目标函 数关于Zl和Z2的梯度
[0150]
[0151]
[0152] 对于一个非凸函数,梯度下降法求得的是局部最优解。所W它不能确保得到优化 问题(29)的最优解。为了较好的分类超平面,选择=组不同zi,Z2的初始值来对优化问题 (29)进行梯度下降:
[0153] 1 .Zi和Z2分别通过单视图的IGEPSVM求得。
[0154] 2.Zi和Z2分别是对应维度的单位列向量。
[0155] 3.Zi和Z2分别是对应维度的列向量,它们的每个元素都是在[-1,U之间取值的随 机数。
[0156] 第一组初始值作为基本参照,它能够确保采用的初始化策略对目标函数(29)进行 梯度下降后求得的局部最优解肯定优于Zi和Z2分别是两个单视图的IGEPSVM的最优分类平 面的参数的情况。它表明在理论上本发明提出的多视图方法与对应的单视图方法相比是更 加有效的。
[0157] 相同地,通过引入另外一个多视图协同规范化项 [015 引
[0159]本发明给出MvGDSVM的第二个优化问题:
[0160] (30) [0161]
[0162] P
[0163] 本发明用共辆梯度下降法并采用上面的初始化策略去优化目标函数F2(Pi,P2),然 后分别给出目标函数式(31)关于Pl和P2的梯度
[0164]
[01 化]
[0166] 现在利用线性的MvGDSVM求得需要的分类超平面参数:第一个视图的第一个超平 面参数(W1,丫 1)和第二个超平面参数(m,Ci),W及第二个视图的第一个超平面参数(W2, 丫 2)和第二个超平面参数(112,(2)。对于一个网页待测样本X,首先对其每个视图上的特征向 量分别作标准化处理,然后分别计算每个视图上X到两个超平面的垂直距离:
[0167] 腿)
[016 引
[0側 辩)
[0170] 其中^和;;分别是第一个视图上和第二个视图上的决策函数的预测结果,少是结 合两个视图的决策函数的预测结果。
[0171] 2.核的 MvGDSVM
[0172] 对于非线性的情况,引入核生成的超平面。对于每一个视图上的两个超平面,做出 如下定义:
[0175] 其中K是上文中提及的核函数.
[0173]
[0174]
[0176] 首先给出如下定义:
[0177]
[017 引
[0179]
[0180]
[01 81 ] 其中61,化,62和出是在1?''""'^''""'上的对称矩阵,21,口1,22,口2是在沪"上的超平面参 数。
[0182] 在核的MvGDSVM中,为了结合两个视图的特征,引入如下的多视图协同规范化项
[0183]
[0184] 然后通过结合两个单视图的IGEPSVM,本发明给出核的MvGDSVM的第一个优化问 题:
[0185]
(糾)
[0186] 其中V是个非负的权重参数。上面的优化问题(34)可W被简化成 W873
(35) 1234567
[0188] 同样地,利用共辆梯度下降法并采用上面的初始化策略去优化目标函数Fi(zi, Z2),然后分别给出目标函数式(35)关于Zl和Z2的梯度:
2 3 相同地,通过引入另外一个多视图协同规范化项: 4
[0192]
5 本发明给出核的MvGDSVM的第二个优化问题 6
(36) 7 它可W被简化成:
[0196]
(37)
[0197] 用共辆梯度下降法并采用上面的初始化策略去优化目标函数F2(Pi,P2),然后分别 给出目标函数式(37)关于Pi和P2的梯度
[019 引
[0199]
[0200] 对于核的MvGDSVM来说,决策函数和在线性的MvGDSVM中的式(33)是完全相同,但 是对点到超平面的距离的定义是不同于式(32)的.对于一个网页待测样本X,首先对其每个 视图上的特征向量分别作标准化处理,然后分别计算每个视图上X到两个超平面的距离:
[0201]
[0202]
[0203] 通过在一个真实的网页数据集上的例子来说明本发明的具体实施方法和验证本 发明算法的效果。网页分类数据集是从Cornell University,University of Washington, University of Wisconsin,and University of Texas运四所美国大学计算机系网站上收 集而来的拥有两个视图的网页构成的,其中一个视图是网页本身的单词特性,另一个视图 是指向此网页的超链接上的单词特性。运两个视图的维度分别是500和87。运个数据集一共 有1051个样本,其中有关课程的网页230个,无关课程的网页821个。随机选择了 500个样本 来验证本发明MvGDSVM算法的分类性能。
[0204] 对于运500个网页样本,首先把它们划分成训练样本数据和测试样本数据。通过在 训练样本数据上利用网格捜索的5-fold交叉验证得到的平均验证准确率,选取出最佳的模 型参数。对于MvGDSVM方法,除了复合决策函数,也考虑来自各个视图的决策函数,其中最大 验证准确率的决策函数将被采用的,见式(33)。当最佳的模型参数和决策函数都选择好后, 将会评估所有的方法在测试集上的性能。上面的过程随机重复5次,然后通过平均正确率和 对应的标准差来展示所有方法的分类性能。下图是MvGDSVMW及对比算法的平均分类准确 率和标准差。其中IGEPSVM1,IGEPSVM2和IGEPSVM3是单视图的IGEPSVM算法,前两者分别作 用在第一个视图和第二个视图的特征向量上。而IGEPSVM3把两个视图的特征向量连接起来 作为一个视图。从图中可W看出本发明的MvGDSVM算法与对应的单视图方法相比,有很好的 性能提高。与另外一个经典的多视图学习方法SVM-2K相比,本发明的算法不管在准确率和 稳定性上都表现得较好。运说明本发明的多视图学习算法MvGDSVM在网页分类上是完全有 效的。 「AOAKl

'[0206]本发明的保护内容不局限于W上i施例。在不背离发明构思的申和范围下,本I 领域技术人员能够想到的变化和优点都被包括在本发明中,并且W所附的权利要求书为保 护范围。
【主权项】
1. 一种基于梯度下降法的多视图GEPSVM网页分类算法,其特征在于,包括MvGDSVi^H 分类模型参数训练步骤和网页数据分类步骤; 所述Mv⑶SVM网页分类模型参数训练步骤包括: 步骤A:输入网页训练样本数据; 步骤B:对所述网页训练样本数据进行预处理; 步骤C:训练Mv⑶SVM网页分类模型参数; 所述网页数据分类步骤包括: 步骤a:输入待测网页样本数据; 步骤b:对所述待测网页样本数据进行标准化预处理; 步骤c:通过Mv⑶SVM网页分类模型对所述待测网页样本数据进行分类。2. 如权利要求1所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在于,所 述步骤B中的预处理包括: 步骤BI:确定所述网页训练样本数据每个视图上的特征向量; 步骤B2:对所有所述网页训练样本数据的每个视图上的特征向量分别作标准化处理。3. 权利要求1所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在于,所述 步骤C中,通过多视图协同规范化项来最大化不同视图间分类的一致性。4. 如权利要求1所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在于,所 述步骤C包括: 步骤Cl:在每个视图上最大化两类样本与超平面之间的距离差,同时最小化在同一个 网页训练样本上两个假设函数作用在不同视图上的结果; 步骤C2:使用共辄梯度下降法优化目标函数,给出目标函数的梯度。5. 如权利要求1所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在于,所 述步骤C进一步包括: 步骤C3:利用MvGDSVM求得分类超平面参数; 步骤C4:分别计算每个视图上网页训练样本到两个超平面的垂直距离,得到决策函数 的预测结果。6. 如权利要求1所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在于,所 述步骤b中标准化预处理包括: 步骤b 1:确定待测网页样本数据每个视图上的特征向量; 步骤b2:对所有待测网页网页数据的每个视图上的特征向量分别作标准化处理。7. 如权利要求1所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在于,所 述步骤c中对所述待测网页数据进行分类包括: 步骤cl:利用训练样本数据得到的MvGDSVM分类模型的最佳参数,分别计算每个视图上 样本到两个超平面的垂直距离; 步骤c2:利用训练时得到的最佳预测函数来对待测网页样本数据进行分类。8. 如权利要求5或7所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在 于,线性的MvGDSVM中,每个视图上网页样本到两个超平面的垂直距离如下式:其中,view 1和view 2分别表示第一个视图和第二个视图;distil表示网页样本数据 在第一个视图上到第一个超平面的垂直距离,distl2表示网页样本数据在第一个视图上到 第二个超平面的垂直距离;dist21表示网页样本数据在第二个视图上到第一个超平面的垂 直距离,dist22表示网页样本数据在第二个视图上到第二个超平面的垂直距离; X1表示网 页样本数据第一个视图上的特征向量,X2表示网页样本数据第二个视图上的特征向量;第 一个视图的第一个超平面参数表示为( W1,γ :),第二个超平面参数表示为(m,ζ:);第二个 视图的第一个超平面参数表示为(w2,y2),第二个超平面参数表示为(ιι 2,ζ2)。9. 如权利要求5或7所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在 于,核的MvGDSVM中,每个视图上网页样本到两个超平面的距离如下式:其中,矩阵4 e表示第一类网页样本数据在第一个视图上的特征;矩阵 4 表示第一类网页样本数据在第二个视图上的特征;矩阵戽EiTW1表示第二类网 页样本数据在第一个视图上的特征;矩阵孕表示第二类网页样本数据在第二个视 图上的特征;K为核函数。10. 如权利要求5或7所述的基于梯度下降法的多视图GEPSVM网页分类算法,其特征在 于,所述决策函数的预测结果如下式: ,丨=sign(i//、,12 -i//、vl 1), 3 s = s i g η (JAv / 2 2 - distl I), y = sign(disi 12 + distil - disil I - distl I ); 其中,?为第一个视图上的决策函数的预测结果;g是第二个视图上的决策函数的预 测结果d是结合两个视图的决策函数的预测结果。
【文档编号】G06K9/62GK106022356SQ201610307835
【公开日】2016年10月12日
【申请日】2016年5月11日
【发明人】孙仕亮, 董超, 谢锡炯
【申请人】华东师范大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1