合实际应用 需求而定。
[0079] S202,建立原始预测模型,并利用所述原始预测模型,获得每组样本数据中的样本 操作信息对应的预估值。
[0080]作为一种示例,本发明方案中的原始预测模型可以体现为下述公式:
[0081 ] γ = θιιχι+θ?2Χ2+··· + θ?Χ?+··· + θιηχη+θι〇
[0082]其中,θη表示第i个操作动作的初始权重值;θ1()表示初始常量。具体地,可以随机 为Θη和θ1()赋值,本发明实施例对此可不做具体限定。
[0083] S203,建立损失函数,所述损失函数用于表示每组样本数据中的样本评分值与该 组样本数据中的样本操作信息对应的预估值之间的偏差。
[0084]除原始预测模型外,本发明方案还可建立一个损失函数(Loss Function),该函数 可以表示样本评分值、基于预测模型获得的样本操作信息对应的预估值,二者之间的差距。 通常,损失函数达到最小值时,即预估值与样本评分值之间的差距最小时,可以认为此时使 用的预测模型最为准确。如此,便可将使损失函数达到最小值作为条件,调整原始预测模 型,获得本发明方案中的预测模型。
[0085] 具体地,可以通过以下方式建立损失函数。
[0086] 假设h = 表示第j组样本数据的预估值η与样本评分值之间的偏差。通常, 产生^的原因可能与预测模型中选取的操作动作类型有关,或者样本数据中存在的一些随 机噪声。假设h为独立同分布,并服从正态分布,即^~Ν(0,σ 2),则有:
[0087]
[0088] 由此可以推导出:
[0089]
[0090] p(yj |xj&0)表示给定Xj和Θ后的yj的分布概率。
[0091] 具体地,Ρ(ηΙχΑθ)是针对第j组这一组样本数据得到的概率,本发明应该在所有 样本数据预测最准时,求θ的取值,即应该使所有样本数据的概率积最大。作为一种示例,可 以通过极大似然法求解最大概率积,具体地,似然函数L( Θ)可以体现为下述公式:
[0092]
[0093] 其中,m为样本数据的数目。
[0094] 对L(9)取对数:
[0095]
[0096] 使logU0)最大,也就是使:
最小,因此,本发明方案中的损失函数J (Θ)可以体现为下述公式:
[0097]
〇
[0098] S204,调整所述原始预测模型,并在所述损失函数达到最小值时,获得所述预测模 型。
[0099] 由上文所做分析可知,损失函数达到最小值时,预估值最接近于样本评分值,故本 发明方案获得预测模型的过程,可以转化为求解损失函数最小值的过程。具体地,可以通过 随机梯度下降法、最小二乘法等方式,求解损失函数的最小值,本发明实施例对此可不做具 体限定。
[0100] 下面以通过随机梯度下降法获得预测模型为例,对调整原始预测模型的过程进行 解释说明。
[0101] 首先,可以通过以下公式调整原始预测模型中的Θ11:
[0102]
[0103] 其中,θ2ι表示对原始预测模型进行一次调整后,第i个操作动作的调整后权重值;α 为学习速率,可用于表示迭代调整的调整步长;以由损失函数J(0)对θη求偏导 获得,可用于表示迭代调整的调整方向表示第j组样本数据中的第i个操作动作的样本 操作信息。
[0104] 对θη求偏导可体现为
[0105] 本发明方案中调整原始预测模型,可以理解为调整模型中的参数θη和θ1()的取值, 具体可涉及以下两方面信息:
[0106] -方面,可用于表示调整步长的α。具体地,可以根据经验设置α,通常,α设置的较 小,损失函数的收敛速度会比较慢,但可以明显发现损失函数的收敛点,即最小值;如果α设 置的较大,损失函数的收敛速度会比较快,但可能不易发现收敛点。作为一种示例,可以多 设置几个α,通过多次尝试,选取合适的α。本发明实施例对α的取值可不做具体限定。
[0107] 另一方面,可用于表示调整方向的(zm)Xjl。具体地,可以由损失函数J(0)对 求偏导获得,通常,调整方向为所求偏导数的反方向。另外,需要说明的是,如果本发明方案 中的预测模型针对单维度隐性行为,即原始预测模型为y = 911X1+01Q,则调整方向可以由损 失函数J(9)对θη求导获得。
[0108] 另外,需要说明的是,与调整θη相类似,可以按照下公式调整原始预测模型中的 θιο:
[0109] 其次,判断调整后的θ2ι是否使损失函数达到最小值。
[0110] 作为一种示例,可以判断操作动作的权重值,是否不断在收敛点处徘徊,即最近几 次迭代调整过程中,权重值是否基本不变。如果是,则可认为损失函数达到了最小值。
[0111] 例如,可以利用α和(Zj-yj)Xji,获得02i调整后的0 3i,以及03i调整后的04i等,如果 θ2ι、θ3ι和θ4ι基本维持不变,则可以判定损失函数已经达到最小值,可以将θ 2ι确定为预测模 型中的Θ i,获得本发明方案中的预测模型。具体地,
[0112] 如果经θη到02i的一次迭代调整,损失函数没有达到最小值,则可在02i的基础上, 利用α和(z?)X^,继续进行迭代调整,直至确定损失函数达到最小值时,获得预测模型。 具体过程可参见上文所做介绍,此处不再进行举例说明。
[0113] 与图1所示方法相对应,本发明实施例还提供一种个性化推荐装置300,参见图4所 示示意图,所述装置可包括:
[0114] 操作信息获取单元301,用于获取待测用户对待测物品所执行操作动作的当前操 作信息;
[0115] 预测模型获取单元302,用于获取预测模型,所述预测模型用于表示操作信息与评 分值间的对应关系,通过对样本数据进行训练获得所述预测模型,所述样本数据包括样本 用户对样本物品的样本评分值以及样本用户对样本物品执行的操作动作的样本操作信息; [0116]评分值获得单元303,用于利用所述预测模型,获得所述当前操作信息对应的预测 评分值;
[0117] 个性化推荐单元304,用于基于所述预测评分值,进行个性化推荐。
[0118] 可选地,所述预测模型获取单元,具体用于获取如下预测模型:
[0119] y = θιχι+θ2Χ2+· · ·+θ?Χ?+· · ·+θηχη+θ〇 ;
[0120] 其中,y表示评分值;θ,表示第i个操作动作的权重值;Χι表示第i个操作动作的操作 信息;1 < i <n,n为操作动作的类型数目;θ〇为常量。
[0121] 可选地,所述装置还包括:
[0122] 样本数据获取单元,用于获取多组所述样本数据;
[0123] 模型建立单元,用于建立原始预测模型,并利用所述原始预测模型,获得每组样本 数据中的样本操作信息对应的预估值;
[0124] 损失函数建立单元,用于建立损失函数,所述损失函数用于表示每组样本数据中 的样本评分值与该组样本数据中的样本操作信息对应的预估值之间的偏差;
[0125] 模型调整单元,用于调整所述原始预测模型,并在所述损失函数达到最小值时,获 得所述预测模型。
[0126] 可选地,所述损失函数建立单元,具体用于建立如下损失函数:
[0127]
[0128] 其中,J(0)表示损失函数;^表示第j组样本数据中的样本操作信息对应的预估 值;W表示第j组样本数据中的样本评分值,1 < j <m,m为样本数据的