一种基于用户行为的个性化推荐方法及其推荐装置的制造方法

文档序号:9350054阅读:501来源:国知局
一种基于用户行为的个性化推荐方法及其推荐装置的制造方法
【技术领域】
[0001] 本发明涉及属于数据挖掘、自然语言处理和信息检索领域,涉及社交网络和信任 网络的预测推荐技术领域,尤其涉及一种基于用户行为的个性化推荐方法及其推荐装置。
【背景技术】
[0002] 个性化推荐技术通过研究不同用户的兴趣,主动为用户推荐最需要的资源,从而 更好地解决互联网信息日益庞大与用户需求之间的矛盾。目前,推荐技术被广泛应用到电 子商务、数字图书馆、新闻网站等系统中。因此,各种适用于推荐系统的技术应运而生,如协 同过滤技术(CF)、朴素贝叶斯、聚类分析技术、关联规则技术、神经网络技术和图模型技术 等,其中,协同过滤是应用最为广泛的个性化推荐技术。协同过滤推荐又分为基于项目的协 同过滤和基于用户的协同过滤。
[0003] 基于用户的协同过滤算法通过计算用户对项目评分之间的相似性,搜索目标用户 的最近邻,然后根据最近邻的评分向目标用户产生推荐。
[0004] 基于用户的协同过滤推荐算法优势很明显,首先得到的推荐结果是比较精确的, 其次所有用户都会从近邻的反馈评价中得到一定的信息,具有角色一致性。同时该算法也 存在着一些不足之处,主要体现在:在用户模型的建立过程中产生的用户对项目的评分矩 阵是非常稀疏的,一些新项目加入会造成冷启动问题,在处理一些特殊用户方面也存在着 一定的问题,因为特殊人群不能从最近邻中得到很多的推荐信息。
[0005] 基于项目的协同过滤是根据用户对相似项目的评分数据预测目标项目的评分,它 是建立在如下假设基础上的:如果大部分用户对某些项目的打分比较相近,则当前用户对 这些项的打分也会比较接近。基于项目的协同过滤算法主要对目标用户所评价的一组项目 进行研究,并计算这些项目与目标项目之间的相似性,按照大小相似对项目进行排序,选择 前K个项目作为输出。
[0006] 基于项目的协同过滤推荐算法能得到较高的准确率,算法的效率也是较高的,能 够充分挖掘大量的项目之间的相关性,得到较多的信息。然而算法仍面临着评分矩阵稀疏、 矩阵的冷启动等问题。

【发明内容】

[0007] 本发明提供了一种基于用户行为的个性化推荐方法及其推荐装置,本发明能够有 效改善传统协同过滤推荐技术在计算用户之间的相似度时,只考虑用户的评分行为,而忽 略了用户的关注行为造成推荐准确率较低的问题,详见下文描述:
[0008] -种基于用户行为的个性化推荐方法,所述个性化推荐方法包括以下步骤:
[0009] 对用户的关注行为建模,获取用户的关注行为矩阵;
[0010] 将用户对项目的评分、用户之间的关注行为,引入到同质性度量的计算中,采用皮 尔森系数,得到改进后的同质性度量;
[0011] 通过改进后的同质性度量,结合矩阵分解获取同质性正则化的矩阵形式;
[0012] 采用梯度下降的最优化方法,对矩阵形式进行处理获取低秩矩阵形式,将低秩矩 阵形式对信任关系的大小进行排序,输出推荐结果。
[0013] 其中,所述用户的关注行为矩阵具体为:
[0014] 建立一个e Xf?矩阵M,e是受信者用户,f是施信者用户,对应的Ml j表示用户i对 用户j的关注行为。
[0015] 其中,所述通过改进后的同质性度量,结合矩阵分解获取同质性正则化的矩阵形 式的步骤具体为:
[0016] 将用户对项目的评分矩阵进行分解,在矩阵分解的过程中加入正则化项,分解成 的低秩矩阵以最小的误差代替原有数据。
[0017] 一种基于用户行为的个性化推荐装置,所述个性化推荐装置包括:
[0018] 第一获取模块,用于对用户的关注行为建模,获取用户的关注行为矩阵;
[0019] 第二获取模块,用于将用户对项目的评分、用户之间的关注行为,引入到同质性度 量的计算中,采用皮尔森系数,获取改进后的同质性度量;
[0020] 第三获取模块,用于通过改进后的同质性度量,结合矩阵分解获取同质性正则化 的矩阵形式;
[0021] 输出模块,用于采用梯度下降的最优化方法,对矩阵形式进行处理获取低秩矩阵 形式,将低秩矩阵形式对信任关系的大小进行排序,输出推荐结果。
[0022] 其中,所述第三获取模块包括:获取子模块,用于将用户对项目的评分矩阵进行分 解,在矩阵分解的过程中加入正则化项,分解成的低秩矩阵以最小的误差代替原有数据。
[0023] 本发明提供的技术方案的有益效果是:本发明在传统的用户相似度计算中结合用 户关注行为,进而为用户在网站中更加合理准确的推荐用户所需的商品和好友,提升用户 的体验和感受,有效改善网站对用户的粘滞度,提高网站的服务品质;并且通过与现有的同 质性度量方法进行对比,验证了本发明在准确率和效率提高方面的可行性。
【附图说明】
[0024] 图1为一种基于用户行为的个性化推荐方法的流程图;
[0025] 图2为同质性系数对信任预测准确率影响的示意图;
[0026] 图3为四种同质性度量方法的准确率示意图;
[0027] 图4为一种基于用户行为的个性化推荐装置的示意图,;
[0028] 图5为第三获取模块的结构示意图。
[0029] 附图中,各标号所代表的部件列表如下:
[0030] 1 :第一获取模块; 2 :第二获取模块;
[0031] 3:第三获取模块; 4:输出模块;
[0032] 31 :获取子模块。
【具体实施方式】
[0033] 为使本发明的目的、技术方案和优点更加清楚,下面对本发明实施方式作进一步 地详细描述。
[0034] 实施例1
[0035] 本发明提供了一种基于用户行为的个性化推荐方法,参见图1,该方法包括以下步 骤:
[0036] 101 :对用户的关注行为建模,获取用户的关注行为矩阵;
[0037] 通过对用户模型的建立和抽取,可以得到用户的关注行为矩阵,即建立一个eXf 矩阵M,e是受信者用户,f是施信者用户,对应的M 1,表示用户i对用户j的关注行为。
[0038] 102:将用户对项目的评分、用户之间的关注行为,引入到同质性度量的计算中,采 用皮尔森系数,得到改进后的同质性度量;
[0039] 其中,基于用户的个性化推荐算法将用户的关注行为引入同质性度量的计算中 去,在皮尔森系数中引入用户关注行为,并进行正则化操作,得到新的同质性度量方法。
[0040] 在信任预测算法中引入同质性理论之后,为了最大地发挥其优势选择了用户评论 行为和用户关注行为来度量用户之间的同质性。
[0041] 103 :通过改进后的同质性度量,结合矩阵分解获取同质性正则化的矩阵形式;
[0042] 其中,在矩阵分解的成本函数中加入正则化项,防止矩阵分解过程中出现过拟合。 即,把非常稀疏的用户对项目的评分矩阵进行分解,分解成的低秩矩阵能够以最小或可接 受的误差代替原有数据,在矩阵分解的过程中为防止过拟合可以加入正则化项。
[0043] 104:采用梯度下降的最优化方法,对矩阵形式进行处理获取低秩矩阵形式,将低 秩矩阵形式对信任关系的大小进行排序,输出推荐结果。
[0044] 综上所述,本发明实施例通过上述步骤101至步骤104提高了推荐准确率,提升了 用户的体验和感受,有效改善网站对用户的粘滞度,提高了网站服务品质。
[0045] 实施例2
[0046] 下面结合具体的计算公式、例子对实施例1中的方案进行详细描述,详见下文描 述:
[0047] 201 :通过用户建模生成用户对项目的评分矩阵R ;
[0048] 在进行个性化推荐过程中,首先要进行用户建模,在此过程中用到了用户对项目 的评分关系和评分值。通过用户建模生成用户对项目的评分矩阵R。其中,R是一个nXd 评分矩阵,n是用户数,d是项目数,对应的r ls表示用户i对项目s进行的评分,评分值可 以是二元属性值也可以是用户定义的评分等级。由于项目的数量是非常巨大的,通常用户 只会对少部分项目进行评分,这就会造成生成的评分矩阵R是非常稀疏的。如果直接计算 这样的评分矩阵,将给系统带来巨大的开销。
[0049] 202:在用户对项目评分的基础上引入用户的关注行为,建立用户间的关注行为矩 阵M;
[0050] 其中,M是一个eXf评分矩阵,e是受信者用户,f是施信者用户,对应的Mlj表示 用户i对用户j的关注行为。用户关注行为包含着用户之间的大量信息,例如:施信者对受 信者的未来行为会有很大的影响,如果只考虑用户对项目的评分之间的关系而忽略用户的 关注行为会丢失一部分用户间的关系信息,对同质性的度量也会有一定的影响,造成准确 率的下降。
[0051] 203 :选取的是基于皮尔森系数的同质性度量方法;
[0052] 得到用户对项目的评分矩阵后,在已有的原始同质性度量方法中选取合适的同质 性度量方法,本发明选取的是基于皮尔森系数的同质性度量方法,如公式(1)所示。
[0054] 其中,Rlk和Rjk分别表示用户i和用户j对项目k的评分;尽和巧分别表示用户i 和用户j的平均评分;G (i,j)为用户i和用户j之间的相似性;PCC (i,j)为按照渐进式构 造算法的方式计算用户i和用户j之间的相似性;I (i)为用户i对项目集中进行过评分的 项目集合;I (j)为用户j对项目集中进行过评分的项目集合;k为项目编号。
[0055] 由于PCC(i,j)的范围是[_1,1],可以使用函数/0)=f将PCC(i,j)范围线性 映射到[0,1]内,其中X是函数的自变量。
[0056] 204 :结合用户对项目的评分和用户之间的关注行为,获取新的同质性度量方法;
[0057] 选取了同质性度量方法的基础后,结合用户对项目的评分和用户之间的关注行 为,得到本发明提出的新的同质性度量方法,如公式(2)所示。
[0059] 公式⑵中,T(i),T(j)分别为用户i和用户j关注的用户集合,F⑴,F(j)分别 为关注用户i和用户j的用户集合。a和0为取值范围〇到1的影响因子,a用于控制 评分行为的相关性对同质性系数的影响,I-a用于控制信任对象的情况对同质性系数的影 响,P用于控制两个用户共同信任的用户比重,1-0用于控制同时信任两个用户的用户比 重。
[0060] 205 :结合低秩矩阵分解技术,由同质性度量方法的计算公式获取同质性正则化的 矩阵形式;
[0061] 为解决用户对项目的评分矩阵以及用户
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1