一种基于用户偏好的个性化推荐方法及其系统的利记博彩app
【专利摘要】本发明提供了一种基于用户偏好的个性化推荐方法,包括:根据用户的行为获取用户行为数据;将得到的所述用户行为数据进行过滤;将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;在训练中获取每个用户的个性化参数;利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给用户。本发明还提供一种基于用户偏好的个性化推荐系统。本发明提供的技术方案能精确的分析出用户的潜在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
【专利说明】
-种基于用户偏好的个性化推荐方法及其系统
技术领域
[0001] 本发明设及计算机网络领域,尤其设及一种基于用户偏好的个性化推荐方法及其 系统。
【背景技术】
[0002] 随着Internet的快速发展,接入Internet的服务器数量和万维网上的网页的数目 都呈现出指数增长的态势。互联网技术的迅速发展使得大量的信息同时呈现在我们面前, 例如,Netf Iix上有数万部电影,Amazon上有数百万本书,Del. icio.US上面有超过10亿的网 页收藏。数字革命带给我们全球信息总量疯狂增长,个体有太多需要处理的信息,信息爆炸 使得信息的利用率反而降低,从而有我们所谓的"信息过载"问题。运个问题导致现今几乎 没有一个电子商务的网站没有一些信息过滤的形式和推荐服务。
[0003] 因此,如何从海量信息中为用户提供精确的推荐服务一直是业界亟待实现的目 标。
【发明内容】
[0004] 有鉴于此,本发明的目的在于提供一种基于用户偏好的个性化推荐方法及其系 统,旨在解决现有技术中在面对海量信息时如何为用户提供精确的个性化推荐服务的技术 问题。
[0005] 本发明提出一种基于用户偏好的个性化推荐方法,所述方法包括:
[0006] 根据用户的行为获取用户行为数据;
[0007] 将得到的所述用户行为数据进行过滤;
[000引将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;
[0009] 在训练中获取每个用户的个性化参数;
[0010] 利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;
[0011] 根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推 荐给用户。
[0012] 优选的,所述用户的行为记录在预设评分系统中,所述用户行为数据包括用户对 产品的评分数据,其中,所述将得到的所述用户行为数据进行过滤的步骤具体包括:
[0013] 过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预 设值的用户行为数据。
[0014] 优选的,所述将过滤后的用户行为数据划分为训练集和测试集,进行模型训练的 步骤具体包括:
[001引将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的 用户行为数据作为测试集;
[0016]将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将 所述训练集的10%的用户行为数据划分到所述测试集中;
[0017] 利用机器学习方法训练经过上述两次划分之后得到的训练集。
[0018] 优选的,所述用户的个性化参数包括初始化资源参数和混合参数,其中,所述在训 练中获取每个用户的个性化参数的步骤具体包括:
[0019] 在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数;
[0020] 在训练中通过混合算法获取每个用户的混合参数。
[0021] 另一方面,本发明还提供一种基于用户偏好的个性化推荐系统,所述个性化推荐 系统包括:
[0022] 行为获取模块,用于根据用户的行为获取用户行为数据;
[0023] 数据过滤模块,用于将得到的所述用户行为数据进行过滤;
[0024] 数据划分模块,用于将过滤后的用户行为数据划分为训练集和测试集,进行模型 训练;
[0025] 数据训练模块,用于在训练中获取每个用户的个性化参数;
[0026] 偏好预测模块,用于利用所得到的用户的个性化参数预测用户对未选择产品的偏 好值;
[0027] 产品推荐模块,用于根据偏好值的大小对用户未选择产品进行递减排序,选择位 于前列的多个产品推荐给用户。
[0028] 优选的,所述用户的行为记录在预设评分系统中,所述用户行为数据包括用户对 产品的评分数据,其中,所述数据过滤模块具体用于:
[0029] 过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预 设值的用户行为数据。
[0030] 优选的,所述数据划分模块具体包括:
[0031] 第一划分子模块,用于将保留的用户行为数据进行划分,其中,90%的用户行为数 据作为训练集,10%的用户行为数据作为测试集;
[0032] 第二划分子模块,用于将得到的所述训练集进行划分,其中,所述训练集的90%的 用户行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中;
[0033] 学习子模块,用于利用机器学习方法训练经过上述两次划分之后得到的训练集。
[0034] 优选的,所述用户的个性化参数包括初始化资源参数和混合参数,其中,所述数据 训练模块具体包括:
[0035] 第一训练子模块,用于在训练中通过个性化初始资源分配算法获取每个用户的初 始化资源参数;
[0036] 第二训练子模块,用于在训练中通过混合算法获取每个用户的混合参数。
[0037] 本发明提供的技术方案能精确的分析出用户的潜在消费趋势,从而最终为用户提 供一个有效且精确的个性化推荐服务。
【附图说明】
[0038] 图1为本发明一实施方式中基于用户偏好的个性化推荐方法流程图;
[0039] 图2为本发明一实施方式中基于用户偏好的个性化推荐系统10的内部结构示意 图。
【具体实施方式】
[0040] 为了使本发明的目的、技术方案及优点更加清楚明白,W下结合附图及实施例,对 本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用W解释本发明,并 不用于限定本发明。
[0041] 本发明【具体实施方式】提供了一种基于用户偏好的个性化推荐方法,所述方法主要 包括如下步骤:
[0042] S11、根据用户的行为获取用户行为数据;
[0043] S12、将得到的所述用户行为数据进行过滤;
[0044] S13、将过滤后的用户行为数据划分为训练集和测试集,进行模型训练;
[0045] S14、在训练中获取每个用户的个性化参数;
[0046] S15、利用所得到的用户的个性化参数预测用户对未选择产品的偏好值;
[0047] S16、根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产 品推荐给用户。
[0048] 本发明提出了一种基于用户偏好的个性化推荐方法,能精确的分析出用户的潜在 消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
[0049] W下将对本发明所提供的一种基于用户偏好的个性化推荐方法进行详细说明。
[0050] 请参阅图1,为本发明一实施方式中基于用户偏好的个性化推荐方法流程图。
[0051] 在步骤Sll中,根据用户的行为获取用户行为数据。
[0052] 在本实施方式中,所述用户的行为记录在预设评分系统中,所述用户行为数据包 括用户对产品的评分数据,其中,预设评分系统包括化tflix评分系统和MovieLens评分系 统,运些评分系统真实的记录了不同用户对其所选择的产品和服务的各种评分,运些评分 通过评分等级来表示,从1到5依次分别表示最差到最好,即评分等级为1表示最差,评分等 级为2表示较差,评分等级为3表示中等,评分等级为4表示较好,评分等级为5表示最好。
[0053] 在步骤S12中,将得到的所述用户行为数据进行过滤。
[0054] 在本实施方式中,所述将得到的所述用户行为数据进行过滤的步骤S12具体包括:
[0055] 过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预 设值的用户行为数据。
[0056] 在本实施方式中,W上述评分等级从1到5依次分别表示最差到最好为例,所述预 设值为评分等级是3的值,具体的,过滤掉评分数据低于评分等级3的用户行为数据,保留评 分数据大于或者等于评分等级3的用户行为数据。
[0057] 在步骤S13中,将过滤后的用户行为数据划分为训练集和测试集,进行模型训练。
[0058] 在本实施方式中,所述将过滤后的用户行为数据划分为训练集和测试集,进行模 型训练的步骤S13具体包括:
[0059] 将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的 用户行为数据作为测试集;
[0060] 将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将 所述训练集的10%的用户行为数据划分到所述测试集中;
[0061] 利用机器学习方法训练经过上述两次划分之后得到的训练集。
[0062] 在本实施方式中,由于每个用户的个性化参数是不同的,但用户的品味或多或少 都持续一个较长的时期,本发明可W预测用户的最优个性化参数,将数据集分为两个部分: 训练集和测试集。因为测试集对于测试算法性能包含了未知的连边,训练集可W被用来确 定个性化参数,此时将训练集分为两部分,分别对应T-化aining(训练集)集合和T-probe (巧聯集)集合,运两个部分的比例为9:1,通过调节运些T-training集合和T-Probe集合,可 W发现,运种划分数据集(指的是原始训练集)的最优个性化参数。为了预测用户的个性化 参数,通过分离多次,获得归一化的接近最优的个性化参数,运对于除去噪音是很有效的, 例如,我们可W选择划分训练集100次来获得100次对于每个用户的个性化参数。
[0063] 在步骤S14中,在训练中获取每个用户的个性化参数。
[0064] 在本实施方式中,所述用户的个性化参数包括初始化资源参数和混合参数,其中, 所述在训练中获取每个用户的个性化参数的步骤S14具体包括:
[0065] 在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数;
[0066] 在训练中通过混合算法获取每个用户的混合参数。
[0067] 在本实施方式中,首先将混合算法及异构的初始资源分配算法置于个体层次。例 如,每个用户对Wae可W调整他/她的个性化混合参数Aa和个性化初始资源参数0b,从而获得 最佳的推荐。当排序分(RS)最低时,用户i被分配最佳的Aa和0。本发明为每个用户设置个性 化参数,并与其它的推荐算法做性能比较,并发现带有个性化参数的算法性能普遍有所提 升。
[0068] 其中,用Wae表示产品a愿意分配给产品如勺资源配额,可W得到Wae的一般表达式:
[0069]
[0070] 其中
衰示产品0的度,
良示用户j的度,aie表示用户1是否 选择过产品0,若选择过,aie=l,反之,曰1{! = 〇啤丫表示用户j是否选择过产品丫,若选择过, 曰j丫二1,反之,日j丫二0。
[0071] 在本实施方式中,通过加入参数A将物质扩散和热传导结合的混合算法,可W表示 为:
[0072]
[0073] 其中,当参数A = O时就是完全的热传导算法,当A=I时即为物质扩散算法。当A从0 增加到1时,混过算法从热传导变成物质扩散。运种混合算法被证明是解决精确性和多样性 的有效途径。在运个混合算法中,根据运个参数可W选择热口的产品或者是冷口的产品。对 于给定的一个目标用户,将他选择过的产品上的初始资源设为1,未选择的设为0,运样得到 一个n维的0/1矢量,代表针对该个体的初始资源分配构型,显然,运个初始构型表达了个性 化信息,对于不同用户是不一样的。记运个n维的0/1矢量为f,通过上述过程得到的最终的 资源分配矢量可W表示夫
,其中,f为上述提到的n维的0/1矢量,W为n*n阶的资源分配 矩阵。
[0074] 在本实施方式中,同样考虑到每个用户有一些相似的排序分数,所W归一化个性 化的参数是很必要的。在本实施方式中,获得的个性化参数、和01类似于最优个性化参数, 本发明基于训练集提出一个策略来为每个用户分配一个合适的个性化混合参数、和个性 化初始资源参数01,提出了一个基于个性化初始资源与混合算法(PIHP),定义为:
[0075]
[0076] 其中,、是通过最小的排序分数(RS)收集的用户的个性化混合参数。为了提升方 法的可行性,PIHP仅通过训练集获得的、,并将原始训练集划分为新的训练集和测试集100 次,且运两个集合比例为9:1。
[0077] 在步骤S15中,利用所得到的用户的个性化参数预测用户对未选择产品的偏好值。
[0078] 在本实施方式中,通过如下方式来进行预测,即通过将数据集多次分离为训练集 和测试集,最终获得归一化的接近最优的偏好值。
[0079] 在步骤S16中,根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列 的多个产品推荐给用户。
[0080] 在本实施方式中,选择两个真实评分系统:Netf Iix和MovieLens。为了测试本发明 算法的性能,使用2个基准数据集:Netf 1 ix和Movi eLens。从Movi eLens (http : / / www.grouplens.org/)中选取了 943个用户对1682部电影的100000条评分数据。评分等级从 1到5分别表示从最差到最好。出于推荐的目的,在滤掉过程中考虑评分超过3的数据。在粗 获取过程后,获得的数据包含了943个用户和1682个产品在内的82520个用户-产品对。 Netflix数据化ttp://www.netfli邱;rize.com)是随机抽样了用户在化tflix网站的整个交 互记录。最终获得了包含10000个用户,6000部电影的824802个用户-电影对。和MovieLens 做同样的数据过滤,最后剩下了 701947个用户-电影对。为了测试推荐的性能,本发明把真 实数据被分成了两部分,一部分是占数据的90%训练集Et,被认为是已知的信息,另一部分 是隐藏起来用于检测算法准确程度的测试集Ep,占数据的10%。
[0081] 本发明利用排序分数(Rank Score,RS)来度量推荐算法的排序准确度,W建立一 个较优的推荐产品排序,从而匹配用户的偏好设置。对于一个特定的用户,推荐系统可W产 生用户未选择产品的排行榜。本发明测量了在测试集中的每个用户-产品链接对下的排行 榜,例如,有一个有1000个未选择商品的活跃用户Ua,其中用户喜欢的产品ib出现在用户Ua 推荐列表的第10位,那么,对于用户Ua而言,产品ib的排序分数为RSab=IOAOOO = O.01。将 所有用户的排序分数求平均即得到用来度量推荐算法准确性的系统排序分RS,排序分值越 小,说明系统越趋向于把用户喜欢的商品排在前面,表明运样的算法更好。其中,系统排序 分RS可表示为:
[0082]
[0083] 由于真实用户通常只考虑推荐列表的前几个,本发明也设置两个实际的准确度指 标来考虑用户选择的产品在推荐列表里的数量,称为查准率(Precis ion)和查全率 (Recall)。
[0084] 对于用户Ua而言,推荐的查准率被定义为:
[0085]
妻中,da(N)表示在推荐列表前N位的位置,相关产品的数量(即为测 试集中已经被用户Ua选择过的产品),将所有用户的查准率求平均即得整个推荐系统的平 均查准率。除了查准率,查全率也有类似的函数定义从另一个角度来评估推荐算法的准确 度。
[0086] 对于用户Ua而言,推荐的查全率被定义为:
[0087]
da(N)表示在推荐列表前N位的位置,相关产品的数量(即为测试 集中已经被用户Ua选择过的产品),并且Na是测试集中用户a选择的产品数。平均所有用户的 查全率就可W得到整个系统的平均查全率。
[0088] 本发明首先在MovieLens和化tf Iix数据下,比较多种算法对应于L = 50的RS、查准 率和查全率。其中,丽ass算法指的是物质扩散算法和异构的初始资源分配算法的结合。 OMass算法物质扩散算法和带有个性化初始资源参数01算法的结合。混合化ybrids)算法是 物质扩散和热传导算法的结合。OHybrid指的是混合算法并且为每个用户提供个性化参数 AiXoHybrid算法指的是混合算法加入了整体最优的初始资源参数0和整体最优混合参数 入。OCoHybrid算法指的是CoHybrid算法的提升版,为每个用户结合了最优个性化初始资源 参数Qi和最优个性化混合和参数、。参数^在[0,1 ]之间,设置步长为0.05,初始资源参数0在 [-5,引之间,且步长为0.1。
[0089] 对于 MovieLens 数据,HMass,C 細ybrids 方法中最优目=0. SeHybrids 和CoHybrids 中最优A = O.45。每个数字都是通过平均超过10个采用独立随机划分训练集和测试集运行 获得的。得到的测试结果如下表一所示:
[0090] 表一
[0091]
[0092] 该结果表明,每个用户使用自己的个性化参数的算法性能普遍更好。WMovieLens 为例,对OCoHybrids算法在排序分RS、查准率P(50)和查全率R(50)运S个指标上进行性能 对比,分别可W提升9.Ol% ,4.09%和7.9%的增强。而化tfIix数据集,OCoHybrids算法在 排序分RS上有较明显提升,W及P(50)和R(50)较之前的CoHybrids算法,分别提升了 10.8%,0.9%和2.8%。
[0093] 同时,基于本发明提出的PIHP算法,将运些推荐算法做出性能比较。结果如下表二 所示:
[0094] 表二
[0095]
[0096] 结果显示,PCoHybrids算法性能表现比所有提到过的指标更好。WMovieLens为 例,在RS、查准率P(50)和查全率R(50)的指标下,PCoHybrids方法中分别有2.07%,3.3%, 和4.5 %的提高。而化tflix数据集,PCoHybrids方法也就RS而言取得了较大的性能提升,W 及P(20)和R(20)较之前的CO-Hybrids方法分别有2.Ol%,1.6%和1.1 %的提高。
[0097] 本发明提供的一种基于用户偏好的个性化推荐方法,能精确的分析出用户的潜在 消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
[0098] 本发明【具体实施方式】还提供一种基于用户偏好的个性化推荐系统10,主要包括:
[0099] 行为获取模块11,用于根据用户的行为获取用户行为数据;
[0100] 数据过滤模块12,用于将得到的所述用户行为数据进行过滤;
[0101] 数据划分模块13,用于将过滤后的用户行为数据划分为训练集和测试集,进行模 型训练;
[0102] 数据训练模块14,用于在训练中获取每个用户的个性化参数;
[0103] 偏好预测模块15,用于利用所得到的用户的个性化参数预测用户对未选择产品的 偏好值;
[0104] 产品推荐模块16,用于根据偏好值的大小对用户未选择产品进行递减排序,选择 位于前列的多个产品推荐给用户。
[0105] 本发明提供的一种基于用户偏好的个性化推荐系统10,能精确的分析出用户的潜 在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
[0106] 请参阅图2,所示为本发明一实施方式中基于用户偏好的个性化推荐系统10的结 构示意图。在本实施方式中,基于用户偏好的个性化推荐系统10主要包括行为获取模块11、 数据过滤模块12、数据划分模块13、数据训练模块14、偏好预测模块15W及产品推荐模块 16。
[0107] 行为获取模块11,用于根据用户的行为获取用户行为数据。
[0108] 在本实施方式中,所述用户的行为记录在预设评分系统中,所述用户行为数据包 括用户对产品的评分数据,其中,预设评分系统包括化tflix评分系统和MovieLens评分系 统,运些评分系统真实的记录了不同用户对其所选择的产品和服务的各种评分,运些评分 通过评分等级来表示,从1到5依次分别表示最差到最好,即评分等级为1表示最差,评分等 级为2表示较差,评分等级为3表示中等,评分等级为4表示较好,评分等级为5表示最好。
[0109] 数据过滤模块12,用于将得到的所述用户行为数据进行过滤。
[0110] 在本实施方式中,数据过滤模块12具体用于:
[0111] 过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预 设值的用户行为数据。
[0112] 在本实施方式中,W上述评分等级从巧化依次分别表示最差到最好为例,所述预 设值为评分等级是3的值,具体的,过滤掉评分数据低于评分等级3的用户行为数据,保留评 分数据大于或者等于评分等级3的用户行为数据。
[0113] 数据划分模块13,用于将过滤后的用户行为数据划分为训练集和测试集,进行模 型训练。
[0114] 在本实施方式中,数据划分模块13具体包括:第一划分子模块、第二划分子模块W 及学习子模块。
[0115] 第一划分子模块,用于将保留的用户行为数据进行划分,其中,90%的用户行为数 据作为训练集,10%的用户行为数据作为测试集;
[0116] 第二划分子模块,用于将得到的所述训练集进行划分,其中,所述训练集的90%的 用户行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中;
[0117] 学习子模块,用于利用机器学习方法训练经过上述两次划分之后得到的训练集。
[0118] 在本实施方式中,由于每个用户的个性化参数是不同的,但用户的品味或多或少 都持续一个较长的时期,本发明可W预测用户的最优个性化参数,将数据集分为两个部分: 训练集和测试集。因为测试集对于测试算法性能包含了未知的连边,训练集可W被用来确 定个性化参数,此时将训练集分为两部分,分别对应T-化aining(训练集)集合和T-probe (巧聯集)集合,运两个部分的比例为9:1,通过调节运些T-training集合和T-Probe集合,可 W发现,运种划分数据集(指的是原始训练集)的最优个性化参数。为了预测用户的个性化 参数,通过分离多次,获得归一化的接近最优的个性化参数,运对于除去噪音是很有效的, 例如,我们可W选择划分训练集100次来获得100次对于每个用户的个性化参数。
[0119] 数据训练模块14,用于在训练中获取每个用户的个性化参数。
[0120] 在本实施方式中,所述用户的个性化参数包括初始化资源参数和混合参数,其中, 数据训练模块14具体包括:第一训练子模块W及第二训练子模块。
[0121] 第一训练子模块,用于在训练中通过个性化初始资源分配算法获取每个用户的初 始化资源参数;
[0122] 第二训练子模块,用于在训练中通过混合算法获取每个用户的混合参数。
[0123] 在本实施方式中,首先将混合算法及异构的初始资源分配算法置于个体层次。例 如,每个用户对Wae可W调整他/她的个性化混合参数Aa和个性化初始资源参数0b,从而获得 最佳的推荐。当排序分(RS)最低时,用户i被分配最佳的Aa和0。本发明为每个用户设置个性 化参数,并与其它的推荐算法做性能比较,并发现带有个性化参数的算法性能普遍有所提 升。
[0124] 在本实施方式中,数据训练模块14具体的训练方法详见前述步骤S14中的相关记 载,在此不做重复描述。
[0125] 偏好预测模块15,用于利用所得到的用户的个性化参数预测用户对未选择产品的 偏好值。
[0126] 产品推荐模块16,用于根据偏好值的大小对用户未选择产品进行递减排序,选择 位
[0127] 本发明提供的一种基于用户偏好的个性化推荐系统10,能精确的分析出用户的潜 在消费趋势,从而最终为用户提供一个有效且精确的个性化推荐服务。
[0128] 值得注意的是,上述实施例中,所包括的各个单元只是按照功能逻辑进行划分的, 但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也 只是为了便于相互区分,并不用于限制本发明的保护范围。
[0129] 另外,本领域普通技术人员可W理解实现上述各实施例方法中的全部或部分步骤 是可W通过程序来指令相关的硬件来完成,相应的程序可W存储于一计算机可读取存储介 质中,所述的存储介质,如R0M/RAM、磁盘或光盘等。
[0130] W上所述仅为本发明的较佳实施例而已,并不用W限制本发明,凡在本发明的精 神和原则之内所作的任何修改、等同替换和改进等,均应包含在本发明的保护范围之内。
【主权项】
1. 一种基于用户偏好的个性化推荐方法,其特征在于,所述方法包括: 根据用户的行为获取用户行为数据; 将得到的所述用户行为数据进行过滤; 将过滤后的用户行为数据划分为训练集和测试集,进行模型训练; 在训练中获取每个用户的个性化参数; 利用所得到的用户的个性化参数预测用户对未选择产品的偏好值; 根据偏好值的大小对用户未选择产品进行递减排序,选择位于前列的多个产品推荐给 用户。2. 如权利要求1所述的基于用户偏好的个性化推荐方法,其特征在于,所述用户的行为 记录在预设评分系统中,所述用户行为数据包括用户对产品的评分数据,其中,所述将得到 的所述用户行为数据进行过滤的步骤具体包括: 过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预设值 的用户行为数据。3. 如权利要求2所述的基于用户偏好的个性化推荐方法,其特征在于,所述将过滤后的 用户行为数据划分为训练集和测试集,进行模型训练的步骤具体包括: 将保留的用户行为数据进行划分,其中,90%的用户行为数据作为训练集,10%的用户 行为数据作为测试集; 将得到的所述训练集进行划分,其中,所述训练集的90%的用户行为数据保留,将所述 训练集的10%的用户行为数据划分到所述测试集中; 利用机器学习方法训练经过上述两次划分之后得到的训练集。4. 如权利要求3所述的基于用户偏好的个性化推荐方法,其特征在于,所述用户的个性 化参数包括初始化资源参数和混合参数,其中,所述在训练中获取每个用户的个性化参数 的步骤具体包括: 在训练中通过个性化初始资源分配算法获取每个用户的初始化资源参数; 在训练中通过混合算法获取每个用户的混合参数。5. -种基于用户偏好的个性化推荐系统,其特征在于,所述个性化推荐系统包括: 行为获取模块,用于根据用户的行为获取用户行为数据; 数据过滤模块,用于将得到的所述用户行为数据进行过滤; 数据划分模块,用于将过滤后的用户行为数据划分为训练集和测试集,进行模型训练; 数据训练模块,用于在训练中获取每个用户的个性化参数; 偏好预测模块,用于利用所得到的用户的个性化参数预测用户对未选择产品的偏好 值; 产品推荐模块,用于根据偏好值的大小对用户未选择产品进行递减排序,选择位于前 列的多个产品推荐给用户。6. 如权利要求5所述的基于用户偏好的个性化推荐系统,其特征在于,所述用户的行为 记录在预设评分系统中,所述用户行为数据包括用户对产品的评分数据,其中,所述数据过 滤模块具体用于: 过滤掉评分数据低于预设值的用户行为数据,保留评分数据大于或者等于所述预设值 的用户行为数据。7. 如权利要求6所述的基于用户偏好的个性化推荐系统,其特征在于,所述数据划分模 块具体包括: 第一划分子模块,用于将保留的用户行为数据进行划分,其中,90%的用户行为数据作 为训练集,10%的用户行为数据作为测试集; 第二划分子模块,用于将得到的所述训练集进行划分,其中,所述训练集的90%的用户 行为数据保留,将所述训练集的10%的用户行为数据划分到所述测试集中; 学习子模块,用于利用机器学习方法训练经过上述两次划分之后得到的训练集。8. 如权利要求7所述的基于用户偏好的个性化推荐系统,其特征在于,所述用户的个性 化参数包括初始化资源参数和混合参数,其中,所述数据训练模块具体包括: 第一训练子模块,用于在训练中通过个性化初始资源分配算法获取每个用户的初始化 资源参数; 第二训练子模块,用于在训练中通过混合算法获取每个用户的混合参数。
【文档编号】G06F17/30GK106021379SQ201610311472
【公开日】2016年10月12日
【申请日】2016年5月12日
【发明人】廖好, 沈婧, 吴巧云, 毛睿, 陆敏华, 刘刚, 王毅, 李荣华
【申请人】深圳大学