应的第一类个体的集群中,若偏好相似度小于该预设 值,则判定第二类个体中的这一个体与相应的第一类个体中的个体的偏好为不同的。
[0077] 步骤303:当个体为群组时,计算第二类个体中的个体对项目偏好程度的预测评 级,该预测评级根据偏好相似度的计算结果进行计算;
[0078] 当个体为群组时,由于群组中包括多个用户,而群组中的用户的偏好信息不明确 时,在计算完用户的偏好相似度之后,还需要计算该群组对项目偏好程度的预测评级,该预 测评级根据偏好相似度的计算结果进行计算,这样就保证了群组对项目的偏好程度的准确 性,保证了推荐的可靠性和有效性;其中,预测评级用经典的基于个体的最近邻协同过滤算 法计算,一个个体与另一个个体相关联,则称这两个个体为邻居,预测评级用下式表示:
[0079]
[0080] 式中,pni表示述预测评级,neighbors (u)表示与第一类个体u相关联的个体的集 合,若第二类个体中的个体,即偏好信息不明确的群组的预测评级Ρηι计算结果的值大于或 等于预设值时,则判定第二类个体中的该个体与相对应的第一类个体中的个体的偏好信息 相同;
[0081] 步骤304 :若预测评级的计算结果大于或等于预设值时,将对应的第二类个体归 于相应的第一类个体的集群中;
[0082] 当个体为群组时,根据第二类个体中的某一个体的预测评级的计算结果,判断第 二类个体的偏好,当预测评级计算结果的值大于或等于某一预设值时,将对应的第二类个 体中的个体归于相应的第一类个体的集群中,若预测评级计算结果的值小于该预设值,则 判定第二类个体中的这一个体与相应的第一类个体中的个体的偏好为不同的。
[0083] 步骤305 :为集群分配项目标签,该项目标签根据对应的偏好信息确定;
[0084] 为了准确地为网络中的个体筛选推荐对象,需要为上述创建的集群分配项目标 签,该项目标签根据对应的偏好信息确定,例如:集群中的个体的偏好为音乐,则为该集群 贴上的标签也为音乐,这样不仅提高了推荐的有效性,而且由于项目标签与集群相关联,也 提高了推荐效率。
[0085] 步骤306 :根据集群中用户的数目判断对应的项目标签的重要性,当集群中的用 户的数目大于或等于某一阈值时,集群对应的项目标签判断结果为重要,否则为非重要; [0086] 由于网络中各个个体偏好的项目不尽相同,有的项目为热门项目,一大部分个体 对其偏好,而有些项目为冷门项目,仅有一小部分个体对其偏好,根据统计不同项目标签集 群中的个体数目,来判断该项目标签下的集群的重要性,当集群中的个体数目大于或等于 某一阈值时,该集群对应的项目标签判断结果为重要,则该集群也为重要;当集群中的个体 数目小于该阈值时,该集群对应的项目标签判断结果为非重要,则该集群也为非重要。
[0087] 步骤307 :采用K-means聚类算法计算非重要项目标签与每一重要项目标签的标 签相似度,当标签相似度计算结果的值大于或等于预设值时,将非重要项目标签所对应的 集群归于重要项目标签所对应的集群中,否则忽略非重要项目标签对应的集群;
[0088] 由于评级矩阵是对全部个体的全部项目进行的偏好评级,这就导致了个体评级项 目比可用项目少和项目集群的稀疏性问题,采用K-means聚类算法计算非重要项目标签与 每一重要项目标签的标签相似度,这样就可根据标签相似度的计算结果来合并一些相似的 项目标签,减少了实际存在的可用标签,优化了不同项目下的集群,当标签相似度计算结果 的值大于或等于预设值时,将非重要项目标签所对应的集群归于重要项目标签所对应的集 群中,否则忽略非重要项目标签对应的集群。
[0089] 综上,本发明的个体推荐方法,通过引入评级矩阵的概念,将单个用户或由多个用 户组成的群组作为统计个体,将网络中各个个体与各个项目之间形成一一对应的二维数组 形式,采用K均值算法,将相同项目下的偏好相同的个体进行聚类,得到具有相同偏好的集 群,对于偏好信息不明确的第二类个体,采用偏好相似度和皮尔逊Pearson相关系数公式 计算出其偏好项目,并将其合并到与其具有相同偏好的第一类个体的集群中,最后采用项 目标签和K-means聚类算法将相似度较高的集群进行合并进行优化,这个不仅保证了推荐 的可靠性和有效性,而且由于考虑到了网络中每一个个体的项目偏好,在一定程度上提高 了个体推荐的满意度,此外,本发明的个体推荐方法,将单个用户或群组视为个体,既适用 于向用户推荐单个用户或群组,又适用于向群组推荐单个用户或群组。
[0090] 本发明的实施例还提供了一种个体推荐系统,如图3所示,包括:
[0091] 获取模块,用于获取第一类个体的偏好信息,第一类个体是预先确定的、具有明确 项目偏好的个体,其中,个体为用户或群组;
[0092] 第一创建模块,用于创建第一类个体对项目偏好的评级矩阵,评级矩阵中的元素 为第一类个体中的各个个体对各个项目的偏好程度;
[0093] 第二创建模块,用于创建具有相同偏好的第一类个体的集群,该集群采用K均值 算法对评级矩阵中的元素进行聚类得到;
[0094] 推荐模块,用于向某一个体推荐与该个体具有相同偏好的集群中的其他个体。
[0095] 其中,该个体推荐系统还包括:筛选模块,用于采用K均值算法,筛选出评级矩阵Μ 中对相同项目i的偏好程度mul的值等于1的第一类个体中的个体,得到偏好项目i的第一 类个体的集群RU1。
[0096] 其中,该个体推荐系统还包括:第一计算模块,用于计算第二类个体中的个体与 第一类个体中的个体之间的偏好相似度,偏好相似度采用皮尔逊Pearson相关系数公式计 算,第二类个体是预先确定的、不具有明确项目偏好的个体;
[0097] 若第二类个体中的某一个体与第一类个体中的某一个体的偏好相似度的计算结 果大于或等于预设值时,将对应的第二类个体的个体归于相应的第一类个体的集群中。
[0098] 其中,该个体推荐系统还包括:第二计算模块,用于计算第二类个体中的个体对项 目偏好程度的预测评级,预测评级根据偏好相似度的计算结果进行计算;
[0099] 若第二类个体中的某一个体的预测评级的计算结果大于或等于预设值时,将对应 的第二类个体中的个体归于相应的第一类个体的集群中。
[0100] 其中,该个体推荐系统还包括:
[0101] 分配模块,用于为集群分配项目标签,项目标签根据对应的偏好信息确定;
[0102] 判断模块,用于根据集群中用户的数目判断对应的项目标签的重要性,当集群中 的用户的数目大于等于某一阈值时,集群对应的项目标签判断结果为重要;否则为非重 要;
[0103] 第三计算模块,用于计算非重要项目标签与每一重要项目标签的标签相似度,标 签相似度采用K-means聚类算法计算,当标签相似度大于或等于预预设值时,将非重要项 目标签所对应的集群归于重要项目标签所对应的集群中;否则忽略非重要项目标签所对应 的集群。
[0104] 需要说明书的是,该系统是与上述个体推荐方法对应的系统,上述方法实施例中 所有实现方式均适用于该系统的实施例中,也能达到相同的技术效果。
[0105] 以上所述的是本发明的优选实施方式,应当指出对于本技术领域的普通人员来 说,在不脱离本发明所述的原理前提下还可以作出若干改进和润饰,这些改进和润饰也在 本发明的保护范围内。<