与地理特征相关的个性化位置推荐系统的利记博彩app
【技术领域】
[0001] 本发明属于数据处理技术领域,特别设及一种与地理特征相关的个性化推荐技 术,可用于基于位置社交网络中的地点推送服务。
【背景技术】
[0002] 伴随着数据库技术的迅速发展和数据库管理系统的广泛应用,数据积累的越来越 多。面对激增的数据,人们希望能够挖掘出隐藏在背后的许多重要的信息,从而可W更好地 利用运些数据为人们服务。服务提供商拥有海量的与用户有关的个人信息和历史记录,利 用运些数据向用户主动推荐相关服务既可W方便用户,又有益于服务提供商。
[0003] 传统的推荐系统算法主要使用的是基于协同过滤的推荐算法,基于内容的推荐算 法。无线网络和位置感知技术的出现和进步,推动着移动互联网,尤其是基于位置的社交网 络的蓬勃发展,用户的地理位置数据通过客户端GI^开始被大量获取。地理上下文开始成为 位置推荐的重要特征属性,使得一些基于用户地理位置的商品推荐任务成为可能。
[0004] 在收集到用户的地理位置数据后,需要先对用户在地理位置上进行划分,划分方 法是基于用户签到位置所在地的经度和缔度为基础的划分方法。然后,通过扫描该地区所 有用户的位置历史记录W及待推荐用户的所有历史记录,通过预设模型计算用户和地区对 位置的预测分数,进而获得候选位置,进行基于模型的协同过滤的推荐计算。
[0005] 当前已有的基于协同过滤的推荐计算方案中,一种是基于用户本身之间的相似程 度,一种是基于物品本身之间的相似程度。
[0006] 上述方法中,由于均没有考虑地理特征在为用户进行地点推荐的影响,因而在数 据稀疏场景中,如异地位置推荐,性能表现很差,而且对于新用户和新物品的冷启动问题, 也无法有效解决。
【发明内容】
[0007] 本发明的目的在于针对W上方法的不足,提出了一种与地理特征相关的个性化位 置推荐系统,结合位置类别W及地理特征,使用潜在狄利克雷分配主题模型,为用户提供有 感兴趣的位置。
[000引为实现上述目的,本发明的推荐系统包括:
[0009] 数据获取模块DC,用于抓取目标网站用户的签到记录,为用户数据库模块UD和地 理数据库模块DD提供数据;
[0010] 用户数据库模块UD,用于将数据抓取模块D讨爪取的全部信息W用户ID作为索引存 储在用户数据库中,为用户偏好挖掘模块UM提供用户信息;
[0011] 地理数据库模块DD,用于将数据抓取模块D讨爪取的全部信息W地理城市作为索引 存储在地理数据库中,为地理特征挖掘模块DM提供地理信息;
[0012] 用户偏好挖掘模块UM,用于使用用户数据库模块UD中的数据去挖掘用户的偏好, 得到按照用户偏好排序的候选位置推荐列表Listi;
[0013] 地理特征挖掘模块DM,用于使用地理数据库模块DD中的数据挖掘地理特征,得到 按照地理特征影响排序的候选位置推荐列表Lists;
[0014] 推荐模块RD,用于根据按照用户偏好排序的候选位置推荐列表Listi和按照地理 特征影响排序的候选位置推荐列表Lists,产生最终的推荐结果Result。
[001引本发明的优点是:
[0016] 本发明通过用户偏好挖掘模块学习用户的个人兴趣,从而实现了个性化的位置推 荐;
[0017] 本发明通过地理特征挖掘模块综合地理特征影响,从而缓解了数据的稀疏性问 题,尤其是异地位置推荐问题。
【附图说明】
[0018] 图1是本发明的推荐系统整体框架图;
[0019] 图2是本发明中用户偏好挖掘模块框架图;
[0020] 图3是本发明中地理特征挖掘模块框架图;
[0021 ]图4是本发明中推荐模块框架图。
[0022] W下结合附图对本发明的实施例和效果进行详细描述。 具体实施方案
[0023] 本发明的核屯、思想是考虑地理特征的影响,结合位置类别,使用潜在狄利克雷分 配主题模型,提出了一种与地理特征相关的个性化位置推荐系统,为用户提供感兴趣的位 置。
[0024] 参照图1,本发明包括:数据获取模块DC,用户数据库模块UD,地理数据库模块DD, 用户偏好挖掘模块UM,地理特征挖掘模块DM和推荐模块RD。其中,数据获取模块DC,用于抓 取目标网站用户的签到记录,为用户数据库模块UD和地理数据库模块DD提供数据;用户数 据库模块UD,用于将数据获取模块DC获取的全部信息W用户ID作为索引存储在用户数据库 中,为用户偏好挖掘模块UM提供用户信息;用户偏好挖掘模块UM,使用用户数据库模块DC中 的用户签到记录,挖掘待推荐用户的偏好,得到按照用户偏好排序的候选位置推荐列表 Listi;地理数据库模块DD,用于将数据获取模块DC获取的全部信息W地理城市作为索引存 储在地理数据库中,为地理特征挖掘模块DM提供地理信息;地理特征挖掘模块DM使用地理 数据库模块DD中不同地理城市包括的用户签到记录,挖掘待推荐城市的地理特征,得到按 照地理特征影响排序的候选位置推荐列表Lists;推荐模块RD使用用户偏好挖掘模块UM得 到的推荐列表Listi和地理特征挖掘模块DM得到的推荐列表Lists,获得最终的推荐结果。
[0025] 所述的数据获取模块DC,获取目标网站用户的签到记录,其中,签到记录包括:用 户ID,语义位置,如大唐芙蓉园,语义位置的类别,如旅游&交通和语义位置所在地理城市, 如西安。其中,语义位置的类别包括:艺术&娱乐,学院&大学,活动,食品店,夜市,户外&休 闲,居民区,商店&服务和旅游&交通。
[0026] 参照图2,所述的用户偏好挖掘模块UM,包括:主题模型训练单元UMi, S层图模型 构建单元UM2和位置偏好值计算单元U13。
[0027] 该主题模型训练单元UMi,用于根据用户数据库模块UD得到的用户签到记录与主 题,生成每个用户对应于每个主题的主题特征向量uv;
[0028] 该S层图模型构建单元UM2,用于根据用户数据库模块UD得到的用户签到记录与 主题模型训练单元UMi得到的主题特征向量UV,构建由所有用户、所有位置和所有主题组成 的用户层、位置层和主题层的=层图结构;
[0029] 该位置偏好值计算单元UM3,用于根据用户层、位置层和主题层运=层图结构,得 到用户数据库中用户-主题概率分布的先验知识af作日主题-位置概率分布的先验知识0V, 计算用户对未访问位置的偏好值fuv,其中,用户对未访问位置的偏好值fuv,通过下式计算:
[0030]
[0031] 其中,成表示用户U对主题Zk的偏好程度的估计,知表示对用户数据库中位置V在 主题Zk中的生成概率的估计,表示主题Zk在用户U签到记录中被采样的次数,ni'.'l,,表示 在用户U签到记录中位置V在主题Zk中被采样的次数,下标表示不包括主题i,Rr表示用户 U签到记录中包含的主题数;
[0032] 使用用户对位置的偏好值fuv,对未访问位置进行递减排序,选取前k个位置生成按 照用户偏好排序的候选位置推荐列表Listi。
[0033] 参照图3,所述的地理特征挖掘模块DM,包括:主题模型训练单元DMi,S层图模型 构建单元DM2和位置偏好值计算单元DM3。
[0034] 该主题模型训练单元DMi,用于读取地理数据库模块DD包含的地理城市中所有用 户的签到记录,根据记录中的主题,生成每个位置对应于每个主题的主题特征向量DV;
[0035] 该S层图模型构建单元DM2,用于根据地理数据库模块DD包含的地理城市中所有 用户的签到记录W及主题模型训练模块DMi得到的主题特征向量DV,构建由所有城市,所有 位置和所有主题组成的地理层,位置层和主题层的=层图结构;
[0036] 该位置偏好值计算单元DM3,用于根据地理层,位置层和主题层运=层图结构,得 到地理数据库中地理城市-主题概率分布的先验知识af和主题-位置概率分布的先验知识 护V,计算地理城市对位置的偏好值fi/,其中,地理城市对位置的偏好值fi/,通过下式计 算:
[0037]
[0038] 其中,4表示地理城市1对主题Zk的偏好程度的估计,热表示对地理数据库中位 置V在主题Zk中的生成概率的估计,巧没表示主题Zk