一种游戏道具个性化推荐方法
【技术领域】
[0001] 本发明设及网络游戏领域,特别设及一种游戏道具个性化推荐方法。
【背景技术】
[0002] 在现有网络游戏中,存在众多的游戏道具。通常采用W下Ξ种技术实现游戏道具 个性化推荐:(1)数据降维技术;(2)分类算法;(3)推荐算法。每一种算法技术在游戏道具推 荐算法中都起到至为关键的作用,Ξ种算法共同组合成一个算法系统,缺一不可。
[0003] 其中,数据降维技术要解决的是游戏数据错综复杂的问题。由于游戏数据本身具 有一些非传统特点,比如:游戏数据来源复杂、数据类型多种多样、数据维度高(几百或上 千)、数据海量。因此,在使用推荐算法之前,既需要简化数据,又要尽可能保证数据中所包 含的信息不能丢失,运就需要数据降维技术。数据降维技术目前比较成熟,可改进的空间不 大,此处使用因子分析法进行数据降维。
[0004] 分类算法使用降维后的数据对游戏用户分类。如果在使用推荐算法之前不对玩家 进行分类,一方面会使计算量成倍增长;另一方面,由于不同类型的玩家的喜好矩阵差异巨 大,在不对玩家进行事先分类的情况下,会模糊不同类型玩家之间的差异,从而影响推荐的 准确性。分类算法也是比较成熟的技术,可改进的空间不大,由于游戏数据海量,此处使用 的是K-Means聚类算法。
[0005] 推荐算法的作用是将合适的游戏道具推荐给合适的玩家。推荐算法又包括关联分 析、协同过滤、矩阵分解等多种技术,推荐算法目前仍在不断发展完善中。目前较为流行的 是基于项目的协同过滤算法(ItemCF) JtemCF算法是从Amazon的论文和专利发表之后 (2001年左右)流行起来的。但是由于网络游戏的道具都是虚拟物品,使得网络游戏的数据 特点又和电商的数据有很大的不同,将电商的推荐算法硬搬到网络游戏数据上必然引起不 适。目前公开的ItemCF算法都是基于用户已经购买过的物品(Item),首先计算物品与物品 之间的距离矩阵,然后向每个用户推荐新的物品(Item),把运种计算方法直接应用到网络 游戏数据上存在W下弊端:(1)大型网络游戏的道具种类极多,构造的物品与物品之间的距 离矩阵也必然庞大,运会极大地增加 W后的计算量。(2)游戏中有很多道具的功能完全相同 且可W相互替代,购买运类道具的玩家本来应该是极其相似的,给他们推荐的道具也应该 相似,但是按照目前公开的方法进行计算,反而会使得运些功能相同的道具之间的距离非 常大,从而给购买运种道具的玩家所推荐的道具差异极大。因此,需要对现有的ItemCF算法 进行改良,W解决上述弊端。
【发明内容】
[0006] 本发明的目的在于解决将ItemCF算法直接应用到网络游戏数据所产生的上述两 种弊端,为网游游戏的道具推荐提供一种合适的推荐方法。
[0007] 为了实现上述目的,本发明的游戏道具个性化推荐方法,包括W下步骤:
[0008] (1)对数据进行提取、清洗、加工;
[0009] (2)将数据从输入空间映射到低维空间;
[0010] (3)对数据进行分类,将玩家划分成不同类别;
[0011] (4)为每个玩家推荐他最可能购买的道具。
[0012] 其中,所述步骤(1)中对数据进行提取是从数据仓库中提取玩家的属性数据、登录 数据、玩法数据、交易数据、充值数据、消费数据。
[0013] 其中,所述步骤(1)中对数据进行清洗是对提取的数据进行描述统计,找出数据的 重复记录、缺失值、异常值,并进行相应的替换或删除操作。
[0014] 其中,步骤(1)中对数据进行加工是对数据进行转换。
[0015] 其中,对数据进行转换包括将数据正态标准化、将数据求对数。
[0016] 其中,所述步骤(2)进一步包括使用因子分析法对加工后的玩家的属性数据、登录 数据、玩法数据、交易数据、充值数据及消费数据进行降维。
[0017] 其中,所述步骤(3)进一步包括:
[0018] 1)使用K-Means算法,对因子分析降维后的数据进行分类,将玩家划分成若干个类 别;
[0019] 2)使用K-Means算法,对加工后的消费数据进行分类,从中提取若干种主要的购买 模式;
[0020] 3)将上述两种K-Means算法的分类结果进行交叉,可W将全部用户分成若干个群 体,每一个群体内部的玩家的属性、游戏行为、购买模式都比较相似。
[0021 ]其中,所述步骤(4)进一步包括:
[0022] 1)每次按顺序从若干个群体中抽取一个用户群体,对该群体内的玩家进行W下几 步操作;
[0023] 2)计算玩家的道具类和道具明细之间的距离矩阵,该距离可W用化ccard相似度 来测量;
[0024] 3)用每个玩家在每个道具类上的已知取值,乘W距离矩阵,得到每个玩家对每个 明细道具的偏爱程度;
[0025] 4)确定推荐的道具,对每个玩家按照对每个明细道具的喜好程度进行排序,向该 玩家推荐排名靠前的道具。
[0026] 采用本发明的游戏道具个性化推荐方法,可W明确网络游戏道具推荐算法的整个 计算过程;与现有的ItemCF算法相比,大幅减小推荐算法的计算量;针对网络游戏运一特定 行业,与现有的ItemCF算法相比,能显著提高道具推荐的准确度。
[0027] 本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变 得显而易见,或者通过实施本发明而了解。
【附图说明】
[0028] 附图用来提供对本发明的进一步理解,并且构成说明书的一部分,并与本发明的 实施例一起,用于解释本发明,并不构成对本发明的限制。在附图中:
[0029] 图1为根据本发明的游戏道具个性化推荐方法流程图;
[0030] 图2为根据本发明的游戏道具个性化推荐方法实施例1工作流程图。
【具体实施方式】
[0031] W下结合附图对本发明的实施例进行说明,应当理解,此处所描述的优选实施例 仅用于说明和解释本发明,并不用于限定本发明。
[0032] 图1为根据本发明的游戏道具个性化推荐方法流程图。下面将参考图1,对本发明 的游戏道具个性化推荐方法进行详细描述。
[0033] 步骤101,对数据进行提取、清洗、加工,将数据整理成适合分析的格式。其中,对数 据的提取是从数据仓库中提取所需要的数据,包括玩家的属性数据、登录数据、玩法数据、 交易数据、充值数据、消费数据;对数据的清洗是对提取的数据进行描述统计,找出数据的 重复记录、缺失值、异常值,并进行相应的替换或删除操作;对数据的加工是对数据的转换, 比如,将数据正态标准化、将数据求对数,具体采用那种数据加工方式由所采用的算法决 定。
[0034] 步骤102,将数据从输入空间通过线性或非线性变换映射到一个低维空间,从而获 得一个关于原数据集紧致的低维表示。使用因子分析法,对加工后的玩家属性数据、登录数 据、玩法数据、交易数据、充值数据进行降维,将高维度的数据变量综合成少数几个因子,运 少数几个因子包含了原始数据的绝大部分信息。
[0035] 步骤103,将相似的玩家划分到同一类里面,使得同一群体内的玩家尽可能相似, 不同群体间的玩家差异尽可能显著。包括W下Ξ步:
[0036] (1)使用K-Means算法,对因子分析降维后的数据进行分类,将玩家划分成若干个 类别,为了便于W后的说明,此处假设分成Μ类;
[0037] (2)使用K-Means算法,对加工后的消费数据进行分类,从中提取若干种主要的购 买模式,为了便于W后的说明,此处假设分成N类;
[0038] (3)将上述两种K-Means算法的分类结果进行交叉,可W将全部用户分成M*N个群 体,每一个群体内部的玩家的属性、游戏行为、购买模式都比较相似。
[0039] 步骤104,利用改良后的ItemCF算法,给每个玩家推荐他最可能购买的道具。
[0040] 其中,对ItemCF算法的改良主要体现在对距离矩阵的改良上,改良后的ItemCF算 法的实施具体包括W下步骤:
[0041] (1)每次按顺序从M*N个群体中抽取一个用户群体,对该群体内的玩家进行W下几 步操作。
[0042] (2)计算玩家的道具类和道具明细之间的距