一种信息投放的预处理方法和装置的制造方法
【专利摘要】本申请提供了一种信息投放的预处理方法和装置,以解决精准的定位来推荐业务对象以防止资源浪费的技术问题。所述的方法包括:在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息;根据特征信息确定分类标签及其用户群,为每个分类标签创建业务对象组;计算特征信息所属分类标签对应用户群的群体价值信息;依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。从而能够全面、准确地确定用户所具有的特征,可以在投放广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所投放的业务对象定位更精准,符合用户期望和需求。
【专利说明】
-种信息投放的预处理方法和装置
技术领域
[0001] 本申请设及数据处理技术领域,特别是设及一种信息投放的预处理方法和一种信 息投放的预处理装置。
【背景技术】
[0002] 随着互联网技术的发展,用户常常在网络中查找各种信息,浏览相关网页。用户在 网络中捜索信息时往往采用捜索网站如Google、百度等,从而通过其捜索引擎反馈相应的 捜索结果进行查找。
[0003] 由于捜索引擎上有大量的用户查询流量,因此当需要推荐某些业务对象的信息 时,可W将其投放给捜索引擎W进行推荐。捜索引擎对运类业务对象的推荐可W是将其展 示在与捜索引擎合作的网站提供展示位上,同时为了兼顾投放质和量的需求,可W对展示 位的流量进行重定向(retargeting),只购买展示的业务对象流量中到曾经到达过网站的 用户。
[0004] 对业务对象的推荐后,用户可W点击查看该业务对象,进而执行与该业务对象相 关的操作,因此对用户精准的定位才能提高对业务对象的点击率,使得推荐更符合需求。对 于定位不准确而推荐的业务对象,不但点击率较低,也造成了网站展示位资源的浪费,W及 用户网络流量资源的浪费。 阳〇化]因此,目前需要本领域技术人员迫切解决的一个技术问题就是:如何精准的定位 来推荐业务对象W防止资源浪费。
【发明内容】
[0006] 本申请实施例所要解决的技术问题是提供一种信息投放的预处理方法,W解决精 准的定位来推荐业务对象W防止资源浪费的技术问题。
[0007] 相应的,本申请实施例还提供了一种信息投放的预处理装置,用W保证上述方法 的实现及应用。
[0008] 为了解决上述问题,本申请公开了一种信息投放的预处理方法,包括:在用户访问 网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息;根据所述特 征信息确定分类标签及其用户群,为每个分类标签创建业务对象组;计算特征信息所属分 类标签对应用户群的群体价值信息;依据所述群体价值信息设置所述业务对象组的价值特 征信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。
[0009] 本申请还公开了一种信息投放的预处理装置,包括:特征分析模块,用于在用户访 问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信息;标签分析 模块,用于根据所述特征信息确定分类标签及其用户群;创建模块,用于为每个分类标签创 建业务对象组;群体价值计算模块,用于计算特征信息所属分类标签对应用户群的群体价 值信息;价值特征设置模块,用于依据所述群体价值信息设置所述业务对象组的价值特征 信息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。
[0010] 与现有技术相比,本申请实施例包括W下优点:
[0011] 在本申请实施例中,通过基于用户的当前访问网页和历史行为信息确定所述用户 的特征信息,从而全面、准确地确定用户所具有的特征,再基于各用户的特征信息分析出对 应的分类标签,W及该分类标签所对应的用户群,并为每个分类标签创建业务对象组,即可 W基于用户当前和历史行为分析出其所对应的业务对象组,从而后续精准的定位推荐的业 务对象。并且,还采用特征信息分析其所属分类标签对应用户群的群体价值信息,进而设置 业务对象组的价值特征信息,准确的分析每个业务对象组的价值,W在投放广告时依据其 价值特征信息准确的确定投放的业务对象,从而通过上述投放的预处理操作,可W在投放 广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所 投放的业务对象定位更精准,符合用户期望和需求。
【附图说明】
[0012] 图1是本申请实施例提供的一种信息投放的预处理方法的步骤流程图;
[0013] 图2是本申请实施例提供的另一种信息投放的预处理方法的步骤流程图;
[0014] 图3是本申请实施例提供的捜索引擎广告投放架构示意图;
[0015] 图4是本申请实施例提供的捜索引擎和网站的广告投放交互示意图;
[0016] 图5是本申请实施例提供的一种信息投放的预处理装置的结构框图;
[0017] 图6A-E是本申请实施例提供的另一种信息投放的预处理装置的结构框图。
【具体实施方式】
[001引为使本申请的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实 施方式对本申请作进一步详细的说明。
[0019] 网站对自身所展示的目标对象进行推荐时,可W生成其对应的业务对象并投放到 其它网站的网页上进行展示。若用户对推荐的业务对象感兴趣即可点击该业务对象来查看 对应的目标对象,因此在向网站投放业务对象时,对用户和所投放业务对象的精准定位有 助于提高业务对象的点击率,获得更好的推荐效果,反之若定位不准确则网站的展示位中 展示的业务对象点击率较低,造成流量资源的浪费且达不到推荐效果。
[0020] 本申请实施例的核屯、构思之一在于,提出一种信息投放的预处理方法,W解决精 准的定位来推荐业务对象W防止资源浪费的技术问题。可W在投放广告前准确分析用户所 属分类标签并确定对应业务对象组及其价值特征信息,使得后续所投放的业务对象定位更 精准,符合用户期望和需求。 阳〇21] 实施例一
[0022] 参照图1,示出了本申请实施例提供的一种信息投放的预处理方法的步骤流程图, 具体可W包括如下步骤:
[0023] 步骤102,在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述 用户的特征信息。
[0024] 在为用户推荐业务对象时,需要为用户推荐其感兴趣的业务对象才能得到用户的 关注并点击查看,因此,可W预先设置业务对象的分类标签,采用该分类标签标记业务对象 的类别,从而依据用户所具有的分类标签推荐相应的业务对象。通常分类标签是对用户当 前访问网页进行标注确定的,如网页标题、网页关键字等,但是当前访问网页并不一定是用 户感兴趣的,可能是由用户误操作等开启的,因此仅基于当前访问网页确定用户具有的分 类标签准确性较低。
[0025] 本实施例中,在用户访问网站时,可W获取该当前访问网页,W及其历史行为信 息,历史行为信息指的是该用户在该网站的访问历史,如在所述网站中历史浏览器的网页, 在网页中执行的操作等。从而分别通过对当前访问网页和历史行为信息的分析,确定该用 户的特征信息。所述特征信息指的是用户在网站中的访问特征,其包括各类特征及其特征 值,例如访问网站的次数、访问过的网页标题、关键字等。
[00%] 步骤104,根据特征信息确定分类标签及其用户群,为每个分类标签创建业务对象 组。
[0027] 特征信息标识了用户在网站中的访问特征,因此对所有访问网站的用户的特征信 息进行分析就可W获取访问该网站的用户的群体特征,从而确定该网站所具有的分类标 签,W及每个标签所对应的用户群。
[0028] 再为每个分类标签创建一个业务对象组,该业务对象组是具有相同特征的业务对 象的集合,如具有相同类目、具有相同来源等。从而投放广告时确定一个用户所属用户群的 分类标签,即可确定为其推荐的业务对象组。本实施例中为用户推荐的业务对象是基于用 户历史行为信息所确定的,所确定的分类标签准确性更高,能够确定更符合用户期望的业 务对象。
[0029] 步骤106,计算特征信息所属分类标签对应用户群的群体价值信息。
[0030] 通过用户所属用户群的分类标签可W确定对应的业务对象组,但是一个用户可能 同时属于多个用户群,即对应多个业务对象组,因此在对用户进行业务对象的推荐时,就要 分析实际的推荐方式W获取更高的点击率、更好的推荐效果。
[0031] 本实施例中设置了用户群的群体价值信息,该群体价值信息用于衡量投放该用户 群对应业务对象组的价值。可W对各用户的特征信息进行分析,如通过模型训练等方式计 算该特征信息所属分类标签对应用户群的群体价值信息。
[0032] 步骤108,依据所述群体价值信息设置所述业务对象组的价值特征信息。
[0033] 本实施例中,设置了价值特征信息来标识业务对象组的价值,所述价值特征信息 用于确定网页展示位中展示的业务对象组,因此可W通过群体价值信息设置所述业务对象 组的价值特征信息。从而在其他网站中投放业务对象时,可W基于该用户所对应的业务对 象组的价值特征信息确定投放的业务对象。
[0034] 综上所述,本实施例通过基于用户的当前访问网页和历史行为信息确定所述用户 的特征信息,从而全面、准确地确定用户所具有的特征,再基于各用户的特征信息分析出对 应的分类标签,W及该分类标签所对应的用户群,并为每个分类标签创建业务对象组,即可 W基于用户当前和历史行为分析出其所对应的业务对象组,从而后续精准的定位推荐的业 务对象。并且,还采用特征信息分析其所属分类标签对应用户群的群体价值信息,进而设置 业务对象组的价值特征信息,准确的分析每个业务对象组的价值,W在投放广告时依据其 价值特征信息准确的确定投放的业务对象,从而通过上述投放的预处理操作,可W在投放 广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所 投放的业务对象定位更精准,符合用户期望和需求。
[0035] 本申请实施例中,信息投放可W应用于多种不同的场景中,例如广告的推荐投放、 新闻等信息的推送投放等,即应用场景不同推送的业务对象也不同,可W依据实际需求设 定。
[0036] 实施例二
[0037] 在上述实施例的基础上,本实施例详细论述信息投放的预处理方法。
[0038] 参照图2,示出了本申请实施例提供的另一种信息投放的预处理方法的步骤流程 图,具体可W包括如下步骤:
[0039] 步骤202,在用户访问网站时,分别获取所述用户的当前访问网页和历史行为信 息。
[0040] 步骤204,按照一种或多种维度分别对所述当前访问网页和历史行为信息进行分 析,确定所述用户的特征信息。
[0041] 用户访问网站浏览网页时,可W获取该用户的当前访问网页,并获取该用的历史 行为信息。例如,针对购物网站,可W获取用户当前浏览的购物页面,并且获取该用户对购 物网站的历史行为信息,如在网站中的捜索历史,网站中的购物信息等。
[0042] 由于用户对网站和网页的访问是一个完整的操作行为,因此对于其对应的信息可 W通过多个维度进行衡量,即通过一种或多种维度分别对所述当前访问网页和历史行为信 息进行分析,例如通过文本维度、时间维度、操作维度等多种维度分别进行分析,从而获取 全面、综合、准确的分析结果。
[0043] (1)对当前访问网页的分析
[0044] 本申请一个可选实施例中,对所述当前访问网页进行分析确定所述用户的特征信 息的步骤,包括:按照文本维度对所述当前访问网页的文本信息进行分析,从所述文本信息 中提取业务特征和所述业务特征的特征值作为所述用户的特征信息。
[0045] 用户所访问的网页通常具有一定的文本特征,且该文本特征能够反映出用户对该 网页的兴趣点,因此可W基于文本维度对当前访问网页的文本信息进行分析,如对网页的 标题、正文进行文本分析,确定其中的关键词等信息,从而从网页中获取与所推荐业务对象 相关的业务特征和所述业务特征的特征值作为所述用户的特征信息。
[0046] 其中,由于应用场景不同时,推荐的业务对象也不同,因此在进行文本分析时对文 本的标注点也不同,例如针对购物网站,可W提取网页中与购物商品相关的商品名称、商品 类目W及诸如制造商、卖家等相关商品信息作为业务特征的特征值。
[0047] 还包括:针对操作维度,通过对所述用户在当前访问网页内执行的操作信息的分 析,提取所述用户的分类特征及其特征值,其中,所述操作信息包括:停留时间数据和动作 执行数据。
[0048] 用户在浏览网页时,除了网页内容本身能够显示用户的兴趣点之外,用户在网页 中执行的操作也能显示用户的兴趣,例如,用户在开启网页很短时间(如5秒)内即关闭网 页,则可能表征用户对该网页不感兴趣,如该网页是由误操作而开启的。又如,用户在网页 中点击或选中某些内容等操作,表征用户可能对其有兴趣。
[0049] 因此可W对用户在当前访问网页中执行的操作信息进行分析,所述操作信息包 括:停留时间数据和动作执行数据,即分析具体的操作、操作对象W及操作时间等信息,从 而提取相应的分类特征,W及分类特征的特征值。
[0050] 从而网页本身和用户操作确定多种维度进行网页分析确定该用的特征信息。
[0051] (2)对历史行为信息的分析
[0052] 对所述历史行为信息进行分析确定所述用户的特征信息的步骤包括W下子步骤 一到Ξ中至少一项:
[0053] 步骤一:按照文本维度对所述历史行为信息中的文本信息进行分析,从所述文本 信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息。
[0054] 与当前访问网页的文本分析类似,用户历史行为信息中包括历史捜索和浏览记 录,因此用户历史行为信息的文本信息包括历史捜索记录,W及历史浏览网页的文本等信 息,从而通过对文本信息的分析,可W获取相应的业务特征及其特征值。
[0055] 步骤二:按照时间维度对所述历史行为信息中的时间相关信息进行分析,从所述 时间相关信息中提取阶段特征和所述阶段特征的特征值作为用户的特征信息。
[0056] 用户的历史行为信息中包括很多时间相关信息,例如用户对历史网页的浏览时 间、用户对历史网页所执行操作的时间等。例如对于购物网站,用户的历史行为信息包括其 历史捜索、购买商品的时间,历史购买的商品所处的阶段等,W及用户对购物网站的访问次 数等与时间相关的信息。
[0057] 因此,可W在时间维度上对历史行为信息中的时间相关信息进行分析,确定用户 对网站访问的规律、活跃度等,从所述时间相关信息中提取阶段特征和所述阶段特征的特 征值作为用户的特征信息,例如用户访问网站的次数、频率等。
[0058] 步骤Ξ:按照其他维度对所述历史行为信息中的关联信息进行分析,从所述关联 信息中提取地域特征及其特征值,和/或,设备特征及其特征值作为用户的特征信息。
[0059] 还可W按照其他维度对所述历史行为信息中的关联信息进行分析,从关联信息中 提取地域特征及其特征值,如访问购物网站时,确定用户购买商品的寄送地址、商品产地 等,或者从关联信息中提取设备特征及其特征值,如用户访问网站所使用的设备,如采用移 动设备,W及具体的移动设备等。
[0060] 从而通过多种维度的分析得到多维的特征信息,全面、准确的分析访问网站的用 户所具有的特征。
[0061] 步骤206,获取各用户的特征信息中的特征值,确定各特征值对应匹配的分类标 签。
[0062] 步骤208,针对每个分类标签,通过特征值圈定所述分类标签对应的用户构成用户 群。
[0063] 本实施例中,对网站中所有用户的特征信息进行分析,确定相应的分类标签,每一 种特征对应一个或多个分类标签,而每个分类标签对应一个或多个特征值,从而确定用户 的特征信息中各特征值对应匹配的分类标签。
[0064] 分类标签的设置可W依据实际需求确定,例如在购物网站中,业务特征包括类目 特征和商品特征,而一个类目可W作为一个分类标签,则一个分类标签可能对应多个商品 特征的特征值。而对于设备特征、地域特征则可W各自对应一个分类标签。 阳0化]由于每个分类标签对应一个或多个特征值,因此针对每个分类标签,通过其所对 应的特征值圈定该特征值所对应用户,构成该分类标签的用户群 [0066] 步骤210,为每个分类标签创建业务对象组。
[0067] 由于在投放时是按照用户所具有的分类标签确定投放的业务对象,因此要为每个 分类标签创建一个业务对象组,该业务对象组中包括属于该分类标签的各业务对象。
[0068] 然后分析每个业务对象组所对应用户群的群体价值信息,W通过用户群的群体价 值信息设置业务对象组的价值特征信息,据此确定业务对象的投放。
[0069] 步骤212,对第一时间段内各用户的特征信息进行特征分析,确定用户群的价值权 重。
[0070] 针对任意用户群,可W获取第一时间段内该用户群中各用户的特征信息进行特征 分析,例如采用模型训练获取该用户群的价值权重,该价值权重用于预估用户群的全体价 值倍息。
[0071] 本申请一个可选实施例中,所述对第一时间段内各用户的特征信息进行特征分 析,确定用户群的价值权重,包括:对所述第一时间段进行切分,确定训练时间段和测试时 间段;对所述训练时间段内各用户的特征信息进行特征分析确定特征矩阵;从所述测试时 间段内各用户的特征信息中抽取训练目标;对所述特征矩阵和训练目标进行回归训练,计 算所述用户群的价值权重。
[0072] 将第一时间段切分为两部分,前一部分作为训练时间段,后一部分作为测试时间 段。然后采用训练时间段内各用户的特征信息进行特征分析确定特征矩阵,生成特征模型。 从所述测试时间段内各用户的特征信息中抽取训练目标,对特征模型进行模型训练,即对 所述特征矩阵和训练目标进行回归训练,计算该用户群的价值权重。
[0073] 步骤214,对第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重 的加权计算确定所述用户群的群体价值信息。
[0074] 第二时间段可W使进行投放预测前的一段时间,在对该第二时间段内各用户的特 征信息进行特征分析后,通过价值权重对分析结果进行加权计算,确定所述用户群的群体 价值信息。
[0075] 本申请一个可选实施例中,对第二时间段内各用户的特征信息进行特征分析,并 通过所述价值权重的加权计算确定所述用户群的群体价值信息,包括:对第二时间段内各 用户的特征信息进行特征分析确定预测的特征矩阵;采用所述价值权重对所述预测的特征 矩阵进行加权,计算确定所述用户群的群体价值信息。在对第二时间段内各用户的特征信 息进行特征分析时,可W计算该用户的特征矩阵,然后采用价值权重对所述预测的特征矩 阵进行加权,计算确定所述用户群的群体价值信息。
[0076] 步骤216,通过预设的目标价值信息和所述用户群的群体价值信息,计算所述业务 对象组的价值特征信息。
[0077] 本实施例中,预先设置了目标价值信息,该目标价值信息指的是业务对象投放后 预期获取的价值,因此对于业务对象组的价值特征信息,可W采用预设的目标价值信息和 所述用户群的群体价值信息进行计算得到。
[0078] 步骤218,根据所述用户的特征信息确定所述用户对应的候选分类标签。
[0079] 每个用户访问网站时都可W分析出其所具有的特征信息,由于一个用户特征具有 多种特征信息,各特征的特征值对应了分类标签,而不能对每种特征都投放其相应的业务 对象,因此要从该用户所对应分类标签总筛选候选分类标签。
[0080] 本申请一个可选实施例中,根据所述用户的特征信息确定所述用户对应的候选分 类标签,包括:从所述用户访问网站的数据库中筛选所述用户的业务特征的特征值对应关 联特征信息;按照所述关联特征信息计算每个业务特征的特征值的排序分值;按照所述排 序分值对所述用户的业务特征的特征值进行排序,确定排序结果;从所述排序结果中筛选 前N个业务特征的特征值,将筛选的特征值对应分类标签作为特征分类标签。
[0081] 本实施例中,将业务对象对应的网页内容称为目标对象,例如针对购物网站的广 告,该广告所对应购物网站的商品即为目标对象。数据库中存储有目标对象的各种关联特 征,如对于某一商品其存储有订单数量,该商品的点击数量等特征。因此针对用户业务特征 的各特征值,可W获取该特征值的关联特征信息,然后采用关联特征信息计算每个业务特 征的特征值的排序分值。
[0082] 再按照排序分值由大到小的顺序对该用户的每个特征值进行排序,获取相应的排 序结果。再从该排序结果中筛选出前N个特征值,其中N为正整数,将筛选出的特征值对应 分类标签作为特征分类标签。特征分类标签为该用户兴趣较高的分类标签,可W用于确定 投放的业务对象,W及选中业务对象后所显示登陆页面中展示的目标对象。
[0083] 步骤220,按照所述候选分类标签设置所述用户的登陆页面。
[0084] 在网站中投放业务对象的目的之一是希望用户基于该业务对象访问其对应网站 的网页W查看目标对象,因此本实施例中还配置了业务对象被点击触发后显示的登录页 面,即登陆页面为触发所述网页展示位中展示的业务对象所链接到的页面。
[0085] 由于每个用户具有多个分类标签,而其触发的分类标签仅是其中的一个,因此为 了更全面的为用户推荐目标对象,可W在该登录页面中展示触发分类标签的目标对象,W 及该用户所具有的其他候选分类标签的目标对象。
[0086] 本申请一个可选实施例中,按照所述候选分类标签设置所述用户的登陆页面,包 括:按照所述候选分类标签确定检索关键词对目标对象进行检索,获取检索到的目标对象; 按照所述候选分类标签的排序分值,对所述检索到的目标对象的点击数据进行修正;按照 修正的点击数据对所述检索到的目标对象进行排序;依据排序结果生成包含所述检索到的 目标对象的登录页面。
[0087] 针对每个候选分类标签其对应一定的特征值,可该特征值为检索关键词对网 站中的目标对象进行检索,获取检索到的目标对象,然后按照候选分类标签的排序分值对 检索到的目标对象的点击数据进行修正,按照修正的点击数据由多到少的顺序对所述检索 到的目标对象进行排序,依据排序结果生成包含所述检索到的目标对象的登录页面。
[0088] 综上,可W通过文本维度、时间维度、操作维度W及其他维度等一种或多种维度分 别对用户的当前访问网页和历史行为信息进行分析,从而获取与该维度相关的特征及其特 征值构成特征信息,通过多维分析得到的特征信息更加全面、准确。
[0089] 其次,基于各用户的特征信息,确定每个特征值对应匹配的分类标签,进而圈定每 个分类标签的用户群,确定具有该分类标签的用户群体,得到用户的群体特征。
[0090] 再次,可W通过模型训练等方式对特征信息进行特征分析确定用户群的价值权 重,从而基于预测前的第二时间段内用户的特征信息分析该用户群的群体价值信息,基于 用户的行为能够得到更准确的群体价值信息,继而计算所述业务对象组准确的价值特征信 息,准确的该价值特征信息能够提高业务对象的投放准确性,使得投放符合用户预期,得到 更好的推荐效果。
[0091] 再次,根据用户历史行为分析出的特征信息选取排序分支较高的候选分类标签, 从而基于该候选分类标签检索目标对象生成所述用户的登陆页面,使得用户在触发业务对 象时不仅展示与该业务对象相关的目标对象,还显示该用户可能感兴趣的其他目标对象, 使得推荐更加全面。 阳ow] 实施例S
[0093] 本实施例中,采用广告投放的场景为例,基于捜索引擎的竞价方式进行广告投放 来举例论述对其预处理方法。
[0094] 投放捜索引擎文字广告是一种有效拓展网站流量的方式。运种方式引入流量由于 带有用户查询关键词(query),具有明确的意图,是电商平台优先考虑购买的流量。但对于 大批量流量购买的电商平台,捜索引擎文字广告流量有限,不能满足量的需求。运时电商平 台会考虑展示广告流量。展示广告流量一般是由与捜索引擎合作的网站提供展示位广告位 上的访问流量。展示广告的流量可能是捜索引擎文字广告量的10倍W上,但流量质量会显 著差于捜索引擎文字广告。为了同时兼顾投放质和量的需求,可W对展示广告流量进行重 定向(retargeting),只购买展示广告流量中到曾经到达过网站的用户。
[0095] 运是因为数据分析发现,电商平台流量中的老用户会比新用户带来更多的商业价 值。老用户熟悉平台的操作规则,对平台具有一定的忠诚度,因此容易更快更多地带来转 化。电商平台在进行流量购买时,会优先考虑召回已经访问过网站的老用户。运部分老用 户也称之为再营销流量(^Remarketing或者Retargeting)。其中,再营销Remarketing是流 量采购的一种方式,定位人群为网站老用户。
[0096] 假设,广告信息作为业务对象,则广告组为业务对象组,目标对象为商品信息,广 告投放时可W基于捜索引擎的竞价规则进行投放,因此竞价信息即为预估的业务对象组的 价值特征信息。
[0097] 再营销在标注人群分类标签时,通常是根据当前访问网页的内容进行静态标注。 其标注的分类标签可W是基于:一、网页的关键词;二、网页的标题;Ξ、网页类目导航中类 目,即标注的分类标签来自于网页的静态内容,因此所确定的分类标签准确性较低,而本实 施例引入用户历史行为信息,通过用户的历史行为进行确定分类标签W及广告的竞价等信 息,对投放广告的定位更加精准。其中,捜索引擎广告投放架构示意图如图3所示,捜索引 擎和网站的广告投放交互示意图如图4所示。
[0098] 4. 02网站埋点。 W99] 在指定购物网站的网页上埋点,即在该网页中插入捜索引擎的再营销的 JS(JavaScript)代码。该JS代码可W获取在该网站访问的用户的分类标签,从而后续进行 广告的投放。 阳100] 4. 04获取用户的当前访问网页和历史行为信息。 阳101] 4. 06分析用户的特征信息。 阳102] 本实施例中,通过对当前访问网页和历史行为信息的一维或多维分析所得到的分 类特征的主要分类Ξ类:一、购买意图即业务特征,表征用户想要购买或采购的商品,可W 用商品词或者类目来描述;二、购买阶段即阶段特征,在确定购买意图后,根据用户访问历 史数据中的到访次数、到访频率、离站时间和转化阶段等数据可W表征用户所处的购买阶 段;Ξ、购买习惯即其他特征,用户的购买习惯可W通过用户所在国家、设备等反应,如表1 所示。 阳 103]
阳10引表1
[0106] 4. 08发送访问用户的投放信息给捜索引擎。 阳107] 用户在访问埋点网页时,会执行网页中的再营销JS代码,然后回想该捜索引擎发 送身份标识gid和该用户的分类标签tag,该分类标签tag是通过对当前浏览网页和历史行 为信息的分析确定的。该身份标识gid是捜索引擎为用户分配的唯一标识。 阳10引 4. 10依据各用户的特征信息确定分类标签及其用户群。 阳109] 依据上述表1所述的特征信息,至少可W分析如下分类标签:
[0110] 1) keyword是指用户在网站捜索过或浏览的商品词,可W包括一个或多个。 阳111] 2) catego巧是指用户在网站浏览过的类目或者所查找商品所属的类目,同样可W 包括一个或多个。 阳11引 3)visit_cnt是指用户访问网站的次数,即会话数量。
[0113] 4)visit_heq是指单位时间内用户访问网站的次数。
[0114] 5)left_time是指用户离开网站的时间。 阳115] 6)trans_step是指用户所处的采购阶段,例如捜索、加入购物车或支付等。
[0116] 7) count巧是指用户所在的国家,例如,US代表美国。 阳117] 8)device是指用户访问网站的设备,例如,MB代表手机等移动设备。
[0118] 本实施例中,针对再营销方式,在对静态网页进行标注确定分类特征的基础上,还 分析了访问用户的历史行为信息,采用历史数据和当前网页内容同时对人群进行标注分 类,即对访问用户进行多维度的标签标准,并精准圈定分类标签的用户群。并且,还会根据 访问用户在当前页的停留时间和操作动作等确定特征信息对应分类标签。当前上述特征信 息及确定的分类标签仅用于举例论述本实施例,实际处理中还可W依据需求分析其他特征 信息,如浏览或点击过商品、购买商品的周期和购买时间点等。
[0119] 4. 12为每个分类标签设置一个广告组adgroup。
[0120] 其中,广告组adgroup是广告账户结构中的一种粒度。 阳121] 4. 14基于用户群中各用户的特征信息确定群体价值信息。 阳122] 4. 16基于群体价值信息设置各广告组的竞价
[0123] 通常,再营销的竞价设置由人工经验决定,运营专员会根据投放市场行情W及不 同广告组对应网站内行业情况进行设定。但运种设置方式过于粗略,难W批量应用于大量 的广告组,竞价调整成本也非常高,效果也难W达到预期。
[0124] 本实施例为了同时兼顾投放效率和效果,合理的设置竞价,因此要准确的预估广 告组对应用户群的群体价值信息W合理的设置竞价。本申请根据用户群的分类标签和特征 预估人群价值,设置对应的竞价,从而达到较好的投放效果。对群体价值信息的预估可W包 括如下两个阶段: 阳125] 1)模型训练 阳126] 取一段时间的网站访问用户U,并在时间上进行切分,时间段tl作为训练时间段, 时间段t2作为测试时间段。按照时间段tl内分析的用户特征对训练数据进行特征抽取, 得到由用户和分类标签构成的特征矩阵: 阳 127]
公式1
[0128]训练目标为群体价值信息,本实施例中,群体价值信息指的是访问用户所带来的 收益与访问会话次数的比值: 阳129]
公式2
[0130] 再根据时间段t2获取的特征信息作为测试数据,抽取训练目标。
[0131] V = [valuei,values, ...,valuej 12了 公式 3 阳132] 采用线性回归做训练,即求解特征的权重系数W。 阳13引 F*w = V 公式4 阳 134] w = pi*v公式5 阳135] 本实施例中,除了采用线性回归模型之外,还可W采用逻辑回归模型或回归树模 型等,可W依据实际需求选取。 阳136] 2)群体价值信息预估
[0137] 在进行群体价值信息预估时,需要对待预测用户预测前时间段口的数据进行特 征抽取,得到特征矩阵:
阳13引 公式6
[0139] 分类标签对应群体价值信息可W根据公式7得到:
[0140]
公式 7 阳141] 从而通过群体价值信息计算得到最终的竞价,其计算公式如下所示: 阳142]
公式8
[0143] 其中,bid为竞价,ROIth为设定的营收比目标,α为经验参数。其中,R0I为Revenue on Investment,即投资回报比,收益与投入的比值。
[0144] 4. 18设置访问用户的登录页面。
[0145] 再营销方式中广告组的登陆页是在创建广告组后设定的,根据分类标签来确定登 陆页的链接地址。例如"电子商品"对应的广告组(用户群)可W设置"电子商品"所对应 类目的导航页。
[0146] 再营销流量进入网站登陆页时,内容可能是类目页面或者是关键词捜索页面,该 内容取决于访问用户在展示网络上所触发标签(广告)。例如,用户在访问网站埋点网页时 会上传该用户的分类标签,因此在广告账户中会有与该用户分类标签对应的广告。当用户 在访问展示网络上的广告位置时,会触发某个标签对应的广告,在用户点击广告后进入标 签所对应的登陆页。 阳147] 本实施例中,分类标签所对应的登陆页在反映了用户当前的兴趣点的基础上,进 一步考虑用户的历史偏好。即在登陆页加入用户的历史偏好内容,实现个性化,改善用户体 验,W达到提高转化和收益的目标。
[0148] 本实施例中,分析用户历史行为信息得到的特征信息中,业务特征可W包括关键 词和类目。然后对用户的偏好关键词和类目集合计算排序分值并进行排序。 阳149]
公式9
[0150] 其中,i为关键词或类目对应的商品,W商品汇总效果而言关联特征信息包括: view为商品的曝光量,click为商品获得的点击量,order是订单数量。取排序分值由大到 小排在前N个的商品词和类目作为候选分类标签。 阳151] 不同于单一的关键词或类目捜索页面,个性化登陆页面采用了多个关键词和类目 进行商品检索。检索的商品集合为所有关键词和类目的并集。 阳152] 传统的广告排序采用点击率(Click-T虹OU曲-Rate, CTR)*竞价,即ct巧bid的方 式进行,W保证千次展示收入巧evenue Per Mille,RPM)最大化。登录页面中商品的个性 化排序可W根据检索关键词和类目的权重对CTR进行修正。 阳 153] ctr;' = 丫 * Σ jScorei, j+ctr; 公式 10
[0154] ctri为商品i的原始ctr,scorei,,为商品i所对应的检索关键词或类目对应的偏 好得分,丫为经验参数。 阳155] 现有登陆页的内容只反映了用户当前的兴趣点,而没有考虑用户历史的兴趣点。 本申请实施例在分析用户历史行为数据,挖掘用户更多兴趣点和更精确的用户意图确定分 类标签W及用户群的群体价值信息基础上,基于用户的特征信息在登陆页组织更丰富的个 性化内容提升用户体验,从而带来更多的平台收益。例如对于某个"电子商品"对应的访问 用户,通过历史数据的分析,发现用户对"上衣"也感兴趣,另外发现用户对"电子商品"中的 "平板"感兴趣。因此,在登陆页中可w将"平板"相关商品排在前面,"上衣"等其他兴趣可 W组织在页面右侧等区域。并且,还可W通过分析用户所在群体的特征确定登陆页面,如基 于年龄、区域进行等进行设置。
[0156] 4. 20在捜索引擎中执行标签映射。 阳157] 4. 22用户浏览其他网站的网页时点击触发广告。 阳15引 4. 24返回该广告对应的登陆页。 阳159] 捜索引擎基于网站上传的gid和tag,完成映射(gid,tag),从而在该用户捜索引 擎的展示广告网络被发现时,如在google展示广告网络(Google Display ^tworkiGON) 被发现时,依据映射(gid, tag)触发展示相应的广告。用户在点击某一广告后,基于该广告 所对应的链接地址可W开启相应的登陆页面。
[0160] 本实施中通过用户和分类标签进行映射进行广告的投放,运只是具体实施中的一 种方式,还可W采用如对网站用户和再营销平台用户进行映射(cookie mapping)的方式, 本实施例对此不作限定。 阳161] 通过上述交互过程实现了广告投放的预处理,W及广告投放步骤。本实施例可W 应用于分布式集群的Linux操作系统上、利用化doop和化ve运行较佳的实施效果。 阳162] 综上,根据用户当前浏览网页和历史行为信息,分析用户的特征信息即兴趣点所 在,并从多种维度分析用户购买意图、购买阶段W及购买习惯。通过分析得到的兴趣点、所 处购买阶段和真实购买意图对人群进行分类标注确定分类。本实施例在在进行人群分类标 注时,不再局限于只使用埋点网页的内容与标题,而是结合用户历史行为信息的分析,对用 户提供更多维度的分类标签。
[0163] 其次,根据再营销流量的特征信息,对用户群的特征信息建模,预估群体价值信 息,并根据群体价值信息进行广告组的竞价设置,保证能够达到营收比的条件下获取更多 的流量。
[0164] 再次,分析用户的历史行为信息,得到用户的特征信息从而总结出购买偏好和习 惯。利用用户的特征信息对登陆页面的商品进行个性化检索和排序,为用户在访问登陆页 面动态生成个性化内容。
[01化]需要说明的是,对于方法实施例,为了简单描述,故将其都表述为一系列的动作组 合,但是本领域技术人员应该知悉,本申请实施例并不受所描述的动作顺序的限制,因为依 据本申请实施例,某些步骤可W采用其他顺序或者同时进行。其次,本领域技术人员也应该 知悉,说明书中所描述的实施例均属于优选实施例,所设及的动作并不一定是本申请实施 例所必须的。 阳166] 实施例四
[0167] 在上述实施例的基础上,本实施例还提供了一种信息投放的预处理装置。 阳168] 参照图5,示出了本申请实施例提供的一种信息投放的预处理装置的结构框图,具 体可W包括如下模块:
[0169] 特征分析模块502,用于在用户访问网站时,基于用户的当前访问网页和历史行为 信息确定所述用户的特征信息。标签分析模块504,用于根据特征信息确定分类标签及其用 户群。创建模块506,用于为每个分类标签创建业务对象组。群体价值计算模块508,用于 计算特征信息所属分类标签对应用户群的群体价值信息。价值特征设置模块510,用于依据 所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确 定网页展示位中展示的业务对象组。
[0170] 综上所述,本实施例通过基于用户的当前访问网页和历史行为信息确定所述用户 的特征信息,从而全面、准确地确定用户所具有的特征,再基于各用户的特征信息分析出对 应的分类标签,W及该分类标签所对应的用户群,并为每个分类标签创建业务对象组,即可 W基于用户当前和历史行为分析出其所对应的业务对象组,从而后续精准的定位推荐的业 务对象。并且,还采用特征信息分析其所属分类标签对应用户群的群体价值信息,进而设置 业务对象组的价值特征信息,准确的分析每个业务对象组的价值,W在投放广告时依据其 价值特征信息准确的确定投放的业务对象,从而通过上述投放的预处理操作,可W在投放 广告前准确分析用户所属分类标签并确定对应业务对象组及其价值特征信息,使得后续所 投放的业务对象定位更精准,符合用户期望和需求。 阳171] 实施例五
[0172] 参照图6A,示出了本申请实施例提供的另一种信息投放的预处理装置的结构框 图,具体可W包括如下模块: 阳173] 特征分析模块602,用于在用户访问网站时,基于用户的当前访问网页和历史行为 信息确定所述用户的特征信息。标签分析模块604,用于根据特征信息确定分类标签及其用 户群。创建模块606,用于为每个分类标签创建业务对象组。群体价值计算模块608,用于 计算特征信息所属分类标签对应用户群的群体价值信息。价值特征设置模块610,用于依据 所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信息用于确 定网页展示位中展示的业务对象组。登陆页设置模块612,用于根据所述用户的特征信息确 定所述用户对应的候选分类标签;按照所述候选分类标签设置所述用户的登陆页面,所述 登陆页面为触发所述网页展示位中展示的业务对象所链接到的页面。
[0174] 参照图6B,示出了本申请实施例提供的另一种信息投放的预处理装置中特征分析 模块的结构框图。
[01巧]其中,所述特征分析模块602,包括:信息获取子模块60202,用于在用户访问网 站时,分别获取所述用户的当前访问网页和历史行为信息;分析子模块60204,用于按照一 种或多种维度分别对所述当前访问网页和历史行为信息进行分析,确定所述用户的特征信 息。 阳176] 本申请一个可选实施例中,所述分析子模块60204,包括:第一分析单元602042, 用于按照文本维度对所述当前访问网页的文本信息进行分析,从所述文本信息中提取业务 特征和所述业务特征的特征值作为所述用户的特征信息。
[0177] 第二分析单元602044,用于按照文本维度对所述历史行为信息中的文本信息进 行分析,从所述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信 息;和/或,按照时间维度对所述历史行为信息中的时间相关信息进行分析,从所述时间相 关信息中提取阶段特征和所述阶段特征的特征值作为用户的特征信息;和/或,按照其他 维度对所述历史行为信息中的关联信息进行分析,从所述关联信息中提取地域特征及其特 征值,和/或,设备特征及其特征值作为用户的特征信息。
[0178] 其中,所述第一分析单元602042,还用于针对操作维度,通过对所述用户在当前访 问网页内执行的操作信息的分析,提取所述用户的分类特征及其特征值,其中,所述操作信 息包括:停留时间数据和动作执行数据。
[0179] 参照图6C,示出了本申请实施例提供的另一种信息投放的预处理装置中标签分析 模块的结构框图。
[0180] 所述标签分析模块604,包括:标签确定子模块60402,用于获取各用户的特征信 息中的特征值,确定各特征值对应匹配的分类标签,其中,每个分类标签对应一个或多个特 征值;用户群圈定子模块60404,用于针对每个分类标签,通过特征值圈定所述分类标签对 应的用户构成用户群。 阳181] 参照图6D,示出了本申请实施例提供的另一种信息投放的预处理装置中群体价值 计算模块的结构框图。
[0182] 所述群体价值计算模块608,包括:权重训练子模块60802,用于对第一时间段内 各用户的特征信息进行特征分析,确定用户群的价值权重;价值预估子模块60804,用于对 第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重的加权计算确定所述 用户群的群体价值信息。
[0183] 本申请一个可选实施例中,所述权重训练子模块60802,包括:切分单元608022, 用于对所述第一时间段进行切分,确定训练时间段和测试时间段;特征分析单元608024, 用于对所述训练时间段内各用户的特征信息进行特征分析确定特征矩阵;抽取单元 608026,用于从所述测试时间段内各用户的特征信息中抽取训练目标;训练单元608028, 用于对所述特征矩阵和训练目标进行回归训练,计算所述用户群的价值权重。
[0184] 所述价值预估子模块60804,包括:特征预测单元608042,用于对第二时间段内各 用户的特征信息进行特征分析确定预测的特征矩阵;价值计算单元608044,用于采用所述 价值权重对所述预测的特征矩阵进行加权,计算确定所述用户群的群体价值信息。
[0185] 所述价值特征设置模块610,用于通过预设的目标价值信息和所述用户群的群体 价值信息,计算所述业务对象组的价值特征信息。
[0186] 参照图犯,示出了本申请实施例提供的另一种信息投放的预处理装置中登陆页设 置模块的结构框图。
[0187] 本申请一个可选实施例中,所述登陆页设置模块612,包括:第一筛选子模块 61202,用于从所述用户访问网站的数据库中筛选所述用户的业务特征的特征值对应关联 特征信息;分值计算子模块61204,用于按照所述关联特征信息计算每个业务特征的特征 值的排序分值;特征值排序子模块61206,用于按照所述排序分值对所述用户的业务特征 的特征值进行排序,确定排序结果;第二筛选子模块61208,用于从所述排序结果中筛选前 N个业务特征的特征值,将筛选的特征值对应分类标签作为特征分类标签。
[0188] 检索模块61210,用于按照所述候选分类标签确定检索关键词对目标对象进行检 索,获取检索到的目标对象;修正模块61212,用于按照所述候选分类标签的排序分值,对 所述检索到的目标对象的点击数据进行修正;目标对象排序子模块61214,用于按照修正 的点击数据对所述检索到的目标对象进行排序;页面生成子模块61216,用于依据排序结 果生成包含所述检索到的目标对象的登录页面。
[0189] 综上,可W通过文本维度、时间维度、操作维度W及其他维度等一种或多种维度分 别对用户的当前访问网页和历史行为信息进行分析,从而获取与该维度相关的特征及其特 征值构成特征信息,通过多维分析得到的特征信息更加全面、准确。
[0190] 其次,基于各用户的特征信息,确定每个特征值对应匹配的分类标签,进而圈定每 个分类标签的用户群,确定具有该分类标签的用户群体,得到用户的群体特征。 阳191] 再次,可W通过模型训练等方式对特征信息进行特征分析确定用户群的价值权 重,从而基于预测前的第二时间段内用户的特征信息分析该用户群的群体价值信息,基于 用户的行为能够得到更准确的群体价值信息,继而计算所述业务对象组准确的价值特征信 息,准确的该价值特征信息能够提高业务对象的投放准确性,使得投放符合用户预期,得到 更好的推荐效果。
[0192] 再次,根据用户历史行为分析出的特征信息选取排序分支较高的候选分类标签, 从而基于该候选分类标签检索目标对象生成所述用户的登陆页面,使得用户在触发业务对 象时不仅展示与该业务对象相关的目标对象,还显示该用户可能感兴趣的其他目标对象, 使得推荐更加全面。 阳193] 对于装置实施例而言,由于其与方法实施例基本相似,所W描述的比较简单,相关 之处参见方法实施例的部分说明即可。 阳194] 本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与 其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0195] 本领域内的技术人员应明白,本申请实施例的实施例可提供为方法、装置、或计算 机程序商品。因此,本申请实施例可采用完全硬件实施例、完全软件实施例、或结合软件和 硬件方面的实施例的形式。而且,本申请实施例可采用在一个或多个其中包含有计算机可 用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上 实施的计算机程序商品的形式。
[0196] 在一个典型的配置中,所述计算机设备包括一个或多个处理器(CPU)、输入/输出 接口、网络接口和内存。内存可能包括计算机可读介质中的非永久性存储器,随机存取存储 器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是 计算机可读介质的示例。计算机可读介质包括永久性和非永久性、可移动和非可移动媒体 可W由任何方法或技术来实现信息存储。信息可W是计算机可读指令、数据结构、程序的模 块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取 存储器(SRAM)、动态随机存取存储器值RAM)、其他类型的随机存取存储器(RAM)、只读存储 器(ROM)、电可擦除可编程只读存储器巧EPROM)、快闪记忆体或其他内存技术、只读光盘只 读存储器(CD-ROM)、数字多功能光盘值VD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储 或其他磁性存储设备或任何其他非传输介质,可用于存储可W被计算设备访问的信息。按 照本文中的界定,计算机可读介质不包括非持续性的电脑可读媒体(transitory media), 如调制的数据信号和载波。 阳197] 本申请实施例是参照根据本申请实施例的方法、终端设备(系统)、和计算机程序 商品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框 图中的每一流程和/或方框、W及流程图和/或方框图中的流程和/或方框的结合。可提 供运些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理 终端设备的处理器W产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处 理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多 个方框中指定的功能的装置。
[0198] 运些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备 W特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包 括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方 框或多个方框中指定的功能。
[0199] 运些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得 在计算机或其他可编程终端设备上执行一系列操作步骤W产生计算机实现的处理,从而在 计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程 和/或方框图一个方框或多个方框中指定的功能的步骤。 阳200] 尽管已描述了本申请实施例的优选实施例,但本领域内的技术人员一旦得知了基 本创造性概念,则可对运些实施例做出另外的变更和修改。所W,所附权利要求意欲解释为 包括优选实施例W及落入本申请实施例范围的所有变更和修改。 阳201] 最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将 一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示运些实体或操作 之间存在任何运种实际的关系或者顺序。而且,术语"包括"、"包含"或者其任何其他变体意 在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包 括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为运种过程、方法、物品 或者终端设备所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要 素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。 阳202] W上对本申请所提供的一种信息投放的预处理方法和一种信息投放的预处理装 置,进行了详细介绍,本文中应用了具体个例对本申请的原理及实施方式进行了阐述,W上 实施例的说明只是用于帮助理解本申请的方法及其核屯、思想;同时,对于本领域的一般技 术人员,依据本申请的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本 说明书内容不应理解为对本申请的限制。
【主权项】
1. 一种信息投放的预处理方法,其特征在于,包括: 在用户访问网站时,基于用户的当前访问网页和历史行为信息确定所述用户的特征信 息; 根据所述特征信息确定分类标签及其用户群,为每个分类标签创建业务对象组; 计算特征信息所属分类标签对应用户群的群体价值信息; 依据所述群体价值信息设置所述业务对象组的价值特征信息,其中,所述价值特征信 息用于确定网页展示位中展示的业务对象组。2. 根据权利要求1所述的方法,其特征在于,在用户访问网站时,基于用户的当前访问 网页和历史行为信息确定所述用户的特征信息,包括: 在用户访问网站时,分别获取所述用户的当前访问网页和历史行为信息; 按照一种或多种维度分别对所述当前访问网页和历史行为信息进行分析,确定所述用 户的特征信息。3. 根据权利要求2所述的方法,其特征在于,对所述当前访问网页进行分析确定所述 用户的特征信息的步骤,包括: 按照文本维度对所述当前访问网页的文本信息进行分析,从所述文本信息中提取业务 特征和所述业务特征的特征值作为所述用户的特征信息。4. 根据权利要求2所述的方法,其特征在于,对所述历史行为信息进行分析确定所述 用户的特征信息的步骤包括以下至少一项: 按照文本维度对所述历史行为信息中的文本信息进行分析,从所述文本信息中提取业 务特征和所述业务特征的特征值作为所述用户的特征信息; 按照时间维度对所述历史行为信息中的时间相关信息进行分析,从所述时间相关信息 中提取阶段特征和所述阶段特征的特征值作为用户的特征信息; 按照其他维度对所述历史行为信息中的关联信息进行分析,从所述关联信息中提取地 域特征及其特征值,和/或,设备特征及其特征值作为用户的特征信息。5. 根据权利要求3所述的方法,其特征在于,对所述当前访问网页进行分析确定所述 用户的特征信息的步骤还包括: 针对操作维度,通过对所述用户在当前访问网页内执行的操作信息的分析,提取所述 用户的分类特征及其特征值,其中,所述操作信息包括:停留时间数据和动作执行数据。6. 根据权利要求3或4或5所述的方法,其特征在于,根据所述特征信息确定分类标签 及其用户群,包括: 获取各用户的特征信息中的特征值,确定各特征值对应匹配的分类标签,其中,每个分 类标签对应一个或多个特征值; 针对每个分类标签,通过特征值圈定所述分类标签对应的用户构成用户群。7. 根据权利要求1至5任一项所述的方法,其特征在于,计算特征信息所属分类标签对 应用户群的群体价值信息,包括: 对第一时间段内各用户的特征信息进行特征分析,确定用户群的价值权重; 对第二时间段内各用户的特征信息进行特征分析,并通过所述价值权重的加权计算确 定所述用户群的群体价值信息。8. 根据权利要求7所述的方法,其特征在于,所述对第一时间段内各用户的特征信息 进行特征分析,确定用户群的价值权重,包括: 对所述第一时间段进行切分,确定训练时间段和测试时间段; 对所述训练时间段内各用户的特征信息进行特征分析确定特征矩阵; 从所述测试时间段内各用户的特征信息中抽取训练目标; 对所述特征矩阵和训练目标进行回归训练,计算所述用户群的价值权重。9. 根据权利要求7所述的方法,其特征在于,对第二时间段内各用户的特征信息进行 特征分析,并通过所述价值权重的加权计算确定所述用户群的群体价值信息,包括: 对第二时间段内各用户的特征信息进行特征分析确定预测的特征矩阵; 采用所述价值权重对所述预测的特征矩阵进行加权,计算确定所述用户群的群体价值 信息。10. 根据权利要求9所述的方法,其特征在于,依据所述群体价值信息设置所述业务对 象组的价值特征信息,包括: 通过预设的目标价值信息和所述用户群的群体价值信息,计算所述业务对象组的价值 特征信息。11. 根据权利要求3或4所述的方法,其特征在于,还包括: 根据所述用户的特征信息确定所述用户对应的候选分类标签; 按照所述候选分类标签设置所述用户的登陆页面,所述登陆页面为触发所述网页展示 位中展示的业务对象所链接到的页面。12. 根据权利要求11所述的方法,其特征在于,根据所述用户的特征信息确定所述用 户对应的候选分类标签,包括: 从所述用户访问网站的数据库中筛选所述用户的业务特征的特征值对应关联特征信 息; 按照所述关联特征信息计算每个业务特征的特征值的排序分值; 按照所述排序分值对所述用户的业务特征的特征值进行排序,确定排序结果; 从所述排序结果中筛选前N个业务特征的特征值,将筛选的特征值对应分类标签作为 特征分类标签。13. 根据权利要求12所述的方法,其特征在于,按照所述候选分类标签设置所述用户 的登陆页面,包括: 按照所述候选分类标签确定检索关键词对目标对象进行检索,获取检索到的目标对 象; 按照所述候选分类标签的排序分值,对所述检索到的目标对象的点击数据进行修正; 按照修正的点击数据对所述检索到的目标对象进行排序; 依据排序结果生成包含所述检索到的目标对象的登录页面。14. 一种信息投放的预处理装置,其特征在于,包括: 特征分析模块,用于在用户访问网站时,基于用户的当前访问网页和历史行为信息确 定所述用户的特征信息; 标签分析模块,用于根据所述特征信息确定分类标签及其用户群; 创建模块,用于为每个分类标签创建业务对象组; 群体价值计算模块,用于计算特征信息所属分类标签对应用户群的群体价值信息; 价值特征设置模块,用于依据所述群体价值信息设置所述业务对象组的价值特征信 息,其中,所述价值特征信息用于确定网页展示位中展示的业务对象组。15. 根据权利要求14所述的装置,其特征在于,所述特征分析模块,包括: 信息获取子模块,用于在用户访问网站时,分别获取所述用户的当前访问网页和历史 行为信息; 分析子模块,用于按照一种或多种维度分别对所述当前访问网页和历史行为信息进行 分析,确定所述用户的特征信息。16. 根据权利要求15所述的装置,其特征在于,所述分析子模块,包括: 第一分析单元,用于按照文本维度对所述当前访问网页的文本信息进行分析,从所述 文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息。17. 根据权利要求15所述的装置,其特征在于,所述分析子模块,包括: 第二分析单元,用于按照文本维度对所述历史行为信息中的文本信息进行分析,从所 述文本信息中提取业务特征和所述业务特征的特征值作为所述用户的特征信息;和/或, 按照时间维度对所述历史行为信息中的时间相关信息进行分析,从所述时间相关信息中提 取阶段特征和所述阶段特征的特征值作为用户的特征信息;和/或,按照其他维度对所述 历史行为信息中的关联信息进行分析,从所述关联信息中提取地域特征及其特征值,和/ 或,设备特征及其特征值作为用户的特征信息。18. 根据权利要求16所述的装置,其特征在于, 所述第一分析单元,还用于针对操作维度,通过对所述用户在当前访问网页内执行的 操作信息的分析,提取所述用户的分类特征及其特征值,其中,所述操作信息包括:停留时 间数据和动作执行数据。19. 根据权利要求16或17或18所述的装置,其特征在于,所述标签分析模块,包括: 标签确定子模块,用于获取各用户的特征信息中的特征值,确定各特征值对应匹配的 分类标签,其中,每个分类标签对应一个或多个特征值; 用户群圈定子模块,用于针对每个分类标签,通过特征值圈定所述分类标签对应的用 户构成用户群。20. 根据权利要求14至18任一项所述的装置法,其特征在于,所述群体价值计算模块, 包括: 权重训练子模块,用于对第一时间段内各用户的特征信息进行特征分析,确定用户群 的价值权重; 价值预估子模块,用于对第二时间段内各用户的特征信息进行特征分析,并通过所述 价值权重的加权计算确定所述用户群的群体价值信息。21. 根据权利要求20所述的装置,其特征在于,所述权重训练子模块,包括: 切分单元,用于对所述第一时间段进行切分,确定训练时间段和测试时间段; 特征分析单元,用于对所述训练时间段内各用户的特征信息进行特征分析确定特征矩 阵; 抽取单元,用于从所述测试时间段内各用户的特征信息中抽取训练目标; 训练单元,用于对所述特征矩阵和训练目标进行回归训练,计算所述用户群的价值权 重。22. 根据权利要求20所述的装置,其特征在于,所述价值预估子模块,包括: 特征预测单元,用于对第二时间段内各用户的特征信息进行特征分析确定预测的特征 矩阵; 价值计算单元,用于采用所述价值权重对所述预测的特征矩阵进行加权,计算确定所 述用户群的群体价值信息。23. 根据权利要求22所述的装置,其特征在于, 所述价值特征设置模块,用于通过预设的目标价值信息和所述用户群的群体价值信 息,计算所述业务对象组的价值特征信息。24. 根据权利要求16或17所述的装置,其特征在于,还包括: 登陆页设置模块,用于根据所述用户的特征信息确定所述用户对应的候选分类标签; 按照所述候选分类标签设置所述用户的登陆页面,所述登陆页面为触发所述网页展示位中 展示的业务对象所链接到的页面。25. 根据权利要求24所述的装置,其特征在于,所述登陆页设置模块,包括: 第一筛选子模块,用于从所述用户访问网站的数据库中筛选所述用户的业务特征的特 征值对应关联特征信息; 分值计算子模块,用于按照所述关联特征信息计算每个业务特征的特征值的排序分 值; 特征值排序子模块,用于按照所述排序分值对所述用户的业务特征的特征值进行排 序,确定排序结果; 第二筛选子模块,用于从所述排序结果中筛选前N个业务特征的特征值,将筛选的特 征值对应分类标签作为特征分类标签。26. 根据权利要求25所述的装置,其特征在于,所述登陆页设置模块,包括: 检索模块,用于按照所述候选分类标签确定检索关键词对目标对象进行检索,获取检 索到的目标对象; 修正模块,用于按照所述候选分类标签的排序分值,对所述检索到的目标对象的点击 数据进行修正; 目标对象排序子模块,用于按照修正的点击数据对所述检索到的目标对象进行排序; 页面生成子模块,用于依据排序结果生成包含所述检索到的目标对象的登录页面。
【文档编号】G06F17/30GK105989004SQ201510041351
【公开日】2016年10月5日
【申请日】2015年1月27日
【发明人】黄凯明, 李波, 刘奎龙
【申请人】阿里巴巴集团控股有限公司