一种关键社交信息的确定方法及装置与流程

文档序号:11138413阅读:273来源:国知局
一种关键社交信息的确定方法及装置与制造工艺

本发明涉及互联网技术领域和计算机技术领域,尤其涉及一种关键社交信息的确定方法及装置。



背景技术:

在现有的互联网应用中,社交网络得到了广泛的应用和快速的发展,如微博等。在社交网络中,社交对象(即用户)可以发布各种媒体形式的信息,如文字、图片、视频等,也可以浏览其他社交对象发布的信息。为了便于各社交对象之间的交流,社交对象之间可以建立关注和被关注的关系,社交对象之间可以互相浏览对方展示的社交信息,并转发以及评论该社交信息。

一条社交信息被发布以后,能够得到其他社交用户的转发,该转发过程可以仅仅转发上述社交信息,还可以在转发上述社交信息的同时,针对该社交信息发表自身的观点。由此可见,一条原始社交信息可以拥有大量的转发社交信息,该转发社交信息包含直接转发社交信息和间接转发社交信息,其中,直接转发社交信息即为转发原始社交信息的信息,间接转发社交信息即为转发直接转发社交信息的信息。在统计一个原始社交信息所造成的影响力时,通常需要从大量的转发社交信息中选取最具代表性的转发社交信息(即关键转发社交信息),该最具代表性的转发社交信息能够表征广大社交对象对原始社交信息中所描述信息的反映。

目前,从转发社交信息中确定最具代表性的转发社交信息的方法为:从所有直接转发社交信息中提取转发次数最多的直接转发社交信息,将提取得到的直接转发社交信息作为最具代表性的转发社交信息;或者,获取所有直接转发社交信息的社交对象,从获取的所有社交对象中提取知名度最高的社交对象, 将该知名度最高的社交对象的直接转发社交信息作为最具代表性的转发社交信息。采用该技术方案,仅考虑直接转发社交信息的特性,导致最终获取的最具代表性的转发社交信息较为片面。

由此可见,目前在从转发社交信息中选取关键转发社交信息的过程中,存在选取结果准确率低的问题。



技术实现要素:

本发明实施例提供一种关键社交信息的确定方法及装置,用以解决目前在从转发社交信息中选取关键转发社交信息的过程中,存在选取结果准确率低的问题。

本发明实施例提供的具体技术方案如下:

第一方面,本发明提供一种关键社交信息的确定方法,包括:根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;分别将所述每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;分别计算每一个候选关键社交信息对应的关键性评估值;从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。

结合第一方面,在第一方面第一种可能的实现方式中,分别根据每一个转 发社交信息的信息特征,获取所述每一个转发社交信息的特征向量,具体包括:

针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。

结合第一方面,或者第一方面第一种可能的实现方式,在第二种可能的实现方式中,所述筛选模型的生成方法,包括:从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。

结合第一方面第一种可能的实现方式或者第二种可能的实现方式,在第三种可能的实现方式中,采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数,具体包括:采用支持向量机算法,分别根据所述每一个训练转 发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。

结合第一方面第三种可能的实现方式,在第四种可能的实现方式中,建立所述输入序列和所述输出序列之间的相关性函数,具体包括:根据所述输入序列中包含的每一个训练特征向量之间的转发关系,以及所述输入序列中包含的每一个训练特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一训练特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一训练特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。

结合第一方面,第一方面第一种可能的实现方式至第四种可能的实现方式中的任意一项,在第五种可能的实现方式中,分别计算每一个候选关键社交信息对应的关键性评估值,具体包括:根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任 意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。

结合第一方面第五种可能的实现方式,在第六种可能的实现方式中,所述关键性评估值满足如下公式:其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值;

第二方面,提供一种关键社交信息的确定装置,包括:社交信息转发树生成单元,用于根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;特征向量获取单元,用于分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;候选关键社交信息获取单元,用于分别将所述特征向量获取单元获取的每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;关键性评估值计算单元,用于分别计算所述候选关键社交信息获取单元获取的每一个候选关键社交信息对应的关键性评估值;关键社交信息确定单元, 用于根据所述关键性评估值计算单元计算得到的每一个候选关键社交信息对应的关键性评估值,从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。

结合第二方面,在第一种可能的实现方式中,所述特征向量获取单元,用于:针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。

结合第二方面,或者第二方面第一种可能的实现方式,在第二种可能的实现方式中,还包括筛选模型生成单元,用于:从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。

结合第二方面第一种可能的实现方式或者第二种可能的实现方式,在第三种可能的实现方式中,筛选模型生成单元采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数,具体包括:

采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。

结合第二方面第三种可能的实现方式,在第四种可能的实现方式中,所述筛选模型生成单元建立所述输入序列和所述输出序列之间的相关性函数,具体包括:根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。

结合第二方面,第二方面第一种可能的实现方式至第四种可能的实现方式 中的任意一项,在第五种可能的实现方式中,所述关键性评估值计算单元,具体用于:根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。

结合第二方面第五种可能的实现方式,在第六种可能的实现方式中,所述关键性评估值计算单元计算得到的关键性评估值满足如下公式:

其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值;

本发明实施例中,获取原始社交信息的直接转发社交信息和间接转发社交信息,建立社交信息转发树;并获取该社交信息转发树上的每一个转发社交信息的信息特征;根据每一个转发社交信息的信息特征,确定该转发社交信息的特征向量;将得到的特征向量输入预设的筛选模型,获取候选关键社交信息;根据每一个候选关键社交信息的关键性评估值,从所有候选关键社交信息中选取最终的关键社交信息。采用本发明技术方案,综合考虑直接转发社交信息和间接转发社交信息,从原始社交信息的所有转发社交信息中选取关键社交信息,避免了仅从直接转发社交信息中选取关键社交信息时造成的选取结果片面 的问题,提高了选取结果的准确率;并且,在关键社交信息的选取过程中,以转发社交信息的内容和与社交信息转发树关联的特征作为选取关键社交信息的参考因素,进一步提高了最终选取结果的准确率。

附图说明

图1为本发明实施例中确定关键社交信息的流程图;

图2为本发明实施例中社交信息转发树示意图;

图3为本发明实施例中生成筛选模型流程图;

图4a为本发明实施例中链路关系表示意图;

图4b为本发明实施例中第二局部相关性函数的预设特征取值关系表;

图5为本发明实施例中候选关键社交信息图;

图6为本发明实施例中关键社交信息的确定装置结构示意图;

图7为本发明实施例中关键社交信息的确定设备结构示意图。

具体实施方式

为了解决目前在从转发社交信息中选取关键转发社交信息的过程中,存在选取结果准确率低的问题。本发明实施例中,获取原始社交信息的直接转发社交信息和间接转发社交信息,建立社交信息转发树;并获取该社交信息转发树上的每一个转发社交信息的信息特征;根据每一个转发社交信息的信息特征,确定该转发社交信息的特征向量;将得到的特征向量输入预设的筛选模型,获取候选关键社交信息;根据每一个候选关键社交信息的关键性评估值,从所有候选关键社交信息中选取最终的关键社交信息。采用本发明技术方案,综合考虑直接转发社交信息和间接转发社交信息,从原始社交信息的所有转发社交信息中选取关键社交信息,避免了仅从直接转发社交信息中选取关键社交信息时造成的选取结果片面的问题,提高了选取结果的准确率;并且,在关键社交信息的选取过程中,以转发社交信息的内容和与社交信息转发树关联的特征作为 选取关键社交信息的参考因素,进一步提高了最终选取结果的准确率。

本发明实施例中,可以由任意一具备数据处理能力的终端执行关键社交信息的确定操作,如该终端为服务器,或者,该终端为计算机等。

下面结合说明书附图,对本发明实施例作进一步详细描述。

参阅图1所示,本发明实施例中,关键社交信息的确定方法,包括:

步骤100:根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点。

本发明实施例中,终端获取待确定的原始社交信息,以及直接或间接转发该原始社交信息的转发社交信息;根据该原始社交信息,以及各个转发社交信息之间的转发关系,生成社交信息转发树。

在生成的社交信息转发树中,以原始社交信息为根节点,以各个转发社交信息为叶子节点和中间节点,其中,当存在任意一转发社交信息,不存在任何社交用户转发该任意一转发社交信息时,该任意一转发社交信息即作为社交信息转发树上的叶子节点,否则,任意一转发社交信息即作为在社交信息转发树上的中间节点;并且,每一个转发社交信息所代表的节点在该社交信息转发树上的位置,根据各个转发社交信息之间的转发关系确定。例如,参阅图2所示,为社交信息转发树示意图,原始社交信息A的转发社交信息为转发社交信息1,转发社交信息11,转发社交信息12,转发社交信息2,转发社交信息21,其中,转发社交信息1和转发社交信息2为直接转发社交信息,转发社交信息11,转发社交信息12和转发社交信息21为间接转发社交信息,根据该社交信息转发树可知,转发社交信息1被转发了两次,即转发所述转发社交信息1的转发社交信息11和转发社交信息12;转发社交信息2被转发了一次,即转发所述转发社交信息2的转发社交信息21。可选的,上述社交信息转发树中还可以记 录每一个转发社交信息的评论数。

由此可见,根据该社交信息转发树,能够更为直观地确定每一个转发社交信息在信息转发过程中的位置、兄弟节点和子节点,以及每一个转发社交信息被转发的次数和评论数。

采用上述技术方案,终端根据原始社交信息的转发社交信息,生成社交信息转发树,终端能够根据该社交信息转发树更为快捷地确定每一个转发社交信息的与所述社交信息转发树关联的特征,便于更加快速地确定关键社交信息,提高了数据处理速度。

步骤110:分别根据所述社交信息转发树中每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量。

本发明实施例中,终端获取社交信息转发树中包含的每一个转发社交信息的信息特征,其中,该信息特征包含文本特征和与社交信息转发树关联的特征,该文本特征由转发社交信息的内容确定,与社交信息转发树关联的特征由转发社交信息在社交信息转发树上的位置确定;终端根据获取的每一个转发社交信息的信息特征,生成该转发社交信息的特征向量。

具体的,终端生成所述每一个转发社交信息的特征向量的过程,包括:针对所述社交信息转发树中的任意一转发社交信息,执行如下操作,根据所述任意一转发社交信息的内容,提取所述任意一转发社交信息的文本特征,其中,该文本特征可以为任意一转发社交信息包含的词,二元语法,词性,表情符号,地址链接等;以及根据所述任意一转发社交信息在所述社交信息转发树上的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述与社交信息转发树关联的特征,其中,与社交信息转发树关联的特征可以为任意一转发社交信息的转发次数,评论数 等;采用预设算法,对所述文本特征进行运算,获取所述任意一转发社交信息对应的文本特征向量;以及获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一转发社交信息的特征向量。

可选的,在上述过程中,当文本特征为任意一转发社交信息包含的词,二元语法,词性时,终端可以首先对该任意一转发社交信息中包含的文字内容进行分词划分,并根据分词划分结果,确定该任意一转发社交信息包含的词,每一个词的词性,以及该任意一转发社交信息对应的二元语法等。当文本特征为表情符号,地址链接等时,终端可以将该任意一转发社交信息中包含的文字内容进行分词划分,并将划分后的分词分别与预设的表情符号集合和地址链接关键字进行匹配,当划分后的分词与表情符号集合中的任意一表情符号相同时,确定该划分后的分词为表情符号;提取划分后的分词中的关键字,当提取的关键字与地址链接关键字匹配成功时,确定该划分后的分词为地址链接。

可选的,采用预设算法,对所述文本特征进行运算,生成所述任意一转发社交信息对应的文本特征向量,具体包括:基于最大熵的马尔科夫模型(maximum entropy markov model),或者采用条件随机场(Conditional Random Field)等方法,对所述文本特征进行运算,生成所述任意以转发社交信息对应的文本特征向量。其中,生成的文本特征向量为多维向量,每一个维度代表的含义与文本特征向量的计算算法相关。例如,转发社交信息为“公司发布新手机”,对该转发社交信息进行分词划分,该划分后的分词为“公司”、“发布”,“新”、“手机”;引入索引词典,该索引词典中包含每一个分词的索引号,该索引词典中包含的分词的数目即为该索引词典的维度,亦即生成的文本特征向量的维度,如该索引词典中包含100个分词,则该索引词典的维度即为100,且生成的文本特征向量的维度为100;在索引词典中查找上述划分后的分词的索引号,如分词“公司”的索引号为1,那么将文本特征向量的第一个维度上的元素值设置为1,分词“发布”的索引号为20,那么将文本特征向量的第20 个维度上的元素值设置为1,分词“新”的索引号为34,那么将文本特征向量的第34个维度上的元素值设置为1,分词“手机”的索引号为54,那么将文本特征向量的第54个维度上的元素值设置为1,并将该特征向量所有维度中,除第1、20、34、54维度之外其他维度上的元素值设置为0。

由于文本特征通常为文字形式,采用上述技术方案,将文本特征进行量化,即将文本特征转化为数值形式,并将该数值形式的文本特征确定为获取文本特征向量,便于后续对关键社交信息的选取。

可选的,生成所述任意一转发社交信息对应的与社交信息转发树关联的特征向量,具体包括:根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量。其中,生成的与社交信息转发树关联的特征向量即为多维向量,每一个维度代表的含义设置情况相关。例如,转发社交信息T,其在社交信息转发树上所代表的节点t包含4个兄弟节点,节点t距离根节点的距离为6,节点t的子节点数目为2个,转发社交信息T的评论数为378,当将与社交信息转发树关联的特征向量设置为第一维度表示距离根节点的距离,第二唯独表示子节点数目,第三维度表示评论数,第四维度表示兄弟节点数目时,生成的与社交信息转发树关联的特征向量为4维向量,可以表示为{6,2,387,6}。

可选的,根据所述任意一转发社交信息的文本特征向量和所述与社交信息转发树关联的特征向量,生成所述任意一转发社交信息的特征向量,具体包括:将获取的文本特征向量和与社交信息转发树关联的特征向量进行合并处理,生成该任意一转发社交信息的特征向量;其中,上述合并处理方式可以根据具体情况预先设置,如所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。例如,所述任意一转发社交信息的文 本特征向量a={a1,a2},所述任意一转发社交信息的与社交信息转发树关联的特征向量b={b1,b2},则任意一转发社交信息的特征向量c={a1,a2,b1,b2}。

采用上述技术方案,根据转发社交信息的内容,生成文本特征向量,根据转发社交信息在社交信息转发树中的位置,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,生成所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;生成的特征向量的过程中,综合考虑转发社交信息的内容和转发社交信息在社交信息转发树中的位置,使得确定关键转发社交信息的过程中,既考虑了转发社交信息内容对选取结果的影响,也考虑了转发社交信息的影响力对选取结果的影响,从而保证了选取结果的准确性。

步骤120:分别将所述每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息。

本发明实施例中,终端将获取到的每一个转发社交信息的特征向量输入预设的筛选模型,并获取该筛选模型输出的候选社交信息。基于上述过程,筛选模型输出的候选社交信息均为内容具有代表性,且转发数量和评论数最多的转发社交信息。

可选的,参阅图3所示,所述筛选模型的生成方法,包括:

步骤a1:终端从历史数据中,获取任意一训练原始社交信息,以及所述任意一训练原始社交信息的训练转发社交信息。

本发明实施例中,上述训练转发社交信息对应的筛选分类结果为已知,即每一个训练转发社交信息是否为候选关键社交信息为已知,终端可以通过文字形式对训练转发社交信息进行标记(记为yi,i为转发社交信息标识,如该i为编号),如yi=候选关键社交信息,也可以通过二值形式对训练转发社交信息进行标记,如yi=1表示训练转发社交信息为候选关键社交信息,yi=0表示训练转发社交信息不是候选关键社交信息。

步骤a2:分别根据每一个训练转发社交信息的信息特征,生成所述每一个 训练转发社交信息的特征向量。

本发明实施例中,所述每一个训练转发社交信息的特征向量记为xi,i为转发社交信息标识,如该i为编号。

进一步的,终端在获取所述任意一训练原始社交信息,以及所述任意一训练原始社交信息的训练转发社交信息之后,根据该任意一训练原始社交信息,以及所述训练原始社交信息的训练转发社交信息,生成训练社交信息转发树;终端根据该训练社交信息转发树,以及每一个训练转发社交信息的文本内容,生成所述每一个训练转发社交信息的信息特征;终端根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量。

在上述步骤中,针对任意一训练转发社交信息,终端按照预设规则,从该任意一训练转发社交信息的文本内容中进行提取,获取相应的分词,二元语法,词性,地址链接,表情符号等信息,并采用预设算法对获取的信息进行运算,得到任意一训练转发社交信息的文本特征向量;

进一步的,针对任意一训练转发社交信息,终端根据该任意一训练转发社交信息所代表的节点的位置信息,和/或在所述训练社交信息转发树中,与所述任意一训练转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一训练转发社交信息对应的与训练社交信息转发树关联的特征向量;

进一步的,针对所述任意一训练转发社交信息,终端将上述获得的文本特征向量和与训练社交信息转发树关联的特征向量进行合并处理,生成所述任意一训练转发社交信息的特征向量。

步骤a3:采用预设的筛选算法,根分别据所述每一个训练转发社交信息的特征向量以及已知的每一个训练转发社交信息的筛选分类结果,获取筛选参数。

本发明实施例中,终端可以采用如下三种方式,获取筛选参数:

第一种方式:采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的每一个训练转发社交信息的筛选分类结果,获取筛选 参数;

第二种方式:采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的每一个训练转发社交信息的筛选分类结果,获取筛选参数;

在上述第一种方式和第二种方式直接根据已知的筛选分类结果获取筛选参数,不考虑不同训练转发社交信息的特征向量之间的转发关系,计算得到筛选参数的速度更快。

第三种方式:分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列,其中,输入序列可以表示为x1,x2,…,xn,且该n个特征向量属于训练社交信息转发树中同一个转发链路;根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列,其中,生成的输出序列中每一个筛选分类结果的排列顺序由所述输入序列中每一个特征向量决定,如任意一特征向量在输入序列中的位置编号为i,则该任意一特征向量对应的筛选分类结果在输出序列中的位置编号也为i;建立所述输入序列和所述输出序列之间的相关性函数,其中,该相关性函数为用于表征特征向量和筛选分类结果之间的关联性的函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。

可选的,终端建立所述输入序列和所述输出序列之间的相关性函数的过程,具体包括:根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表,其中,所述链路关系表包含两行,第一行表示输入序列,第二行表示输出序列;针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度(记为k)的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口仅包含所述任意一向量和多个筛选分类结果;根据当前扫描的窗口中包含的输出序列中的 筛选分类结果和所述任意一特征向量,生成第一局部相关性函数,其中,所述第一局部相关性函数为用于表征所述任意一特征向量以及所述当前扫描窗口中包含的筛选分类结果之间关联性的函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数,其中,所述第二局部相关性函数为用于表征所述任意一向量对应的筛选分类结果与所述当前扫描窗口中包含的其他筛选分类结果之间关联性的函数;根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。其中,上述窗口的预设宽度k可以根据具体应用场景预先设置,可选的,该k的取值范围为3~5。

例如,参阅图4a所示,为本发明实施例中的链路关系表和预设宽度的窗口;其中,输入序列为{x1,x2,…,xn},输出序列为{y1,y2,…,yn},输入序列中包含的特征向量的数目必定与输出序列中包含的筛选分类结果的数目相等。在图3中,以xi为任意一特征向量,该任意一特征向量xi的第一局部相关性函数记为f(xi,yi,yi-1,yi-2),该任意一特征向量xi的第二局部相关性函数记为g(yi,yi-1,yi-2)。

可选的,当窗口的预设宽度k为3时,任意一特征向量xi的第一局部相关性函数满足如下公式:

其中,xi为任意一特征向量;为第一局部相关性函数的参数,为一个高维向量,且该的维数与所述任意一特征向量xi的维数相同;yi,yi-1,yi-2表示的索引。

本发明实施例中,由于yi,yi-1,yi-2表示的索引,如当yi=0,yi-1=1,yi-2=1时,则取值为ω0,1,1。基于此可知,当k=3时,第一局部相关性函数的参数的取值包含八种情况。

可选的,任意一特征向量xi的第二局部相关性函数满足如下公式:

g(yi,yi-1,yi-2)=φ(yi,yi-1,yi-2)×ωtr

其中,φ(yi,yi-1,yi-2)表示根据yi,yi-1,yi-2的取值,得到的预设特征取值,yi,yi-1,yi-2和预设特征取值的对应关系参阅图4b所示;ωtr为第二局部相关性函数的参数,为一个高维向量,且该ωtr的维数与所述φ(yi,yi-1,yi-2)的维数相同。

可选的,基于上述第一局部相关性函数f(xi,yi,yi-1,yi-2)和第二局部相关性函数g(yi,yi-1,yi-2),生成的输入序列和输出序列之间的相关性函数f(x1,x2,…,xn,y1,y2,…,yn)满足如下公式:

其中,xi为任意一特征向量;为第一局部相关性函数的参数;φ(yi,yi-1,yi-2)表示根据yi,yi-1,yi-2的取值,得到的预设特征取值;ωtr为第二局部相关性函数的参数。

在所述第三种方式中,终端综合考虑训练社交信息转发树中不同训练转发社交信息之间的转发关系,得到筛选模型的参数,保证了得到的筛选模型以不同转发社交信息之间的转发关系,进一步提高了最终选取结果的准确率。

步骤a4:根据所述筛选参数,生成筛选模型。

本发明实施例中,终端根据所述筛选参数,以及输入序列和输出之间的相关性函数,生成筛选模型。

采用上述技术方案,终端在建立筛选模型的过程中,除了考虑直接转发社交信息的特性之外,还引入间接转发社交信息,保证了最终生成的筛选模型输出结果的全面性;并且,终端不仅以转发社交信息的文本内容为参考因素,还综合考虑转发社交信息之间的转发关系,以及转发社交信息的转发次数,评论情况等参考因素,进一步提高了筛选模型输出结果的准确性。

基于上述已经生成的筛选模型,终端根据每一个转发社交信息的特征向量,即可获取该筛选模型输出的结果;终端将该筛选模型输出的结果作为候选关键社交信息。

步骤130:分别计算每一个候选关键社交信息对应的关键性评估值。

本发明实施例中,终端根据所述候选关键社交信息,构建候选关键社交信息图;针对所述候选关键社交信息图中的任意一候选关键社交信息,根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他所有候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。

例如,参阅图5所示,为本发明实施例中候选关键社交信息图;该候选关键社交信息图中包含所有候选关键社交信息(u1,u2,u3,u4,v),且每一个候选关键社交信息均与除自身之外的其他候选关键社交信息相连接;此外,该候选信息图中包含的每一个候选关键社交信息均对应一个值R0(v),R0(v)为任意一候选关键社交信息v被转发的次数;每两个候选关键社交信息(如ui和v)之间的连线用于表示该两个候选关键社交信息之间存在相关性(其相关性值记为p(ui→v))。

可选的,针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。所述关键性评估值满足如下公式:

其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值,该相关性值初始化为候选关键社交信息ui的特征向量和所述候选关键社交信息v的特征向 量之间的点乘积;

步骤140:从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。

本发明实施例中,终端从上述迭代过程获取的所有候选关键社交信息中,选取关键性评估值最高的预设数目个候选关键社交信息,并将选取的候选关键社交信息作为关键社交信息;其中,预设数目可以根据具体应用场景预先设置得到。

进一步的,当需要将多个相关社交信息转发树进行合并,并获取合并后的所有转发社交信息中的关键社交信息时,终端可以采用步骤100至步骤120,分别获取每一个社交信息转发树对应的候选关键社交信息;采用步骤130,根据所有社交信息转发树对应的候选关键社交信息,生成候选关键社交信息图,以及计算每一个候选关键社交信息的关键性评估值;终端采用步骤140,从所有候选关键社交信息中,选取关键性评估值最高的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。相较于现有技术中,针对多个相关社交信息转发树,仅分别计算每一个社交信息转发树对应的关键社交信息的过程,得到的关键社交信息不具备关联性,采用本发明技术方案,能够结合各个社交信息转发树之间的关联性,得到所有社交信息转发树对应的关键社交信息,获取的社交信息更加可靠。

基于上述技术方案,参阅图6所示,本发明实施例提供一种关键社交信息的确定装置,包括社交信息转发树生成单元60,特征向量获取单元61,候选关键社交信息获取单元62,关键性评估值计算单元63,关键性信息确定单元64,其中:

社交信息转发树生成单元60,用于根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状 结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;

特征向量获取单元61,用于分别根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;

候选关键社交信息获取单元62,用于分别将所述特征向量获取单元61获取的每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;

关键性评估值计算单元63,用于分别计算所述候选关键社交信息获取单元62获取的每一个候选关键社交信息对应的关键性评估值;

关键社交信息确定单元64,用于根据所述关键性评估值计算单元63计算得到的每一个候选关键社交信息对应的关键性评估值,从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。

可选的,所述特征向量获取单元61,用于:针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量进行合并处理,获取所述任意一个转发社交信息的特征向量;所 述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。

进一步的,还包括筛选模型生成单元65,用于:从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。

可选的,筛选模型生成单元65采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数,具体包括:采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。

可选的,所述筛选模型生成单元65建立所述输入序列和所述输出序列之间的相关性函数,具体包括:根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的 每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一特征向量,执行如下操作:采用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。

可选的,所述关键性评估值计算单元63,具体用于:根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。

可选的,所述关键性评估值计算单元63计算得到的关键性评估值满足如下公式:

其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值;

基于上述技术方案,参阅图7所示,本发明实施例提供一种关键社交信息 的确定设备,包括存储器70,以及处理器71,其中:

所述存储器70,用于存储应用程序;

所述处理器71,用于运行所述存储器70中存储的应用程序,执行如下操作:

根据待确定的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和所述根节点和叶子节点之间的中间节点;根据每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;每一个转发社交信息的特征向量中包含表征该转发社交信息的文本特征的向量,以及表征该转发社交信息的与社交信息转发树关联的特征的向量;分别将获取的每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;分别计算获取的每一个候选关键社交信息对应的关键性评估值;从计算得到的所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。

可选的,所述处理器71,用于:针对所述社交信息转发树中的任意一转发社交信息,执行如下操作:从所述任意一转发社交信息的内容中,提取所述任意一转发社交信息的文本特征;采用预设算法,分别将所述任意一转发社交信息的文本特征中包含的各个特征量转换为数值形式的特征量,并根据所有数值形式的特征量,获取所述任意一转发社交信息对应的文本特征向量;根据在所述社交信息转发树中,所述任意一转发社交信息所代表的节点的位置信息,和/或在所述社交信息转发树中,与所述任意一转发社交信息所代表的节点互为兄弟节点的节点数目,获取所述任意一转发社交信息对应的与社交信息转发树关联的特征向量;将所述文本特征向量和所述与社交信息转发树关联的特征向量 进行合并处理,获取所述任意一个转发社交信息的特征向量;所述合并处理为将所述文本特征向量和所述与社交信息转发树关联的特征向量进行上下合并;或者,将所述文本特征向量和所述与社交信息转发树关联的特征向量进行左右合并。

进一步的,所述处理器71,还用于:从历史数据中,获取任意一训练原始社交信息的训练转发社交信息;分别根据每一个训练转发社交信息的信息特征,生成所述每一个训练转发社交信息的特征向量;其中,每一个训练转发社交信息的特征向量中包含表征该训练转发社交信息的文本特征的向量,以及表征该训练转发社交信息的与社交信息转发树关联的特征的向量;采用预设的筛选算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;根据所述筛选参数,生成筛选模型。

进一步的,所述处理器71,用于:采用支持向量机算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,采用感知机神经网络算法,分别根据所述每一个训练转发社交信息的特征向量以及已知的所述每一个训练转发社交信息的筛选分类结果,获取筛选参数;或者,分别根据所述每一个训练转发社交信息的特征向量,以及所述每一个训练转发社交信息之间的转发关系,生成输入序列;并根据所述已知的每一个训练转发社交信息的筛选分类结果,生成输出序列;建立所述输入序列和所述输出序列之间的相关性函数;根据所述已知的每一个训练转发社交信息的筛选分类结果,确定所述相关性函数的参数;将所述参数确定为所述筛选参数。

可选的,所述处理器71,用于:根据所述输入序列中包含的每一个特征向量之间的转发关系,以及所述输入序列中包含的每一个特征向量和输出序列中包含的每一个筛选分类结果之间的关系,建立所述输入序列和所述输出序列之间的链路关系表;针对所述输入序列中的任意一特征向量,执行如下操作:采 用预设宽度的窗口,对所述链路关系表进行扫描;其中,当前扫描的窗口包含所述任意一向量;根据当前扫描的窗口中包含的输出序列中的筛选分类结果和所述任意一特征向量,生成第一局部相关性函数;并根据当前扫描的窗口中包含的输出序列中的筛选分类结果,生成第二局部相关性函数;分别根据所述输入序列中包含的每一个向量对应的第一局部相关性函数和第二局部相关性函数,建立所述输入序列和所述输出序列之间的相关性函数。

可选的,所述处理器71,具体用于:根据所述候选关键社交信息,构建候选关键社交信息图;其中,所述关键社交信息图中包含所有候选关键社交信息,且每两个候选关键社交信息之间互相连接;针对所述候选关键社交信息图中的任意一候选关键社交信息,分别获取所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值;根据所述候选关键社交信息图中所述任意一候选关键社交信息与其他每一个候选关键社交信息之间的相关性值,确定所述任意一候选关键社交信息对应的关键性评估值。

可选的,所述处理器71计算得到的关键性评估值满足如下公式:

其中,Rt(v)为第t次迭代后得到的关键性评估值;λ为预设系数;R0(v)为候选关键社交信息v被转发的次数;n为在所述候选关键社交信息图中,与所述候选关键社交信息v存在关联的候选关键社交信息的数目;Rt-1(v)为第t次迭代后得到的关键性评估值;p(ui→v)为与所述候选关键社交信息v存在关联的候选关键社交信息ui和所述候选关键社交信息v之间的相关性值;

综上所述,根据待测试的原始社交信息以及所述原始社交信息的转发社交信息,生成社交信息转发树;其中,所述转发社交信息为包含直接或间接转发所述原始社交信息的信息;所述社交信息转发树为树状结构,所述原始社交信息为所述树状结构的根节点,所述转发社交信息为所述树状结构的叶子节点和 中间节点;分别根据所述社交信息转发树中每一个转发社交信息的信息特征,获取所述每一个转发社交信息的特征向量;其中,所述信息特征包括文本特征和与所述社交信息转发树关联的特征;分别将所述每一个转发社交信息的特征向量输入预设的筛选模型,获取所有转发社交信息中包含的候选关键社交信息;分别计算每一个候选关键社交信息对应的关键性评估值;从所有候选关键社交信息中,选取关键性评估值从高到低的预设数目个候选关键社交信息,将选取的候选关键社交信息确定为关键社交信息。采用本发明技术方案,综合考虑直接转发社交信息和间接转发社交信息,从原始社交信息的所有转发社交信息中选取关键社交信息,避免了仅从直接转发社交信息中选取关键社交信息时造成的选取结果片面的问题,提高了选取结果的准确率;并且,在关键社交信息的选取过程中,以转发社交信息的内容和与社交信息转发树关联的特征为参考因素,进一步提高了最终选取结果的准确率。

本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中 的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。

显然,本领域的技术人员可以对本发明实施例进行各种改动和变型而不脱离本发明实施例的精神和范围。这样,倘若本发明实施例的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1