一种热门事件搜索方法和装置的制造方法_5

文档序号:9887805阅读:来源:国知局
制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方 框或多个方框中指定的功能。
[0189] 这些计算机程序指令也可装载到计算机或其他可编程数据处理终端设备上,使得 在计算机或其他可编程终端设备上执行一系列操作步骤以产生计算机实现的处理,从而在 计算机或其他可编程终端设备上执行的指令提供用于实现在流程图一个流程或多个流程 和/或方框图一个方框或多个方框中指定的功能的步骤。
[0190]尽管已描述了本发明实施例的优选实施例,但本领域内的技术人员一旦得知了基 本创造性概念,则可对这些实施例做出另外的变更和修改。所以,所附权利要求意欲解释为 包括优选实施例以及落入本发明实施例范围的所有变更和修改。
[0191]最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将 一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作 之间存在任何这种实际的关系或者顺序。而且,术语"包括"、"包含"或者其任何其他变体意 在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者终端设备不仅包 括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品 或者终端设备所固有的要素。在没有更多限制的情况下,由语句"包括一个……"限定的要 素,并不排除在包括所述要素的过程、方法、物品或者终端设备中还存在另外的相同要素。 [0192]以上对本发明所提供的一种热门事件搜索方法和装置,进行了详细介绍,本文中 应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助 理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,根据本发明的思想, 在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本 发明的限制。
【主权项】
1. 一种热口事件捜索方法,其特征在于,所述方法包括: 确定距当前时间预设时间段内捜索量大于第一预设阔值的查询词; 确定所述查询词的捜索趋势指数; 将捜索趋势指数大于第二预设阔值的查询词确定为实时热词; 将所确定的实时热词存储于热词数据库; 在接收到用户发送的捜索语时,基于所述热词数据库对捜索结果进行排序; 将排序后的捜索结果发送给用户。2. 根据权利要求1所述的方法,其特征在于,所述确定所述查询词的捜索趋势指数为 tr : tr= 2w 江 atioi, 其中,所述ratioi是距当前时间预设时间段捜索量和不同维度下捜索量的比率;Wi为不 同维度的权重值;所述不同维度包括W下维度至少其中之一:距当前时间预设时间段之前 的一预设时间段维度、距当前时间预设时间段之前的两个预设时间段维度、距前一天与当 前时间同一时间点预设时间段维度、前一周同一天距与当前时间同一时间点预设时间段维 度。3. 根据权利要求2所述的方法,其特征在于,所述不同维度的权重值中,所述前一周同 一天距与当前时间同一时间点预设时间段维度的权重值为最大的权重值。4. 根据权利要求1至3其中任一项所述的方法,其特征在于,所述方法还包括:通过W下 方式对热词数据库中的实时热词进行更新: 实时热词初次进入热词数据库时,确定24小时内捜索次数最大的实时热词在一个小时 内的捜索趋势指数;当所确定的捜索趋势指数小于第S预设阔值ttr_lower时,确定所述热 词实时所描述的不是突发热口事件,将所述实时热词从热词数据库中移除。5. 根据权利要求4所述的方法,其特征在于,所述方法还包括:通过W下方式对热词数 据库中的实时热词进行更新: 实时热词初次进入热词数据库的24小时内取捜索量最大的一个小时的捜索量 f irstday和捜索趋势指数troid; 实时热词进入热词数据库之后,每天同一小时按如下方式确定所述实时词的捜索趋势 指数tiw:其中impnew是更新时刻的捜索量,impoid是进入热词数据库时的捜索量,decay是衰减系 数; 当所确定的化new小于第S预设阔值ttr_lower时,将所述实时热词从热词数据库中移 除。6. 根据权利要求1所述的方法,其特征在于,所述基于所述热词数据库对捜索结果进行 排序,包括: 对所述捜索语进行分词,得到查询词; 将所述查询词与当前热词数据库中的实时热词进行匹配; 当所述查询词与当前热词数据库中的实时热词匹配成功时,增加捜索结果在时间维度 的权重后,对捜索结果进行排序。7. -种热口事件捜索装置,其特征在于,所述装置包括:确定模块、存储模块、接收模 块、排序模块及发送模块;其中, 所述确定模块,用于确定距当前时间预设时间段内捜索量大于第一预设阔值的查询 词;还用于确定所述查询词的捜索趋势指数;还用于将所确定的捜索趋势指数大于第二预 设阔值的查询词确定为实时热词; 所述存储模块,用于将所确定的实时热词存储于热词数据库; 所述接收模块,用于接收用户发送的捜索语; 所述排序模块,用于基于所述热词数据库对捜索结果进行排序; 所述发送模块,用于将排序后的捜索结果发送给用户。8. 根据权利要求7所述的装置,其特征在于,所述确定模块通过W下方式确定所述查询 词捜索趋势指数tr: tr= Swiratioi, 其中,所述ratioi是距当前时间预设时间段捜索量和不同维度下捜索量的比率;Wi为不 同维度的权重值;所述不同维度包括W下维度至少其中之一:距当前时间预设时间段之前 的一预设时间段维度、距当前时间预设时间段之前的两个预设时间段维度、距前一天与当 前时间同一时间点预设时间段维度、前一周同一天距与当前时间同一时间点预设时间段维 度。9. 根据权利要求8所述的装置,其特征在于,所述不同维度的权重值中,所述前一周同 一天距与当前时间同一时间点预设时间段维度的权重值为最大的权重值。10. 根据权利要求7至9其中任一项所述的装置,其特征在于,所述装置还包括:更新模 块,用于对热词数据库中的实时热词进行更新; 所述更新模块,包括:确定子模块、判断子模块和移除子模块;其中, 所述确定子模块,用于在实时热词初次进入热词数据库时,确定24小时内捜索次数最 大的实时热词在一个小时内的捜索趋势指数; 所述判断子模块,用于判断所确定的捜索趋势指数是否小于第S预设阔值ttr_lower; 所述确定子模块,用于当判断子模块的判断结果为是时,确定所述热词实时所描述的 不是突发热口事件; 所述移除子模块,用于将所述实时热词从热词数据库中移除。11. 根据权利要求10所述的装置,其特征在于,所述确定子模块,还用于在实时热词初 次进入热词数据库的24小时内确定捜索量最大的一个小时的捜索量firstday和捜索趋势 指数化Did;还用于在实时热词进入热词数据库之后,每天同一小时按如下方式确定所述实 时热词的捜索趋势指数trnew :其中impnew是更新时刻的捜索量,impoid是进入热词数据库时的捜索量,decay是衰减系 数; 所述判断子模块,用于判断所确定的trnew是否小于第S预设阔值ttr_lower; 所述移除子模块,用于当所确定的trnew小于第S预设阔值ttr_lower时,将所述实时热 词从热词数据库中移除。12.根据权利要求7所述的装置,其特征在于,所述排序模块包括:分词子模块、匹配子 模块和排序子模块;其中, 所述分词子模块,用于对所述捜索语进行分词,得到查询词; 所述匹配子模块,用于将所述查询词与当前热词数据库中的实时热词进行匹配; 所述排序子模块,用于在所述查询词与当前热词数据库中的实时热词匹配成功时,增 加捜索结果在时间维度的权重后,对捜索结果进行排序。
【专利摘要】本发明实施例提供了一种热门事件搜索方法和装置,其中的方法包括:确定距当前时间预设时间段内搜索量大于第一预设阈值的查询词;确定所述查询词的搜索趋势指数;将搜索趋势指数大于第二预设阈值的查询词确定为实时热词;将所确定的实时热词存储于热词数据库;在接收到用户发送的搜索语时,基于所述热词数据库对搜索结果进行排序;将排序后的搜索结果发送给用户。本发明实施例基于热词数据库来对搜索结果进行排序,这种排序方式能够在用户所发送的搜索语为针对热门事件的搜索语时,对搜索结果的排序进行控制,使得搜索结果中与热门事件相关的结果排序位置提前,从而避免了现有技术中搜索引擎对热门事件搜索反馈迟滞的问题。
【IPC分类】G06F17/30
【公开号】CN105653705
【申请号】
【发明人】王天畅, 陈英傑, 胡军
【申请人】北京奇艺世纪科技有限公司
【公开日】2016年6月8日
【申请日】2015年12月30日
当前第5页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1