一种热门事件搜索方法和装置的制造方法_4

文档序号:9887805阅读:来源:国知局
索结果中最近更新的多媒体文件的排列顺序提前,这样,用户可以更快的查找到自 己想要查找的热门事件对应的多媒体文件。
[0145] 具体的,以视频搜索为例,对如何增加搜索结果在时间维度的权重的方法进行介 绍。
[0146] 相应搜索结果在时间维度上的最终得分final_score通过下式确定:
[0147] f inal_score =matcha X quality15 X fresh0 ;
[0148] 其中match代表匹配度,quality代表视频质量得分,fresh代表时间维度得分,a、 13、(3是常量,分别为11^七〇11、9皿1;^7及;^6811的权重值;
[0149] 其中,时间维度得分fresh的权重值通过下式确定,
[0150] 将搜索结果所对应的查询词的搜索趋势指数tr归一化到区间[1,2]范围内,得到 norm_tr,通过以下公式提高权重c的值:
[0151] c=cXnorm_tr〇
[0152] 步骤208、将排序后的搜索结果发送给用户。
[0153] 这里所说的将排序后的搜索结果发送给用户,是指以任何可能的展现形式将排序 后的搜索结果呈现在用户的搜索界面上供用户选择自身需要的搜索结果。
[0154] 在接收到用户发送的搜索语之后,可以基于热词数据库对搜索结果进行排序,这 种排序是为了分辨用户所搜索的是否为针对热门事件的多媒体内容,如果是,则可以基于 所述热词数据库对搜索结果的排序过程进行控制,从而将关于热门事件,尤其是突发热门 事件的搜索结果的排序提到最前面,并将排序后的搜索结果发送给用户。
[0155] 可见,利用本发明实施例二提供的热门事件搜索方法,能够经由一种科学的方案 确定实时热词,并基于此行成热词数据库,当接收到用户的搜索语之后,对所述搜索语进行 分词,得到查询词,将所述查询词与当前热词数据库中的实时热词进行匹配,从而快速确定 用户的搜索意图,即用户所搜索的是否为热门事件,尤其是突发热门事件所对应的多媒体 文件,如果是,则增加搜索结果在时间维度的权重后,对搜索结果进行排序,将热门事件所 对应的多媒体文件的排列顺序提前,从而提高用户的搜索体验。
[0156] 装置实施例
[0157] 参照图5,示出了本发明一种热门事件搜索装置实施例的结构框图,所述装置位于 移动终端之上,所述装置包括:确定模块51、存储模块52、接收模块53、排序模块54及发送模 块55;其中,
[0158] 所述确定模块51,用于确定距当前时间预设时间段内搜索量大于第一预设阈值的 查询词;还用于确定所述查询词的搜索趋势指数;还用于将所确定的搜索趋势指数大于第 二预设阈值的查询词确定为实时热词;
[0159] 所述存储模块52,用于将所确定的实时热词存储于热词数据库;
[0160] 所述接收模块53,用于接收用户发送的搜索语;
[0161 ]所述排序模块54,用于基于所述热词数据库对搜索结果进行排序;
[0162] 所述发送模块55,用于将排序后的搜索结果发送给用户。
[0163] 上述方案中,所述确定模块51通过以下方式确定所述查询词搜索趋势指数tr:
[0164] tr= Σ Wiratioi,
[0165] 其中,所述rati〇1是距当前时间预设时间段搜索量和不同维度下搜索量的比率;Wl 为不同维度的权重值;所述不同维度包括以下维度至少其中之一:距当前时间预设时间段 之前的一预设时间段维度、距当前时间预设时间段之前的两个预设时间段维度、距前一天 与当前时间同一时间点预设时间段维度、前一周同一天距与当前时间同一时间点预设时间 段维度。
[0166] 具体的,预设时间段的时长可以根据需要进行设置,例如可以设置成一小时、两小 时、三小时,也可以设置成三十分钟、四十五分钟等等;优选地,可以设置为一小时。
[0167] 上述方案中,所述不同维度的权重值中,所述前一周同一天距与当前时间同一时 间点预设时间段维度的权重值为最大的权重值。
[0168] 上述方案中,所述装置还包括:更新模块56,用于对热词数据库中的实时热词进行 更新;
[0169] 所述更新模块56,包括:确定子模块、判断子模块和移除子模块;其中,
[0170] 所述确定子模块,用于在实时热词初次进入热词数据库时,确定24小时内搜索次 数最大的实时热词在一个小时内的搜索趋势指数;
[0171] 所述判断子模块,用于判断所确定的搜索趋势指数是否小于第三预设阈值ttr_ lower;
[0172] 所述确定子模块,用于当判断子模块的判断结果为是时,确定所述热词实时所描 述的不是突发热门事件;
[0173] 所述移除子模块,用于将所述实时热词从热词数据库中移除。
[0174] 在本发明的另一种可选实施例中,所述确定子模块,还用于在实时热词初次进入 热词数据库的24小时内确定搜索量最大的一个小时的搜索量firstday和搜索趋势指数 tread;还用于在实时热词进入热词数据库之后,每天同一小时按如下方式确定所述实时热 词的搜索趋势指数trnew:
[0175]
,
[0?76]其中impnew是更新时刻的搜索量,impoid是进入热词数据库时的搜索量,decay是衰 减系数;
[0177]所述判断子模块,用于判断所确定的trnew是否小于第三预设阈值ttr_lower;
[0178] 所述移除子模块,用于当所确定的trnew小于第三预设阈值ttr_l〇Wer时,将所述实 时热词从热词数据库中移除。
[0179] 本发明的另一种可选实施例中,所述排序模块包括:分词子模块、匹配子模块和排 序子模块;其中,
[0180] 所述分词子模块,用于对所述搜索语进行分词,得到查询词;
[0181] 所述匹配子模块,用于将所述查询词与当前热词数据库中的实时热词进行匹配;
[0182] 所述排序子模块,用于在所述查询词与当前热词数据库中的实时热词匹配成功 时,增加搜索结果在时间维度的权重后,对搜索结果进行排序。
[0183] 在具体实施过程中,上述确定模块51、存储模块52、接收模块53、排序模块54、发送 模块55、更新模块56、确定子模块、判断子模块、移除子模块、分词子模块、匹配子模块和排 序子模块可以由网络侧服务器或终端侧终端设备内的中央处理器(CPU,Central Processing Unit)、微处理器(MF^Micro Processing Unit)、数字信号处理器(DSP, Digital Signal Processor)或可编程逻辑阵列(FPGA,Field - Programmable Gate Array)来实现。
[0184] 对于装置实施例而言,由于其与方法实施例基本相似,所以描述的比较简单,相关 之处参见方法实施例的部分说明即可。
[0185] 本说明书中的各个实施例均采用递进的方式描述,每个实施例重点说明的都是与 其他实施例的不同之处,各个实施例之间相同相似的部分互相参见即可。
[0186] 本领域内的技术人员应明白,本发明实施例的实施例可提供为方法、装置、或计算 机程序产品。因此,本发明实施例可采用完全硬件实施例、完全软件实施例、或结合软件和 硬件方面的实施例的形式。而且,本发明实施例可采用在一个或多个其中包含有计算机可 用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上 实施的计算机程序产品的形式。
[0187] 本发明实施例是参照根据本发明实施例的方法、终端设备(系统)、和计算机程序 产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图 中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些 计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理终端设 备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理终端设备的处理器执 行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中 指定的功能的装置。
[0188] 这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理终端设备 以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包 括指令装置的
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1