一种关键词信息检索的方法及装置与流程

文档序号:11134092阅读:616来源:国知局
一种关键词信息检索的方法及装置与制造工艺

本发明涉及计算机信息技术领域,特别涉及一种关键词信息检索的方法及装置。



背景技术:

互联网在最近十多年经历了一个飞速发展的时期,互联网的开放性使其成为人们获取信息的重要渠道,人们越来越多的利用网络信息资源来满足自己对信息的需求。如何从这样一个庞大的信息资源库中获取需要的准确信息,已成为人们面临的一个重要问题。网络信息检索,可以减少用户获取信息的时间成本,使用户获得适合自己的有用信息,提高信息的利用率。然而,与网络信息检索相对应的数据库检索技术,在关键词信息检索时只是进行数据库的全局匹配,检索时间比较长,影响用户体验。



技术实现要素:

本发明实施例的目的在于提供一种关键词信息检索的方法及装置,能够快速地检索出实时有效的关键词信息,节省检索时间,提高用户体验。具体技术方案如下:

本发明实施例公开了一种关键词信息检索的方法,包括:

根据待检索关键词查询系统数据库的索引文件,得到所述待检索关键词与所述系统数据库的索引关系,所述系统数据库的索引文件是将从互联网上抓取的关键词与系统数据库进行匹配获取的;

根据所述索引关系查询所述系统数据库,得到所述待检索关键词的检索结果。

较佳的,在所述根据待检索关键词查询系统数据库的索引文件,之前,所述关键词信息检索的方法还包括:

从互联网上抓取关键词;

将从互联网上抓取的关键词与所述系统数据库进行匹配,得到所述索引文件。

较佳的,所述从互联网上抓取关键词,包括:

周期性从互联网上抓取关键词;

所述将从互联网上抓取的关键词与所述系统数据库进行匹配,得到所述索引文件,包括:

将周期性从互联网上抓取的关键词与所述系统数据库进行匹配,更新所述索引文件。

较佳的,所述从互联网上抓取关键词,包括:

从互联网上抓取搜索频率高于预设阈值的关键词。

较佳的,在所述根据所述索引关系查询所述系统数据库,得到所述待检索关键词的检索结果,之后,所述关键词信息检索的方法还包括:

显示所述检索结果。

本发明实施例还公开了一种关键词信息检索的装置,包括:

索引关系建立模块,用于根据待检索关键词查询系统数据库的索引文件,得到所述待检索关键词与所述系统数据库的索引关系,所述系统数据库的索引文件是将从互联网上抓取的关键词与系统数据库进行匹配获取的;

检索信息生成模块,用于根据所述索引关系查询所述系统数据库,得到所述待检索关键词的检索结果。

较佳的,所述关键词信息检索的装置,还包括:

关键词抓取模块,用于从互联网上抓取关键词;

索引文件生成模块,用于将从互联网上抓取的关键词与所述系统数据库进行匹配,得到所述索引文件。

较佳的,所述关键词抓取模块,具体用于周期性从互联网上抓取关键词;

所述索引文件生成模块,还用于将周期性从互联网上抓取的关键词与所述系统数据库进行匹配,更新所述索引文件。

较佳的,所述关键词抓取模块,具体用于从互联网上抓取搜索频率高于预设阈值的关键词。

较佳的,所述关键词信息检索的装置,还包括:

检索结果显示模块,用于显示所述检索结果。

本发明实施例提供的关键词信息检索的方法及装置,通过根据待检索关键词查询系统数据库的索引文件,得到待检索关键词与系统数据库的索引关系,并根据索引关系查询系统数据库,得到待检索关键词的检索结果。应用本发明实施例可以快速得到用户需要的关键词信息,减少了关键词信息检索的时间,提高了用户对信息的利用率。当然,实施本发明的任一产品或方法必不一定需要同时达到以上所述的所有优点。

附图说明

为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。

图1为本发明实施例的关键词信息检索的方法的一种流程图;

图2为本发明实施例的关键词信息检索的方法的另一种流程图;

图3为本发明实施例的关键词信息检索的装置的一种结构图;

图4为本发明实施例的关键词信息检索的装置的另一种结构图。

具体实施方式

下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。

本发明实施例公开了一种关键词信息检索的方法及装置,能够快速地检索出实时有效的关键词信息,节省检索时间,提高用户体验。

下面首先对本发明实施例提供的一种关键词信息检索的方法进行介绍。

关键词信息检索是指,根据待检索的关键词查找与关键词相关的信息或资料的过程。需要说明的是,本发明实施例中的关键词信息检索,不同于百度、谷歌等搜索引擎的关键词信息检索,而是对某一网站进行关键词信息检索,进一步对该网站服务器的系统数据库中的数据进行关键词信息检索。现有的关键词信息检索技术是全局的查询系统数据库,导致关键词信息检索的过程花费较多的时间,影响用户体验。当然,本发明实施例中的关键词信息检索,可以是某一网站的关键词信息检索,也可以是针对数据库等检索系统的检索,这都是合理的。

参见图1,图1为本发明实施例的关键词信息检索的方法的一种流程图,包括如下步骤:

步骤101,根据待检索关键词查询系统数据库的索引文件,得到待检索关键词与系统数据库的索引关系,系统数据库的索引文件是将从互联网上抓取的关键词与系统数据库进行匹配获取的。

以某网站为例进行说明,在进行关键词信息检索时,用户根据该用户的关注信息输入关键词,该关键词即是待检索关键词。在获取到待检索关键词之后,根据待检索关键词查询某网站服务器的系统数据库的索引文件,得到待检索关键词与系统数据库的索引关系。索引文件存储于某网站服务器的系统数据库中,其中,索引文件中的关键词是从互联网上抓取的,索引文件是根据互联网上的关键词建立的关键词与系统数据库的索引关系文件。

步骤102,根据索引关系查询系统数据库,得到待检索关键词的检索结果。

具体的,索引关系指关键词与系统数据库的对应关系,根据索引关系可以快速访问系统数据库中特定位置的信息。在关键词信息检索时,用户输入待检索关键词,根据预先建立的关键词与系统数据库的索引关系,快速访问系统数据库中与该检索关键词对应的特定位置的信息,而不是进行全局的系统数据库的匹配,节省了检索时间。

可见,本发明实施例提供的关键词信息检索的方法,通过根据待检索关键词查询系统数据库的索引文件,得到待检索关键词与系统数据库的索引关系,并根据索引关系查询系统数据库,得到待检索关键词的检索结果。应用本发明实施例可以快速得到用户需要的关键词信息,减少了关键词信息检索的时间,提高了用户对信息的利用率。

参见图2,图2为本发明实施例的关键词信息检索的方法的另一种流程图,包括如下步骤:

步骤201,从互联网上抓取关键词。

具体的,运行脚本文件,得到从互联网上抓取的关键词,其中,脚本文件可以以超级文本预处理语言为基础,当然,也可以以其他语言为基础。在实际应用中,服务器周期性地运行脚本文件,从而获取周期性更新的互联网关键词信息。互联网上的关键词信息是随着时间的变化而不断变化的,周期性运行脚本文件可以及时更新从互联网上抓取的关键词信息,从而及时更新关键词与系统数据库的索引关系。运行脚本文件的周期越短,从互联网上抓取的关键词信息越具有实时性,越能体现当前的热门内容。

步骤202,将从互联网上抓取的关键词与系统数据库进行匹配,得到索引文件。

本步骤中,需要预先建立关键词与系统数据库的索引关系,而从互联网上抓取的关键词是实时变化的,因此关键词与系统数据库的索引关系也是实时变化的。根据步骤201中服务器周期性地运行脚本文件,将周期性从互联网上抓取的关键词与系统数据库进行匹配,生成实时更新的索引文件。具体的,根据互联网关键词信息排名对系统数据库中原有、新增以及过期的数据重新进行关键词匹配,以保证系统数据库的数据能根据最新关键词准确定位,生成更新的索引文件。

步骤203,根据索引关系查询系统数据库,得到待检索关键词的检索结果。

具体的,索引关系指关键词与系统数据库的对应关系,根据索引关系可以快速访问系统数据库中特定位置的信息。在关键词信息检索时,用户输入待检索关键词,根据预先建立的关键词与系统数据库的索引关系,快速访问系统数据库中与该检索关键词对应的特定位置的信息,而不是进行全局的系统数据库的匹配,节省了检索时间。

步骤204,显示检索结果。

其中,关键词的检索结果是以网页的方式展示给用户的,以网页的方式可以给用户提供可视化的人机交互接口,方便用户查看关键词信息检索结果。实际应用中,步骤204是可选的。例如,当关键词信息检索仅仅用于内部系统数据库检索时,不需要显示检索结果给用户。当用户通过关键词信息检索查询信息时,需要将检索结果显示给用户。

可见,本发明实施例提供的关键词信息检索的方法,通过从互联网上抓取关键词信息,并将关键词信息与系统数据库进行匹配,得到索引文件,根据待检索关键词查询索引文件,得到待检索关键词与系统数据库的索引关系,根据索引关系查询系统数据库,得到待检索关键词的检索结果并显示检索结果。应用本发明实施例可以根据当前互联网热门内容,快速得到用户需要的关键词信息,减少了关键词信息检索的时间,提高了用户对信息的利用率。

可选地,本发明实施例的关键词信息检索的方法中,从互联网上抓取关键词,包括:

从互联网上抓取搜索频率高于预设阈值的关键词。

需要说明的是,从互联网上抓取的关键词是根据各大排名网站的热搜关键词信息提取的,从而建立热搜关键词与系统数据库的索引关系。本发明实施例是根据用户的当前关注信息查询系统数据库的,与当前热点内容相契合。

本发明实施例中,从互联网上抓取的关键词是用户关注度比较高的热点内容,可以是百度、谷歌等搜索引擎或其他网站的热搜排行榜中的关键词,也可以是当前热点新闻、热点话题等等。通过对热点内容的搜索频率设定阈值,过滤搜索频率高于预设阈值的关键词,可以得到关注度最高的热点内容。其中,高于预设阈值的关键词至少可以是该热搜排行榜中关键词的前5个、10个或20个甚至更多个;高于预设阈值的关键词也可以是当前某一时间段内搜索频率高于5万、8万或10万等的关键词。

参见图3,图3为本发明实施例的关键词信息检索的装置的一种结构图,包括:

索引关系建立模块301,用于根据待检索关键词查询系统数据库的索引文件,得到待检索关键词与系统数据库的索引关系,系统数据库的索引文件是将从互联网上抓取的关键词与系统数据库进行匹配获取的。

检索信息生成模块302,用于根据索引关系查询系统数据库,得到待检索关键词的检索结果。

可见,本发明实施例提供的关键词信息检索的装置,通过根据待检索关键词查询系统数据库的索引文件,得到待检索关键词与系统数据库的索引关系,并根据索引关系查询系统数据库,得到待检索关键词的检索结果。应用本发明实施例可以快速得到用户需要的关键词信息,减少了关键词信息检索的时间,提高了用户对信息的利用率。

需要说明的是,本发明实施例的装置是应用上述关键词信息检索的方法的装置,则上述关键词信息检索的方法的所有实施例均适用于该装置,且均能达到相同或相似的有益效果。

参见图4,图4为本发明实施例的关键词信息检索的装置的另一种结构图,包括:

关键词抓取模块401,用于从互联网上抓取关键词。

索引文件生成模块402,用于将从互联网上抓取的关键词与系统数据库进行匹配,得到索引文件。

索引关系建立模块403,用于根据待检索关键词查询系统数据库的索引文件,得到待检索关键词与系统数据库的索引关系,系统数据库的索引文件是将从互联网上抓取的关键词与系统数据库进行匹配获取的。

检索信息生成模块404,用于根据索引关系查询系统数据库,得到待检索关键词的检索结果。

检索结果显示模块405,用于显示检索结果。

其中,检索结果显示模块,可以为显示器等具有显示功能的器件或组件,例如个人计算机,具有显示功能的手机等。

可见,本发明实施例提供的关键词信息检索的装置,通过从互联网上抓取关键词信息,并将关键词信息与系统数据库进行匹配,得到索引文件,根据待检索关键词查询索引文件,得到待检索关键词与系统数据库的索引关系,根据索引关系查询系统数据库,得到待检索关键词的检索结果并显示检索结果。应用本发明实施例可以根据当前互联网热门内容,快速得到用户需要的关键词信息,减少了关键词信息检索的时间,提高了用户对信息的利用率。

可选地,本发明实施例的关键词信息检索的装置中,关键词抓取模块,具体用于周期性从互联网上抓取关键词;

索引文件生成模块,还用于将周期性从互联网上抓取的关键词与系统数据库进行匹配,更新索引文件。

可选地,本发明实施例的关键词信息检索的装置中,关键词抓取模块,具体用于从互联网上抓取搜索频率高于预设阈值的关键词。

可见,应用本发明实施例提供的关键词信息检索的装置,根据当前互联网热门内容,快速得到用户需要的关键词信息,减少了关键词信息检索的时间,提高了用户对信息的利用率。

需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。

本说明书中的各个实施例均采用相关的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。

以上所述仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。凡在本发明的精神和原则之内所作的任何修改、等同替换、改进等,均包含在本发明的保护范围内。

当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1