一种并发查询条件下的动态查询系统及方法_3

文档序号:9887747阅读:来源:国知局
响应器在对查询请求进行响应时,是先利用缓冲器中保存的倒排表对查询请求进行第一次检索响应的,在第一次检索响应无法得到相应的检索文档的情况下,才会利用索引文件磁盘中保存的倒排表来进行第二次检索响应。一方面,由于缓冲器的数据存取速度要远高于磁盘的数据存取速度;另一方面,由于缓冲器中保存的倒排表是从索引文件磁盘中筛选的与用户历史查询痕迹信息相对应的倒排表,所以,当前接收到的用户查询请求所对应的查询词在缓冲器所保存的倒排表中出现的几率相当高,也即,查询响应器利用缓冲器进行第一次检索响应的过程中,具有非常高的检索命中率,从而有利于查询速度的提升;再一方面,由于缓冲器中保存的只是用户平时常用到的索引信息,其存储的信息量远小于磁盘中的索引信息量,由此也有助于减少查询响应时间。
[0067]综上所述,本发明实施例实现了进一步减少查询响应时间的目的,从而改善了用户的查询体验。
[0068]最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
[0069]以上对本发明所提供的一种并发查询条件下的动态查询系统及方法进行了详细介绍,本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在【具体实施方式】及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本发明的限制。
【主权项】
1.一种并发查询条件下的动态查询系统,其特征在于,包括索引文件磁盘、缓冲器、索引文件调取器、请求分发器以及N个查询响应器,N为正整数;其中, 所述索引文件调取器,用于根据用户历史查询痕迹信息,从所述索引文件磁盘中取出与所述用户历史查询痕迹信息相对应的倒排表,并将取出的倒排表缓存至所述缓冲器内部的缓冲区; 所述请求分发器,用于获取用户终端发送的并发查询请求,并基于分布式的请求分发原则,将所述并发查询请求中的所有查询请求分发至所述N个查询响应器; 任一查询响应器,用于利用所述缓冲器中存储的倒排表,对接收到的查询请求进行第一次检索响应,若所述第一次检索响应后得到相应的检索文档集合,则将该检索文档集合返回至相应的用户终端,若所述第一次检索响应后未得到相应的检索文档集合,则利用所述索引文件磁盘中存储的倒排表,对接收到的查询请求进行第二次检索响应,并将所述第二次检索响应后得到的检索文档集合返回至相应的用户终端。2.根据权利要求1所述的并发查询条件下的动态查询系统,其特征在于,还包括: 倒排表生成器,用于为待索引化文档建立索引,生成相应的倒排表,并将生成的倒排表保存至所述索引文件磁盘。3.根据权利要求1所述的并发查询条件下的动态查询系统,其特征在于,所述缓冲器包括用于存储倒排表的第一缓冲区和第二缓冲区,还包括: 缓冲控制单元,用于当所述第一缓冲区和所述第二缓冲区中的任一缓冲区存满后,从该缓冲区存储的所有倒排表中筛选出满足预设调回条件的倒排表,并将筛选到的倒排表调回至所述索引文件磁盘。4.根据权利要求1所述的并发查询条件下的动态查询系统,其特征在于,任一查询响应器均包括: 查询词提取单元,用于从所述请求分发器分发的查询请求所对应的查询语句中提取出相应的查询词; 第一检索单元,用于根据所述查询词,对所述缓冲区进行检索,若在所述缓冲区中检索到与所述查询词相对应的倒排表,则根据检索到的倒排表调取相应的文档集合,并将该文档集合返回至相应的用户终端; 第二检索单元,用于当所述第一检索单元在所述缓冲区中未检索到与所述查询词相对应的倒排表,则对所述索引文件磁盘进行检索,根据检索到的倒排表调取相应的文档集合,并将该文档集合返回至相应的用户终端。5.根据权利要求4所述的并发查询条件下的动态查询系统,其特征在于,任一查询响应器还均包括: 文档排序单元,用于在所述第一检索单元或所述第二检索单元将相应的文档集合返回至用户终端之前,计算该文档集合中每个文档与所述查询语句之间的关联度,并按照关联度的大小顺序,对该文档集合进行重新排序处理。6.根据权利要求1至5任一项所述的并发查询条件下的动态查询系统,其特征在于,还包括: 文件压缩模块,用于在所述索引文件磁盘对接收到的倒排表进行存储之前,对该倒排表进行压缩处理,将压缩处理后得到的数据保存至所述索弓I文件磁盘。7.根据权利要求6所述的并发查询条件下的动态查询系统,其特征在于,所述文件压缩模块,具体用于在所述索引文件磁盘对接收到的倒排表进行存储之前,将该倒排表中的每个数据项存储至存储空间与该数据项大小相一致的文件块,并利用PForDelta压缩算法对与该倒排表对应的所有文件块进行压缩处理,将压缩处理后得到的数据保存至所述索引文件磁盘。8.一种并发查询条件下的动态查询方法,其特征在于,包括: 根据用户历史查询痕迹信息,从索引文件磁盘中取出与所述用户历史查询痕迹信息相对应的倒排表,并将取出的倒排表缓存至缓冲器内部的缓冲区; 获取用户终端发送的并发查询请求,并基于分布式的请求分发原则,将所述并发查询请求中的所有查询请求分发至N个查询响应器,以通过所述N个查询响应器,对所述并发查询请求进行检索响应;其中,N为正整数; 其中,任一查询响应器进行检索响应的过程包括:利用所述缓冲器中存储的倒排表,对接收到的查询请求进行第一次检索响应,若所述第一次检索响应后得到相应的检索文档集合,则将该检索文档集合返回至相应的用户终端,若所述第一次检索响应后未得到相应的检索文档集合,则利用所述索引文件磁盘中存储的倒排表,对接收到的查询请求进行第二次检索响应,并将所述第二次检索响应后得到的检索文档集合返回至相应的用户终端。9.根据权利要求8所述的并发查询条件下的动态查询方法,其特征在于,还包括: 在所述索引文件磁盘对接收到的倒排表进行存储之前,对该倒排表进行压缩处理,将压缩处理后得到的数据保存至所述索引文件磁盘。10.根据权利要求9所述的并发查询条件下的动态查询方法,其特征在于,所述在所述索引文件磁盘对接收到的倒排表进行存储之前,对该倒排表进行压缩处理,将压缩处理后得到的数据保存至所述索引文件磁盘的过程,具体包括: 在所述索引文件磁盘对接收到的倒排表进行存储之前,将该倒排表中的每个数据项存储至存储空间与该数据项大小相一致的文件块,并利用PForDelta压缩算法对与该倒排表对应的所有文件块进行压缩处理,将压缩处理后得到的数据保存至所述索引文件磁盘。
【专利摘要】本申请公开了一种并发查询条件下的动态查询系统及方法,该系统包括:包括索引文件磁盘、缓冲器、索引文件调取器、请求分发器以及N个查询响应器;其中,任一查询响应器,用于利用缓冲器中存储的倒排表,对接收到的查询请求进行第一次检索响应,若第一次检索响应后得到相应的检索文档集合,则将该检索文档集合返回至相应的用户终端,若第一次检索响应后未得到相应的检索文档集合,则利用索引文件磁盘中存储的倒排表,对接收到的查询请求进行第二次检索响应,并将第二次检索响应后得到的检索文档集合返回至相应的用户终端。本申请实现了进一步减少查询响应时间的目的,从而改善了用户的查询体验。
【IPC分类】G06F17/30
【公开号】CN105653646
【申请号】
【发明人】周志强
【申请人】北京中电普华信息技术有限公司, 国网信息通信产业集团有限公司, 国家电网公司
【公开日】2016年6月8日
【申请日】2015年12月28日
当前第3页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1