一种检索结果三段式有序收集方法及系统的利记博彩app

文档序号:6585364阅读:234来源:国知局
专利名称:一种检索结果三段式有序收集方法及系统的利记博彩app
技术领域
本发明属于检索技术领域,具体涉及一种检索结果三段式有序收集方法及系统, 特别适合于对全文检索结果的有序收集。
背景技术
全文检索系统在根据检索请求进行检索后,还需要将检索结果进行排序,然后返 回用户指定范围内的有序结果。排序依据通常是检索结果与检索请求的相关度,也可以是 其他依据,例如检索结果的重要程度、检索结果某个字段值的顺序等。对检索结果进行排序 的目的,使得最能满足用户需要的结果出现在结果序列的最前面。全文检索系统前台一般对检索结果分页展示,一次只展示部分结果,通过翻页来 不断展示后续结果。在翻页时,或通过再次检索、或通过读取上次检索时生成的缓存来获取 本次展示的内容。因此全文检索系统返回的检索结果一般为一页或多页的数据量,随着翻 页的进行,获取的检索结果范围不断移动。全文检索系统的检索结果的后续处理带了性能问题随着全文检索系统处理的数 据量的增加,在命中大量结果的情况下,检索结果的存储和排序会占用大量的存储空间和 处理时间,导致检索性能不佳,无法快速高并发地处理检索结果。目前,网络上的搜索引擎采用的解决方法是只支持返回前若干项最相关的结果, 超过限定数量的都不返回,从而回避了这个问题。如百度、谷歌都只提供不到800条检索结 果的浏览,翻页超过这个数量后只给出提示,不再继续展示后续检索结果。但在企业级全文 检索系统的应用中,要求能够返回检索命中的全部结果,当用户不断翻页时,能够浏览到全 部的检索结果。用户在浏览检索结果时,一般都只浏览前几页,但有时也会不断翻页,或查看最后 几页。因此需要根据用户的需求,返回部分检索结果。这些检索结果可能是排序最靠前的, 也可能是最靠后的,或位于中间的结果。现有技术中,为了减少检索结果存储和排序的压力,针对用户只浏览前几页的情 况,使用Top-K方法。所述Top-K方法是指只收集前K项最好的检索结果,抛弃其余结果。 全文检索系统预设一个需要收集的数量K,从这前K项结果中返回用户要求的部分。如 Ahmed Metwally等在“EfficientComputation of Frequent and Top-k Elements in Data Streams" (In Proceedingsof the IOth ICDT International Conference on Database Theory. 398-412.)中所述收集前若干项结果并排序,当新的结果被添加到集合中时替换 最小的项,并最终从集合中返回Top-K项值。通过这种方式节约了处理大量结果时所需要 的内存空间,从而提高效率。但没有提出用户请求的检索结果超出前K项时的应对方法。因 此,该方法只适用于只需要返回部分最好检索结果的情况。当用户请求的检索结果超出前K项时,现有技术中一般有以下两种收集方式1.收集全部结果并进行部分排序,返回用户所要求的部分。无序收集全部命中的结果,根据用户要求返回的结果范围进行部分排序,得到结果区间,并对本区间内的结果进行完整排序,从而获得所需要结果并返回给用户。这种方式 存在的缺陷是需要大量的存储空间,而且大量结果的排序性能较低。2.动态扩展K值到包含用户要求返回的结果的K',收集K'项最好的检索结果。著名的开源全文检索系统Lucene (http://lucene.apache.org/)中使用了这种 方式。如Top-K方法,只收集前K'项最好的检索结果,抛弃其余结果,最终获得所需要结果 并返回给用户。这种方式在K'接近K时具有不错的性能,但随着K'值的扩大,其性能也 不断地下降。在用户要求的检索结果范围处于全部检索结果的最后时,就变成收集全部检 索结果,此时的存储空间与第1种方式一样,而且由于全部排序导致性能更低。以上两种现有方式都需要保存大量的检索结果,从而占用了大量的内存空间,而 且当检索结果较多时排序性能低,使得全文检索系统的性能下降。

发明内容
针对现有技术中存在的缺陷,本发明的主要目的是提供一种能够根据用户的需要 返回排序最靠前的,或最靠后的,或中间的若干项检索结果的检索结果三段式有序收集方 法及系统。在此基础上,本发明还能够提高检索结果的排序性能,降低检索结果的存储空 间,减少内存空间的占用,从整体上提高检索系统的性能。为了实现上述目的,本发明采用的技术方案如下一种检索结果三段式有序收集方法,该方法首先根据检索请求进行检索并获得检 索结果;然后根据预先确定的头段、尾段和中间段的容量将检索结果中排序在最前的部分 收集在头段中,排序在最后的部分收集在尾段中,排序在中间的部分收集在中间段中;最后 根据检索结果返回请求从头段、尾段和/或中间段中返回检索结果。如上所述的检索结果三段式有序收集方法,其中,头段容量包括第一容量K和第 二容量K',第二容量K'为第一容量K的1.5倍到10倍之间;尾段容量M为第一容量K的 0.5倍到1倍之间;中间段容量N根据请求返回的检索结果范围和头段容量确定。头段第 一容量K 一般为5至10个检索结果展示页面所包含的检索结果数量,优选为8个检索结果 展示页面所包含的检索结果数量;第二容量K'优选为50个检索结果展示页面所包含的检 索结果数量,尾段容量M优选为4个检索结果展示页面所包含的检索结果数量。如上所述的检索结果三段式有序收集方法,其中,头段中的检索结果降序排列,尾 段中的检索结果升序排列,中间段中的检索结果不排序。如上所述的检索结果三段式有序收集方法,其中,将检索结果中排序在最前的部 分收集在头段中,排序在最后的部分收集在尾段中,排序在中间的部分收集在中间段中的 过程包括以下步骤(1)确定头段第一容量K和第二容量K',尾段容量M;(2)根据检索结果返回请求中要求返回的检索结果范围确定收集方式;所述收集方式包括只收集头段检索结果和同时收集头段、尾段和中间段检索结 果;如果同时收集头段、尾段和中间段检索结果,则确定中间段容量N、中间段与头段之间 的距离D ;(3)根据步骤O)中确定的收集方式将检索结果收集到头段,或者头段、尾段和中 间段。
如上所述的检索结果三段式有序收集方法,步骤O)中所述根据要求返回的检索 结果范围确定收集方式的过程如下将请求返回的检索结果范围由起始位置SI和返回数量RC表示;如果(SI+RC) e
,则头段容量采用第一容量K,只收集头段检索结果;如果(SI+RC) e (K,K'],则头段容量采用第二容量K',只收集头段检索结果;如果(SI+RC)>K'且SI<K',则头段容量采用第二容量K',N = SI+RC-K', D = 0,收集头段、尾段和中间段检索结果;如果(SI+RC)>K'且SI≥K',则头段容量采用第二容量K',N = RC,D = SI-K',收集头段、尾段和中间段检索结果。如上所述的检索结果三段式有序收集方法,步骤(3)中所述将检索结果收集到头 段,或者头段、尾段和中间段的过程包括以下步骤①从检索结果集合中取出一个检索结果X ;②判断头段是否已满;如未满,则将检索结果X加入头段中,并对头段中检索结果 进行排序,转至步骤⑦;③如果头段已满,则将检索结果X与头段中的最小项进行比较;如果小于最小项, 则将检索结果X作为排除出的结果;否则将检索结果X加入头段中并排序,将最小项作为排 除出的结果;④判断尾段是否已满;如未满,则将排除出的结果加入尾段中,并对尾段中检索结 果进行排序,转至步骤⑦;⑤如果尾段已满,则将排除出的结果与尾段中的最大项进行比较;如果小于最大 项,将排除出的结果加入尾段中,并对尾段中的检索结果进行排序,将最大项作为排除出的 结果;否则,排除出的结果不变;⑥判断D的值和中间段中检索结果的数量;如果D > 0,则将D递减一,抛弃排除 出的结果;如果D = 0,且中间段中检索结果的数量小于N,则将排除出的结果加入中间段 中,按照加入的顺序保存检索结果;如果中间段中检索结果的数量等于N,则抛弃排除出的
结果;⑦判断检索结果集合是否为空;如是,则结束;如否,则转至步骤①。如上所述的检索结果三段式有序收集方法,其中,根据检索结果返回请求返回检 索结果的过程包括以下步骤(a)比较头段中检索结果的数量与头段的容量;(b)如果头段中检索结果的数量小于其容量,则将头段中从SI开始的RC条检索 结果作为返回结果;如果RC超过了头段中从SI开始到结尾的检索结果数量,则将头段中从 SI开始到结尾的检索结果作为返回结果;如果SI大于头段中检索结果的数量,则返回结果 为空;(c)如果头段中检索结果的数量等于其容量,则从SI开始将头段中最小 的[MAX((K' -Si), 0)]条检索结果、中间段中的全部检索结果、以及尾段中最大的 [RC-MAX((K' -Si),0)_中间段中的全部检索结果数量]条记录作为返回结果。一种检索结果三段式有序收集系统,包括用于根据检索请求进行检索并获取检索 结果的检索装置,用于根据预先确定的头段容量将检索结果中排序在最前的部分收集在头段中的头段结果收集装置;用于根据预先确定的尾段容量将检索结果中排序在最后的部分 收集在尾段中的尾段结果收集装置;用于根据预先确定的中间段容量将检索结果中排序在 中间的部分收集在中间段中的中间段结果收集装置;以及用于根据检索结果返回请求要求 返回的检索结果范围返回检索结果的检索结果返回装置。本发明所述方法及系统,通过采用三段来收集检索结果的方式,不仅实现了根据 用户的需要返回排序最靠前的,或最靠后的,或中间的若干项检索结果,而且有效地较少了 检索结果的存储空间,增强了检索结果的排序效率,综合提高了检索系统的整体性能。


图1是具体实施方式
中三段之间的关系图;图2是具体实施方式
中三段式有序收集系统的结构框图;图3是具体实施方式
中采用图2所示系统收集检索结果的流程图;图4是具体实施方式
中将检索结果按序分别加入到头段、尾段和中间段的流程 图。
具体实施例方式本发明的核心思想是首先根据检索请求进行检索并获得检索结果;然后根据预 先确定的头段(Top-K)、尾段(Bottom-M)和中间段(Middle-N)的容量将检索结果中排序 在最前的部分收集在头段中,排序在最后的部分收集在尾段中,排序在中间的部分收集在 中间段中;最后根据检索结果返回请求从头段、尾段和/或中间段中返回检索结果。其中, 头段中的检索结果降序排列,尾段中的检索结果升序排列,中间段中的检索结果不排序。头 段、中间段和尾段之间的关系如图1所示。当用户请求返回的结果范围在收集的最前或最 后的排序结果中时,返回准确的排序结果;当请求返回的结果范围不完全在前后有序的结 果范围中时,返回前后部分有序结果和中间的不排序结果;当请求返回的结果范围完全不 在前后有序的结果范围中时,返回中间的不排序结果。下面结合实施例和附图,对本发明进 行详细描述。图2出示了本发明所述检索结果三段式有序收集系统的优选实施方式的结构。该 系统包括检索装置11、头段结果收集装置12、尾段结果收集装置13、中间段结果收集装置 14以及检索结果返回装置15。检索装置11用于根据检索请求进行检索并获取检索结果。头段结果收集装置12 用于根据预先确定的头段容量将检索结果中排序在最前的若干项结果收集在头段中,头段 中的检索结果降序排列。尾段结果收集装置13用于根据预先确定的尾段容量将检索结果 中排序在最后的若干项结果收集在尾段,尾段中的检索结果升序排列。中间段结果收集装 置14用于根据预先确定的中间段容量将检索结果中排序在中间的若干项结果收集在中间 段中,中间段的检索结果不排序。检索结果返回装置15用于根据检索结果返回请求要求返 回的检索结果范围返回检索结果。图3是采用图1所示系统收集检索结果的流程,包括以下步骤(1)确定头段第一容量K和第二容量K',尾段容量M,以及检索结果返回请求中要 求返回的检索结果范围。其中,K、K'和M的值根据对用户的使用情况分析后确定,K' 一般为K的1. 5倍至10之间,M —般为K的0. 5到1倍之间。K 一般为5_10个检索结果展示 页面所包含的检索结果数量,最佳为8个检索结果展示页面所包含的检索结果数量。K'根 据K的取值而调整,最佳值为50个检索结果展示页面所包含的检索结果数量。M —般保持 在4个左右检索结果展示页面所包含的检索结果数量。(2)根据要求返回的检索结果范围确定收集方式,所述收集方式包括只收集头段 检索结果和同时收集头段、尾段和中间段检索结果。如果需要同时收集头段、尾段和中间 段检索结果,则确定中间段容量N(即中间段需要收集的结果数量)、中间段与头段的距离 D(参照图1)。要求返回的检索结果范围由起始位置乂虹《11(1^(简写为Si)和返回数量 ReturnCounW简写为RC)表示。当检索结果为多页时,随着用户翻页,SI不断变化;RC值 就是一页展示的检索结果数量,一般为10项。当需要返回的检索结果范围在
区间内,S卩(SI+RC) e [Ο,Κ]时,头段容量采 用K。当需要返回的检索结果范围在(K,K']区间内,S卩(SI+RC) e (K,K']时,头段容 量采用K'。这两种情况下,只需收集头段检索结果即可,无需收集尾段和中间段。当需要返回的检索结果范围不全部处于头段范围内(此时头段容量为K'),即 (SI+RC) >K'时,如果两者范围存在部分重叠,即SI < K',则N=SI+RC-K',D = 0。如 果两者不存在重叠,即SI彡K',则N = RC,D = SI-K'。这两种情况下,需要同时收集头 段、尾段和中间段。(3)根据步骤O)中确定的收集方式将检索结果收集到头段,或者头段、尾段和中 间段,具体过程如图4所示,包括以下步骤①从检索结果集合中取出一个检索结果X ;②判断头段是否已满;如未满,则将检索结果X加入头段中,并对头段中检索结果 进行降序排列,转至步骤⑦;③如果头段已满,则将检索结果X与头段中的最小项进行比较;如果小于最小项, 则将检索结果X作为排除出的结果;否则将检索结果X加入头段中并降序排列,将最小项作 为排除出的结果;所述最小项是指按照排序规则排在最小位置的项;④判断尾段是否已满;如未满,则将排除出的结果加入尾段中,并对尾段中检索结 果进行升序排列,转至步骤⑦;⑤如果尾段已满,则将排除出的结果与尾段中的最大项进行比较;如果小于最大 项,将排除出的结果加入尾段中,并对尾段中的检索结果进行升序排列,将最大项作为排除 出的结果;否则,排除出的结果不变;所述最大项是指按照排序规则排在最大位置的项;⑥判断D的值和中间段中检索结果的数量;如果D > 0,则将D递减一,抛弃排除 出的结果;如果D = 0,且中间段中检索结果的数量小于N,则将排除出的结果加入中间段 中,按照加入的顺序保存检索结果;如果中间段中检索结果的数量等于N,则抛弃排除出的 结果;⑦判断检索结果集合是否为空;如是,则结束;如否,则转至步骤①。(4)根据检索结果返回请求要求返回的检索结果范围返回检索结果,具体过程包 括以下步骤(a)比较头段中检索结果的数量与头段的容量。
(b)如果头段中检索结果的数量小于其容量,则说明此时中间段、尾段都为空,将 头段中从SI开始的RC条检索结果作为返回结果。头段中从SI开始的检索结果数量可能 不足RC条,也可能请求返回的检索结果范围超出了头段中收集的检索结果范围。如果请求 返回的检索结果数量RC超过了头段中从SI开始到结尾的检索结果数量,则将头段中从SI 开始到结尾的检索结果作为返回结果;如果SI大于头段中检索结果的数量,则返回结果为 空。(c)如果头段中检索结果的数量等于其容量,则从SI开始,将头段中最小 的MAX((K' -SI),0)条检索结果、中间段中的全部检索结果、以及尾段中最大的 [RC-MAX((K' -Si),0)_中间段中的全部检索结果数量]条记录作为返回结果。如果中间 段与头段不相邻,则头段中返回的结果为空;如果中间段与尾段不相邻,则尾段返回结果为 空;如果请求返回结果只在其中一个段中时,则其他段的返回结果为空。
实施例下面以收集对报刊索引库进行检索的结果为例,对上述方法进行举例说明。在报 刊索引库的检索应用中,一个检索结果展示页面展示10条记录,一次检索缓存8页结果便 能基本满足需要,因此K取8个检索结果展示页面所包含的结果数量80,K'取500,M取K 的0. 5为40,这些参数是用户根据检索系统的特点事先配置的。在约1000万数据量的报刊索引库中查询“内容中国”,并根据报刊出版时间从后 到前的顺序排序,共命中了 2,201,853条结果。当从第10条开始取后续10条结果时,即SI = 10,RC = 10。SI+RC < K,要求返 回的检索结果在头段中。此时,直接将前K项排序最大的结果收集在头段中,其余结果被抛 弃。最终从头段中取得所需要的结果。当从第495条开始取后续10条结果时,即SI = 495,RC= 10。SI+RC> K'且SI <K',要求返回的检索结果在头段和中间段中,N= SI+RC-K' =5,D = 0。对于每条检索结果按照如图4所示方法,先加入到头段中,如果有结果被排除再 加入到尾段中,如果有结果被排除再根据中间段的情况加入中间段,其余结果被抛弃。最终从头段中读取从[MAX((K' _SI),0) = 5]条最小结果,并从中间段中取得所 有结果(N = 5条),作为返回结果,尾段返回的结果为空。当从第510条开始取后续10条结果时,即SI = 510,RC = 10。SI+RC > K',要 求返回的检索结果在中间段中,N = RC = 10,D = SI-K' = 10。对于每条检索结果按照如图4所示方法,先加入到头段中,如果有结果被排除再 加入到尾段中,如果有结果被排除再根据中间段的情况加入中间段,其余结果被抛弃。最终从中间段中取得所有结果(N = 10条),作为返回结果,其他段的返回结果为空。当从第2,201,810条开始取后续10条结果时,即SI = 2,201,810,RC= 10。SI+RC >K',要求返回的检索结果在中间段和尾段中,N = RC= 10,D = SI-K' =2,201,310。对于每条检索结果按照如图4所示方法,先加入到头段中,如果有结果被排除再 加入到尾段中,如果有结果被排除再根据中间段的情况加入中间段,其余结果被抛弃。最终从中间段中取得所有结果(未满,只有3条),从尾段中取得[RC-MAX((K' -Si),0)_中间段中全部结果数量]条(共7条)排序最大的结果作为返回 结果,头段返回结果为空。当从第2,201,820条开始取后续10条结果时,即SI = 2,201,820,RC= 10。SI+RC > K',要求返回的检索结果在尾段中,N = RC= 10,D = SI-K' =2,201,320。对于每条检索结果按照如图4所示方法,先加入到头段中,如果有结果被排除再 加入到尾段中,如果有结果被排除再根据中间段的情况加入中间段,其余结果被抛弃。最终从尾段中取得返回结果,其他段返回结果为空。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精 神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其同等技术的范围 之内,则本发明也意图包含这些改动和变型在内。
权利要求
1.一种检索结果三段式有序收集方法,其特征在于该方法首先根据检索请求进行检 索并获得检索结果;然后根据预先确定的头段、尾段和中间段的容量将检索结果中排序在 最前的部分收集在头段中,排序在最后的部分收集在尾段中,排序在中间的部分收集在中 间段中;最后根据检索结果返回请求从头段、尾段和/或中间段中返回检索结果。
2.如权利要求1所述的检索结果三段式有序收集方法,其特征在于所述头段容量包 括第一容量K和第二容量K',第二容量K'为第一容量K的1.5倍到10倍之间;所述尾段 容量M为头段第一容量K的0. 5倍到1倍之间;所述中间段容量N根据请求返回的检索结 果范围和头段容量确定。
3.如权利要求2所述的检索结果三段式有序收集方法,其特征在于所述头段第一容 量K为5至10个检索结果展示页面所包含的检索结果数量。
4.如权利要求3所述的检索结果三段式有序收集方法,其特征在于所述头段第一容 量K为8个检索结果展示页面所包含的检索结果数量,第二容量K'为50个检索结果展示 页面所包含的检索结果数量,尾段容量M为4个检索结果展示页面所包含的检索结果数量。
5.如权利要求1至4之一所述的检索结果三段式有序收集方法,其特征在于所述头 段中的检索结果降序排列,尾段中的检索结果升序排列,中间段中的检索结果不排序。
6.如权利要求5所述的检索结果三段式有序收集方法,其特征在于所述将检索结果 中排序在最前的部分收集在头段中,排序在最后的部分收集在尾段中,排序在中间的部分 收集在中间段中的过程包括以下步骤(1)确定头段第一容量K和第二容量K',尾段容量M;(2)根据检索结果返回请求中要求返回的检索结果范围确定收集方式;所述收集方式包括只收集头段检索结果和同时收集头段、尾段和中间段检索结果;如 果同时收集头段、尾段和中间段检索结果,则确定中间段容量N、中间段与头段之间的距离 D ;(3)根据步骤⑵中确定的收集方式将检索结果收集到头段,或者头段、尾段和中间段。
7.如权利要求6所述的检索结果三段式有序收集方法,其特征在于,步骤(2)中所述根 据要求返回的检索结果范围确定收集方式的过程如下将请求返回的检索结果范围由起始位置SI和返回数量RC表示;如果(SI+RC) e W,K],则头段容量采用第一容量K,只收集头段检索结果;如果(SI+RC) e (K,K'],则头段容量采用第二容量K',只收集头段检索结果;如果(SI+RC)>K'且SI<K',则头段容量采用第二容量K' ,N= SI+RC-K',D = 0,收集头段、尾段和中间段检索结果;如果(SI+RC)>K'且SI彡K',则头段容量采用第二容量K',N = RC,D = SI-K', 收集头段、尾段和中间段检索结果。
8.如权利要求7所述的检索结果三段式有序收集方法,其特征在于,步骤(3)中所述将 检索结果收集到头段,或者头段、尾段和中间段的过程包括以下步骤①从检索结果集合中取出一个检索结果X;②判断头段是否已满;如未满,则将检索结果X加入头段中,并对头段中检索结果进行 排序,转至步骤⑦;③如果头段已满,则将检索结果X与头段中的最小项进行比较;如果小于最小项,则将 检索结果X作为排除出的结果;否则将检索结果X加入头段中并排序,将最小项作为排除出 的结果;④判断尾段是否已满;如未满,则将排除出的结果加入尾段中,并对尾段中检索结果进 行排序,转至步骤⑦;⑤如果尾段已满,则将排除出的结果与尾段中的最大项进行比较;如果小于最大项,将 排除出的结果加入尾段中,并对尾段中的检索结果进行排序,将最大项作为排除出的结果; 否则,排除出的结果不变;⑥判断D的值和中间段中检索结果的数量;如果D> 0,则将D递减一,抛弃排除出的 结果;如果D = 0,且中间段中检索结果的数量小于N,则将排除出的结果加入中间段中,按 照加入的顺序保存检索结果;如果中间段中检索结果的数量等于N,则抛弃排除出的结果;⑦判断检索结果集合是否为空;如是,则结束;如否,则转至步骤①。
9.如权利要求8所述的检索结果三段式有序收集方法,其特征在于,根据检索结果返 回请求返回检索结果的过程包括以下步骤(a)比较头段中检索结果的数量与头段的容量;(b)如果头段中检索结果的数量小于其容量,则将头段中从SI开始的RC条检索结果 作为返回结果;如果RC超过了头段中从SI开始到结尾的检索结果数量,则将头段中从SI 开始到结尾的检索结果作为返回结果;如果SI大于头段中检索结果的数量,则返回结果为 空;(c)如果头段中检索结果的数量等于其容量,则从SI开始将头段中最小的 [MAX ((K' -Si), 0)]条检索结果、中间段中的全部检索结果、以及尾段中最大的 [RC-MAX((K' -Si),0)_中间段中的全部检索结果数量]条记录作为返回结果。
10.一种检索结果三段式有序收集系统,包括用于根据检索请求进行检索并获取检索 结果的检索装置(11),其特征在于所述系统还包括用于根据预先确定的头段容量将检索 结果中排序在最前的部分收集在头段中的头段结果收集装置(1 ;用于根据预先确定的 尾段容量将检索结果中排序在最后的部分收集在尾段中的尾段结果收集装置(1 ;用于 根据预先确定的中间段容量将检索结果中排序在中间的部分收集在中间段中的中间段结 果收集装置(14);以及用于根据检索结果返回请求要求返回的检索结果范围返回检索结 果的检索结果返回装置(15)。
全文摘要
本发明公开了一种检索结果三段式有序收集方法及系统,属于检索技术领域。现有收集方式当检索结果较多时需要占用大量的内存空间,而且排序性能低。本发明所述方法及系统首先根据检索请求进行检索并获得检索结果;然后根据预先确定的头段、尾段和中间段的容量将检索结果中排序在最前的部分收集在头段中,排序在最后的部分收集在尾段中,排序在中间的部分收集在中间段中;最后根据检索结果返回请求从头段、尾段和/或中间段中返回检索结果。采用本发明能够有效地减少检索结果的存储空间,增强检索结果的排序性能,综合提高检索系统的整体性能。
文档编号G06F17/30GK102103615SQ20091024380
公开日2011年6月22日 申请日期2009年12月21日 优先权日2009年12月21日
发明者徐剑波, 童征宇, 赵东岩 申请人:北京大学, 北京方正阿帕比技术有限公司, 北大方正集团有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1