专利名称:在分层对象结构中的搜索方法
技术领域:
本发明涉及一种在一组对象中搜索最接近实例的对象的预定数目对象的方法。本发明还涉及包括用于实现这个搜索方法的装置的计算机程序和设备。最后本发明涉及包括这样设备的传输系统。
本发明在音频/视频数据的使用领域中具有很有意义的应用。
显著地增加数据传输和存储容量,以至于在包括消费电子学领域的各种领域中,用户今后很难管理曾经供他使用的信息。在这一点上,对象搜索方法变得更加重要。
美国专利5,832,182描述了数据划分方法并且讨论了这种搜索方法的意义。有效的数据划分允许减少为了进行搜索而进行的比较的次数,并且因此减少搜索所需的处理时间。
本发明为它的目的特别地提出了一种在各种层次上使用对象划分的有效的对象搜索方法。
依据本发明的搜索方法特征为,为了在一组对象中搜索最接近实例的预定数目的对象,通过使用具有包括节点和叶的树形结构的多级划分,节点包含表示对象类的元素,叶包含对象,上述方法包括下列步骤为了选择一个或者多个叶,通过上述树形结构从节点开始并且通过其代表元素最接近实例的节点到叶的步骤,检验被选择的叶数是否低于上述对象的预定数的步骤,和,如果被选择的叶数低于上述对象的预定数,则从最后通过的、最接近上述实例的节点的同级节点开始上述步骤的新的重复。
多级划分的使用显著地有利于进行搜索,因为它允许进一步的降低搜索所需的比较次数并且因此降低处理时间。它还允许处理比用单级划分包括更多的对象的组。实际上,用单级划分,当一组对象的大小显著地增加的时候,这导致了类数的增加,或者包含在一个类中的对象数的增加。在两种情况中,每种都导致搜索用的实例与大量的对象相比较。因此显著地增加了处理时间。另一方面,用多级划分,搜索用的实例在划分的每级上只与有限的对象相比较。因此组的大小的增加在搜索的处理时间上影响很小。
本发明有利地提出通过多级划分的树形结构。
在本发明的优选的实施例中,对象的预定数是结果的预定数的倍数并且上述方法包括在被选择的叶中只保留等于上述结果的预定数的叶数的附加选择步骤,而被保留的叶是包含最接近上述实例的对象的那些。
对象的划分导致为进行搜索而进行的比较的次数的减少。但是它也必然引起搜索结果的恶化。这个实施例允许限制这种恶化。实际上,通过首先选择比想要的结果数更高的叶数,并且其后进行补充选择,例如,通过包含在被选择的叶中的对象与用于搜索的实例的彻底的比较,能够显著地改善所获得的结果的质量。
一般的,本发明能够应用于提供了为这种类型的对象定义的相似性量度的任何类型的对象,这个相似性量度是已经用于构造划分的那个,并且它验证3个下列条件f是联合实数和初始组的两个对象的应用。
以任何顺序考虑这两个对象,这个实数都相同,联合两个相同对象的实数高于联合两个不同对象的实数。
例如,通过元数据形成对象,也就是,联合一组数据的结构。这样的元数据,例如是视频拍摄的描述,是很明显的MPEG-7类型的描述。MPEG-7草图实际上为视频拍摄定义了确定数目的描述符(颜色描述符,文字描述符,摄像机移动描述符,。。。。。。),并且提出联合这些描述符的相似性量度。为了更加详细,将参考做成文件ISO/IEC JTC1/SC29/WG11 N3521(2000年7月),标题为《电影和相关音频信息的代码》,它参看了文件《可视化工作图》版本4.0。
结合下文描述的实施例,通过非限制实例,本发明的这些和其他方面将更加明显和清楚。
在图中
图1是描述划分一组对象的方法的实例的操作的方框图,它提供了依据本发明可以被搜索方法使用的多级划分,图2是依据本发明用于实现搜索方法的树形结构的实例的图,图3是描述依据本发明的搜索方法的实例的操作的方框图,图4是依据本发明的设备的实例的图,
图5是依据本发明的传输系统的实例的图。
在图1中显示了描述多级划分方法的实例的操作的流程图,它是为了生成依据本发明搜索方法使用的类型的多级划分。
如图1中所示的划分方法包括下列步骤(SS0)定义初始划分PZ0。这个划分包括一个包含组X的全部对象的类C0,0。(SS1)为包含多于一个对象的划分PZj-1的每一级Cj-1,k(k=1,。。。Qj-1)生成一个划分PZj。这个划分包括Qj级Cj,1,Cj,2,。。。,Cj,Qj。(SS2)为划分PZj的每一级Cj,1,Cj,2,。。。,Cj,Qj确定代表元素Rj,1,Rj,2,。。。,Rj,Qj。(SS3)这些代表元素存储在这种类型的树形结构TR中,其中每个代表元素Rj,1,Rj,2,。。。,Rj,Qj是类Cj-1,k的代表元素的子集。(SS4)重复(SS1),(SS2)和(SS3)直到划分PZj验证了预定标准。(SS5)当验证预定标准的时候,存储类Cj,1,Cj,2,。。。,Cj,Qj的对象以便于分别形成节点Rj,1,Rj,2,。。。,Rj,Qj的叶。
在步骤(SS1)中可以使用例如在文章《有效的K方法集群算法》中描述的《K方法》类型的划分方法,文章《有效的K方法集群算法》由K.Alsabti、S.Ranka和V.Singh在《IPPS/SPDP工作组高性能数据提炼,1998,Orlando Florida》上发表。同样可以使用例如在引用的美国专利中介绍的通过结块分层划分方法,或者也可以是两种方法的组合,用于初始化《K方法》方法的部分结块方法。
类的代表元素例如是类的质心。为了确定类的质心,首先计算与类的所有元素都相似的虚拟元素。利用最接近虚拟元素的类的元素来形成质心。
当每类的对象数可能最接近最大值的时候,或者包含在划分PZj的类中的对象充分地接近类的质心的时候,终止多级划分方法(也就是,验证了考虑过的预定条件)。
在图2中显示了用多级划分方法获得的并且可以用于实现依据本发明的搜索方法的树形结构TR的实例。树的节点表示成虚线。它们包含表示对象组的类的元素。树的叶表示成实线。它们包含X组的对象x1,x2,。。。,xN。
图3显示了描述依据本发明的搜索方法的实例的操作的方框图,实例用于在树形结构Y中选择预定数对象N。依据图3,依据本发明的搜索方法包括下列步骤
(T0)初始化指示保留被选择的叶数的变量NBO。它的初始值等于被选择对象的预定数,NBO=n。
(T1)确定依赖于当前节点n的叶数NBL(n)。依赖于节点的叶是这个节点的叶以及依赖这个节点的节点的叶。
(T2)比较依赖当前节点NBL(n)的叶数和保留被选择的叶数NBO。
(T3)如果它们相同(NBL(n)=NBO),则选择依赖当前节点n的叶(在图3中这个选择操作用S(n,xk)表示)。并且终止方法。
(T4.0)如果叶数NBL(n)低于保持被选择的叶数(NBL(n)<NBO),则选择依赖当前节点n的叶(S(n,xk))。
(T4.1)从保留被选择的当前叶数中减去叶数NBL(n),并用它更新指示保留被选择的叶数的变量NBONBO=NBO-NBL(n)。
(T4.2)表示为NTEB(n)的最接近实例的当前结点的同级节点成为新的当前结点n=NTEB(n),并且重复步骤(T1)。
(T5)如果叶数NBL(n)大于保留被选择的叶数(NBL(n)>NBO),表示为NTEC(n)的最接近实例的当前结点的子节点成为新的当前结点n=NTEC(n),并且重复步骤(T1)。
有利地,被选择的对象数NBO被设置成等于用户想要的结果数NBR的倍数NBO=aNBR。在这样的情况下,依据本发明的搜索方法包括附加步骤(T6),它用于从被选择的aNBR对象中只保留最接近被搜索的实例的NBR对象。例如,在步骤(T6)中进行的这个附加选择由包含在被选择叶中的aNBR对象和被搜索的实例的系统比较组成。
通过利用依赖所关心的对象类型的相似性量度f来评价两个对象的相似性,这种相似性量度已经用于建立树形结构,并且满足下列三个条件f是联合实数与初始组的两个对象的应用。
以任何顺序考虑这两个对象,这个实数都相同。
联合两个相同对象的实数高于联合两个不同对象的实数。
通过使用在MPEG-7标准的草图中提出的关联的相似性量度,本发明可以显著地应用到在MPEG-7标准的草图中定义的描述实例的对象。
图4显示依据本发明的设备的实例。这个设备是包括视频捕获装置2(例如CCD类型)的摄像机1。摄像机1还包括用于存储数据的存储器3和用于存储计算机程序的存储器4,用于执行上述程序的微处理器部件5,和用于接收由用户给定的命令和用于给用户提供数据的用户接口6。存储器4显著地包括用于编码捕获的视频的一个或者多个程序的一组PG1。这组程序PG1特别陈述了存储在存储器3中的MPEG-7视频拍摄的描述。存储器4还包括由各种上述MPEG-7描述形成的一组多级划分方法PG2,用于在包含上述描述的树形结构中搜索的依据本发明的搜索程序PG4。
在图5中显示了依据本发明的传输系统的实例的图。这个系统包括数据源10,用户设备20和用于在数据源10和用户设备20之间传输信号的媒体30。数据源10,例如,是视频数据源。例如,通过电缆网、通过卫星、无线电通信线路的传输网络等形成给用户设备传输这些视频信号的传输媒体。用户设备包括特别用于接收由源10传输的数据的接收电路100,用于存储数据特别是接收数据的存储器110,包括计算机程序的存储器120,用于执行上述程序的微处理器部件140,和用于接收由用户给定的命令并且给用户提供数据的用户接口160。存储器120特别包括用于根据接收的视频数据来合计有关视频拍摄的MPEG-7描述的对象数据库的程序PG5。它还包含包括这个数据库的对象的一组多级划分的程序PG2,和用于依据本发明在包含上述描述的树形结构中搜索对象的程序PG4。
权利要求
1.在一组对象中搜索最接近实例的对象的预定数的方法,通过使用具有包括节点和叶的树形结构的多级划分,节点包含表示对象类的元素,叶包含对象,上述方法包括以重复的方式执行下列步骤为了选择一个或者多个叶,从节点开始通过上述树形结构并且通过其代表元素最接近实例的节点来转到叶的步骤,检测被选择的叶数是否低于上述的对象预定数的步骤,和,如果被选择的叶数低于上述对象预定数,从最后通过的、最接近上述实例的节点的同级节点开始上述步骤的新的重复。
2.如权利要求1中所述的搜索方法,特征为对象的预定数是结果的预定数的倍数,方法包括用于从被选择的叶中只保留等于上述结果的预定数的叶数的附加选择步骤,被保留的叶是包含最接近上述实例的对象的那些。
3.如权利要求1中所述的搜索方法,特征为通过树形结构的步骤包括如果连接到这个节点的叶数低于或者等于被选择的对象数则为每个通过的节点进行验证的测试,在这种情况下连接到这个节点的叶数直接被选择而不必通过任何可能的中间节点。
4.如在权利要求1或者2的一个中所述的搜索方法,特征为上述对象是视频拍摄的描述。
5.如在权利要求1或者2的一个中所述的搜索方法,特征为上述对象是MPEG-7描述。
6.如权利要求1中所述的搜索方法,特征为通过使用相似性量度f来确定代表元素或者对象对所搜索的实例的相似性,f是已经用于构造所用的划分的那一个并且验证了下列属性f是联合实数和初始组的两个数据的应用。无论两个数据是任何顺序,实数都相同,联合两个相同数据的实数高于联合两个不同数据的实数。
7.包括用于实现如在权利要求1或者2的一个中所述的搜索方法的指令的程序,当通过处理器来执行它的时候。
8.包括用于实现如在权利要求1或者2的一个中所述的搜索方法的装置的设备。
9.至少包括如在权利要求8中所述的设备的传输系统。
全文摘要
本发明涉及在通过使用分层对象分类方法而获得的分层对象结构中搜索最接近实例的预定数对象的方法。所提出的方法由从根部开始通过分层结构,下降直到最接近叶数低于所依赖的缺少的结果数的被搜索的实例的第一个节点,然后返回直到最接近被搜索实例的这个节点的同级节点,以便于增加其他结果等直到达到上述预定数来组成。
文档编号G06F17/30GK1356655SQ0114563
公开日2002年7月3日 申请日期2001年11月24日 优先权日2000年11月28日
发明者B·莫里, N·桑蒂尼 申请人:皇家菲利浦电子有限公司