专利名称::用于特征向量的向量量化的方法
技术领域:
:本发明涉及一种用于尤其与待传输或待存储的信号的数据压缩相关的特征向量的向量量化的方法,该信号尤其是语音信号或视频信号,在该方法中,通过在搜索期间检验一系列码本向量(Codebuchvektor)是否适用于表示特征向量,搜寻由多个码本向量构成的至少一个码本以寻找表示特征向量的码向量。
背景技术:
:这种方法适用于通过相对较小数目的码本向量或者通过这些码本向量的明确表征这些码本向量的索引来表示、也就是尤其是编码多维特征向量,这些多维特征向量的向量分量来自于往往大范围的可能值。这种方法结合大量常用编码方法一起尤其使用在语音编码、图像编码或视频编码的领域中,但是也用于其他信号的编码,以尤其是减少待传输或待存储的数据的量(数据压缩)。在此,数据量的减少尤其通过由表示所有这些不同特征向量的相同码向量来代替大量不同的特征向量进行。因此,由于这些特征向量之间的差异而存在编码误差,待编码的特征向量与表示该特征向量的码向量之间的距离越大,则编码误差就越大。在此,借助于由应用定义的距离尺寸来测量向量之间的距离,该距离尺寸应当满足度量或标准的数学特性。因此,特征向量空间中围绕码本的每个码本向量的单元属于该码本向量,该单元包含通过该单元的码本向量表示的所有特征向量。该单元对应于所有如下码本向量的集合,所述码本向量在所选择的距离尺寸的意义下距离码本的其他码本向量不比距离由该单元围绕的该码本向量更近。该单元的形状因此取决于所选择的距离尺寸和码本向量在特征向量空间中的分布。码本向量的数目越大且这些码本向量在特征向量空间中放置地越密集,则与这种方法相联系的信息损失就越小。在此,码本向量不必均勻分布在特征向量空间中,而是码本向量可以适宜地集中在特征向量空间的在其中需要或期望特别的表示准确性的区域中。然而另一方面,随着特征向量空间中码本向量的数目及其密度的上升,用于确定最优码向量或者仅近似最优的最佳地表示或以合理误差表示待编码特征向量的码向量的耗费也会上升。
发明内容本发明所基于的任务在于,说明一种用于特征向量的向量量化的方法,该方法(与已知方法相比)将尽可能高的准确性(上升)与尽可能小的耗费(增长)相联系。该任务是通过具有根据权利要求1的特征的用于向量量化的方法来解决。在根据本发明的方法中,通过在搜索期间检验一系列码本向量是否适用于表示所述特征向量,搜寻包括多个码本向量的至少一个码本以寻找表示所述特征向量的码向量。在此搜索过程中或者优选地在搜索开始之前,针对至少一个待检验的码本向量确定邻向量3集合,并且对码向量的搜索延伸到所有邻向量或者邻向量的子集。在本发明的描述的上下文中,在与常用语言习惯一致的情况下,码向量应当被理解为表示特征向量的码本向量,该码本向量在码本中进行搜索的范围内被确定为在被检验是否适用于表示特征向量的码本向量之中比每个其他经检验的码本向量更像该特征向量的码本向量或者至少经检验的码本向量中没有哪个码本向量比其更像该特征向量的码本向量。在此,两个向量的距离在所选择的距离尺寸的意义下越小,则这两个向量越相似。如果对合适的码本向量的搜索在完全搜寻整个码本和检验所有码本向量的适用性的意义上还未穷尽,则原则上当然可能在码本中给出与特征向量相似的一个或多个未检验的码本向量。由于码本由可数的、即有限量的码本向量构成,因而可以对码本向量计数,也就是适宜地通过索引来明确表征码本向量索引。在码本向量与码本向量索引之间存在明确的关系,因此概念“码本向量”和“码本向量索弓丨”可同义地使用,这在本说明书的范围中在有些地方得以采用,因为这对应于本领域技术人员的常用语言习惯。码本向量的邻向量集合优选包含大量码本向量,这些码本向量在码本向量空间中的距离尺寸的意义下最接近该集合所属于的码本向量,即具有与该码本向量最小的距离。在此,适于作为码本向量空间中的距离尺寸的是具有度量特性的每种距离尺寸,尤其是欧几里德(euklidisch)距离尺寸。通过将对应表示特征向量的码向量的搜索延伸到邻向量的至少一个子集,应优选实现的是,不会忽略码向量邻域中能够更好地表示待编码特征向量的其他码本向量。在此,如果第一码本向量与特征向量的距离尺寸小于第二码本向量与特征向量的距离尺寸,则第一码本向量比第二码本向量更好地表示特征向量。优选地,借助邻向量表(“next-neighbourtable(邻向量表)”)来确定一个码本向量的邻向量集合(“next-neighbourarray(邻向量阵列)”),该邻向量表将多个最近的邻向量分配给至少一个码本的多个码本向量中的每个码本向量。在这种分配中,从其邻向量集合应当被确定且作为起始向量被记录到所述邻向量集合中的码本向量出发,将所述邻向量集合中每个已存在记录的各个最近的邻向量序列在邻向量一侧记录到所述邻向量集合中。这优选一直进行,直至不再添加新的记录或者直至例如因为所述邻向量集合中的邻向量的数目已达到或已超过预定极限而中断记录。优选地,确定码本向量的邻向量表,所通过的是首先针对所述至少一个码本的码本向量的至少一个子集优选通过各个距离的确定来确定多个最近的邻向量并且通过以下步骤的迭代修改如此获得的邻向量表(“max-next-neighbourtable(最大邻向量表)”)(根据本领域技术人员的语言习惯以下也可称为“裁剪”)-针对所述邻向量表中的一个码本向量,确定其两个最近的邻向量;这两个最近的邻向量构成该码本向量的父向量(Elternvektor);-针对所述第一父向量,从所述邻向量表中确定两个最近的邻向量;这两个最近的邻向量构成所述第一父向量的子向量(Kindervektor);-如果所述第一父向量的两个子向量之一与所述第二父向量一致,则将所述第二父向量从所述邻向量表中删去并且由所述邻向量表中与其最近的邻向量代替;-针对所述第二父向量,从所述邻向量表中确定两个最近的邻向量;这两个最近的邻向量构成所述第二父向量的子向量;-如果所述第二父向量的两个子向量之一与所述第一父向量一致,则将所述第一父向量从所述邻向量表中删去并且由所述邻向量表中与其最近的邻向量代替。以此方式应避免在其中一些或所有邻向量中彼此相互指向的邻向量表。特别优选的是将根据所描述的实施例之一的方法用于减少与用于语音编码或用于视频编码的方法相关联的编码误差的程度的应用。在此,优选与根据标准方法的搜索相联系地将搜索延伸到邻向量。为此,优选针对用标准方法找到的码向量产生邻向量集合,随后将对最优或几乎最优的码向量的搜索延伸到该邻向量集合。这优选发生在对所有码本向量或者码本向量的子集的搜索开始之前,因为由此能够显著加速搜索。邻向量阵列的构造以及仅取决于码本元素而非目前待编码的向量的完全所有操作不是码本中的搜索的部分,而是此专用码本的构造的部分或者是该码本的经加速和/或改善的搜索意义下的准备。因此,仅取决于码本元素而不是目前待编码的向量的这些操作优选不在搜索期间(即在编码期间)执行,而是有利地在之前(本领域技术人员称为“离线”)已计算。以下根据优选实施例并且借助附图来进一步描述本发明。在此,图1示意性地示出借助邻向量表来生成码本向量的邻向量集合;图2示意性地示出消除邻向量表中的多余记录的流程。具体实施例方式根据本发明的方法和优选实施例可适宜地用根据G.711标准的宽带(“wideband(宽带)”,WB)语音编解码器的示例来描述,因为该标准包含流行的标准G.711作为窄带核("narrowbandcore(窄带核)”)。G.711标准的宽带扩展G.711.1使用宽带MDCT编解码器(MDCT=改进的离散余弦变换)来编码位于4kHz与7kHz之间的频率范围内的信号分量。对此的细节可例如从Y.Hiwasaki等人的出版物“G.711.1:AWidebandExtensiontoITU-TG.711”,G.711.1_1569104469.pdf获悉。在G.711标准的该扩展中,宽带信号分量通过36个加权且标准化的系数的计算在MDCT范围内编码,并且随后编码为6个6维向量。按照G.711.1标准的标准方法,在此必须通过两个向量的线性组合来描绘特征向量,这两个向量来自于分别具有32个码本向量的两个码本。为了使搜索合适的码本向量时的耗费保持得合理,在此往往不执行对码本向量的穷尽搜索。作为对此的结果,通过该标准过程找到的码向量索引并不总是最优的并且因此能被改善。根据本发明,这种改善优选通过如下方式达到根据标准方法的搜索与根据本发明的细化搜索相联系,在本发明的细化搜索中,针对在标准方法中找到的码向量确定邻向量集合,并且将搜索延伸到该邻向量集合或者该集合的子集。该实施方式和其他实施方式中的根据本发明的方法的优点在于,在此以不改变的方式使用相同的资源,即相同的码本和相同的准则(例如,所述的“增益(gain)”),并且以与标准方法相同的形式对参数编码,以使得为了改善编码不需要较高的数据传输耗费或数据存储耗费,所以还可以形象化地涉及“0位增强层”,这是因为为了这种改善不需要用于编码5的额外位。根据本发明的另一优点可看作在于,通过对邻向量集合的大小NN_NB的合适选择能够容易地控制附加的耗费和由此获得的附加准确性。实验调查已经得出,经改善的或最优的码向量往往位于根据标准方法确定的码向量的直接邻域中。该认识通过根据本发明的方法以非常有效的方式用于在相对较小的耗费升高的情况下改善准确性。根据G.711.1标准,通过两个向量的算术手段逼近(也就是近似)待编码的特征向量*//■.\士Cwcnv(‘(穸))i(ν*))—■,个“一2这两个向量来自于码本大小CB_SIZE=32的两个码本.和c_。这些码本中的每一个因此包括32个向量。由此,获得总共CB_DIM=4x32x32=4096个码向量。这种码本内的穷尽搜索在语音或视频编码器的背景下是昂贵的计算任务,所以在标准方法中实现次最优的码本搜索,以便将耗费保持在合理的范围内。结果,以此方式在标准方法中,仅49%的特征向量由最优的码向量表示。根据本发明的方法的核心在于邻向量集合,该集合是针对码本向量借助码本产生的。该集合基本上将其两个最近的邻向量的索引分配给一个码本向量。最近的邻向量的数目NB_NN在此可以是受限制的,以便限制与根据本发明的方法相联系的附加耗费。在耗费限制的意义下可利用另外的计算优点。因为特征向量的空间是数学意义下(至少只要特征向量的分量来自于数学意义下的“体”)的向量空间(“线性”空间),所以码本适宜地针对每个码本向量CV也包含其(向量添加的)逆元素-CV。结合根据本发明的方法使用的表(邻向量集合、邻向量表等)中的向量或索引的数目可以因此常常通过充分利用相应的对称性来减小,例如通过在计算上合适地考虑向量的符号而减小到一半(CB_DIM_H=2048)。然而在此有利地应当注意到,码本向量的实际数目较大,在本示例中为CB_DIM=4096。用于生成邻向量集合的过程可以以图1为例来描述。在该示例中,首先假定存在邻向量表,并且根据标准方法确定暂时最优的码向量。该暂时最佳的码向量的向量索引随后作为初始值记录在邻向量集合中。在图1中所示的示例中,该向量索引为索引129。邻向量表中的属于该起始索引的两个索引随后同样被记录到邻向量集合中。在图1中所示的示例中,涉及索引126和123,因为根据图1中的邻向量表,这些索引是最近的邻向量。随后,为记录在邻向量集合中的每个索引重复该处理方式,其中注意不将相同的索引记录到邻向量集合中两次。在图1中所示的示例中,这例如对于索引125发生,根据邻向量表,离索引125最近的邻索引具有索引572和126,但是其中索引1已记录在邻向量集合中。在不能再找到另外的索引时,或者在邻向量集合中已达到预定数目的邻向量并且这些邻向量已被记录到邻向量集合中时,结束该过程。随后,将对于待编码特征向量的最优或近似最优的码向量的搜索优选扩展到整个邻向量集合或者该集合的子集,并且在该搜索中找到的最优或近似最优的码本向量被用作改善的用于表示特征向量的码向量。如容易地从此处描述的实施例中看出,通过根据本发明的方法能够避免码本中的穷尽搜索;然而,通过寻找改善的码向量能够达到编码准确性的显著改善。通过图1中所示的邻向量表的特殊结构,现在需要^2048的表大小而不是NB_NN*2048的表大小,由此能够节省存储空间。邻向量的表(邻向量表)优选是通过处理最大的邻向量表(“max-next-neighbourtable(最大邻向量表)”)获得的,该最大的邻向量表包含最大数目的最近的邻向量并且优选通过稀释过程来减少。用于稀释或裁剪(“priming(裁剪)”)邻向量表的该过程优选结合根据本发明的方法使用,以避免在其中所有或许多邻向量彼此相互指向的情况。起初的邻向量表的大小(在“裁剪”前)优选为CB_DIM_H*MAX_NBR_NN,其中*表示乘积,并且MAX_NBR_NN表示最近的邻向量的预定数目。其最近的邻向量由表包含的码本向量与该码本向量的最近的邻向量之间的最大距离越大,则该数目就越大。在不预先规定这种极限的情况下,码本的所有码本向量也就是所有码本向量的最近的邻向量,这是没有意义的。在第一步骤中,将其邻向量应当包含在邻向量表中的那些码本向量记录到邻向量表的列中。对于这些码本向量中的每个码本向量,计算与所有其他码本向量的距离,并且预定数目的最近的邻向量在邻向量表中分配给每个码本向量以及记录到该表中。在此,优选根据距离尺寸对这些记录进行升序排序。在第二步骤中,为这些码本向量中的每个码本向量执行稀释过程。该过程检查邻向量表中的码本向量的单个记录(“主码向量”)的前两个最近的邻向量(“最近的码向量”)。该码本向量的最近的邻向量的这两个索引被称为父索引。对于第一父索引,通过将该父索引简单地用作邻向量表中的主索引(“主码向量”),从该表确定接下去两个最近的邻码本向量或其索引。如此找到的这两个索引被称为子索引。如果以此方式根据第一父索引确定的这两个子索引中也仅一个子索引与第二父索引一致,则从邻向量表中删除该第二父索引。相应地,如果从第二父索引推导出的两个子索引中也仅一个子索引与第一父索引一致,则删除邻向量表中的第一父索引。如果例如观察主索引123,则这根据图2示例性地示出。该索引123的父索引是码本向量索引127和125。第一父索引的子索引是索引131和124。第二父索引的子索引是索引127和126。在此情形中,从表中删去第一父索引,因为该第一父索引与第二父索引的子索引之一(即索引127)—致。删去的、也就是删除的索引优选由邻向量表中该索引最近的相邻的码本向量索引代替。优选为邻向量表的所有元素执行此过程,其中优选对记录删去的数目进行计数。随后重复此步骤直至所计数的删去数目在遍历邻向量表时等于0为止,即直至没有其他删除出现。用语音信号的实验调查已得出,根据本发明的方法能够在语音编码时导致准确性的显著改善。对于邻向量集合的大小NB_NN的不同值,与标准搜索或全搜索相比,下表示出根据本发明的搜索的相应覆盖和复杂度权利要求1.一种用于尤其与待传输或待存储的信号的数据压缩有关的特征向量的向量量化的方法,所述信号尤其是语音信号或视频信号,在所述方法中,通过在搜索期间检验一系列码本向量是否适用于表示所述特征向量,搜寻由多个码本向量构成的至少一个码本以寻找表示所述特征向量的码向量,其特征在于,所述方法包括以下步骤a)针对在搜索所述码向量的过程中有可能要检验的至少一个码本向量,在所述搜索开始之前确定邻向量集合;b)对所述码向量的搜索至少延伸到所述邻向量的子集。2.根据权利要求1所述的方法,其中借助邻向量表确定码本向量的邻向量集合,向所述至少一个码本的多个码本向量中的每个码本向量分配多个最近的邻向量,所通过的方式是,从其邻向量集合应当被确定且作为起始向量被记录到所述邻向量集合中的码本向量出发,将所述邻向量集合中每个已存在记录的各个最近的邻向量序列在邻向量一侧记录到所述邻向量集合中,直至不再添加新的记录或者直至因为所述邻向量集合中的邻向量的数目已达到预定极限而中断记录。3.根据权利要求2所述的方法,其中确定码本向量的邻向量表,所通过的是首先针对所述至少一个码本的码本向量的至少一个子集优选通过各个距离的确定来确定多个最近的邻向量并且通过以下步骤的迭代修改如此获得的邻向量表c)针对所述邻向量表中的一个码本向量,确定其两个最近的邻向量;这两个最近的邻向量构成该码本向量的父向量;d)针对所述第一父向量,从所述邻向量表中确定两个最近的邻向量;这两个最近的邻向量构成所述第一父向量的子向量;e)如果所述第一父向量的两个子向量之一与所述第二父向量一致,则将所述第二父向量从所述邻向量表中删去并且由所述邻向量表中与其最近的邻向量代替;f)针对所述第二父向量,从所述邻向量表中确定两个最近的邻向量;这两个最近的邻向量构成所述第二父向量的子向量;g)如果所述第二父向量的两个子向量之一与所述第一父向量一致,则将所述第一父向量从所述邻向量表中删去并且由所述邻向量表中与其最近的邻向量代替。4.一种将根据上述权利要求之一所述的方法用于减少与用于语音编码或用于视频编码的方法相关联的编码误差的程度的应用。全文摘要在一种用于尤其与待传输或待存储的信号的数据压缩相关的特征向量的向量量化的方法中,该信号尤其是语音信号或视频信号,搜寻由多个码本向量构成的至少一个码本以寻找表示特征向量的码向量。在搜索期间,检验一系列码本向量是否适用于表示特征向量。为此,针对在搜索码向量的过程中有可能要检验的至少一个码本向量,优选在搜索开始之前确定邻向量集合。对码向量的搜索至少延伸到邻向量的子集。文档编号H04N7/28GK102474267SQ201080029964公开日2012年5月23日申请日期2010年6月30日优先权日2009年7月2日发明者塞蒂亚万P.,尚德尔S.申请人:西门子企业通讯有限责任两合公司