音频编码器和解码器的制造方法
【专利说明】
[0001] 相关申请的交叉引用
[0002] 本申请要求2013年5月24日提交的美国临时专利申请No. 61/827264的申请日 的权益,其内容通过引用并入于此。
技术领域
[0003] 本公开一般设及音频编码。特别地,它设及在音频编码系统中对参数向量的编码 和解码。本公开还设及在音频解码系统中重构音频对象的方法和装置。
【背景技术】
[0004] 在传统音频系统中,采用基于声道的方法。每个声道例如可W表示一个扬声器或 者一个扬声器阵列的内容。对于运种系统,可能的编码方案包括离散多声道编码或者诸如 MPEG环绕之类的参数编码。
[0005] 近来,已经开发出一种新的方法。该方法是基于对象的。在采用基于对象的方法 的系统中,=维音频场景由音频对象及其相关联的位置元数据来表示。在音频信号的回放 期间,运些音频对象在=维音频场景中四处移动。该系统还可W包括所谓的床声道化ed channel),所述床声道可W被描述为直接映射到例如上述传统音频系统的扬声器位置的静 止音频对象。
[0006] 在基于对象的音频系统中可能出现的问题是如何高效地对音频信号进行编码和 解码W及保持编码信号的质量。可能的编码方案包括:在编码器侧,根据音频对象和床声道 来创建包括许多声道的下混信号W及使得能够在解码器侧重建音频对象和床声道的辅助 信息。
[0007]MPEG空间音频对象编码(MPEGSA0C)描述了一种用于对音频对象进行参数编码 的系统。该系统发送用于上混矩阵的辅助信息,其借助于诸如对象的电平差和互相关性之 类的参数来描述对象的属性。运些参数然后在解码器侧被用来控制音频对象的重建。该过 程在数学上是复杂的,并且常常必须依赖于关于没有由参数明确描述的音频对象的属性的 假设。在MPEGSA0C中提出的方法可W降低基于对象的音频系统所需的比特率,但是可能 还需要改进W进一步提高如上所述的效率和质量。
【附图说明】
[000引现在将参考附图来描述示例性实施例,其中:
[0009]图1是根据示例性实施例的音频编码系统的概括框图;
[0010] 图2是图1中所示的示例性上混矩阵编码器的概括框图;
[0011] 图3示出了参数向量中与由图1的音频编码系统确定的上混矩阵中的元素对应的 第一元素的示例性概率分布;
[0012] 图4示出了参数向量中与由图1的音频编码系统确定的上混矩阵中的元素对应的 至少一个经取模差分编码的(mo化1〇differentialcoded)第二元素的示例性概率分布;
[0013] 图5是根据示例性实施例的音频解码系统的概括框图;
[0014] 图6是图5中所示的上混矩阵解码器的概括框图;
[0015] 图7描述了参数向量中与由图1的音频编码系统确定的上混矩阵中的元素对应的 第二元素的编码方法;
[0016] 图8描述了参数向量中与由图1的音频编码系统确定的上混矩阵中的元素对应的 第一元素的编码方法;
[0017] 图9描述了用于示例性参数向量中的第二元素的图7的编码方法的部分;
[0018] 图10描述了用于示例性参数向量中的第一元素的图8的编码方法的部分;
[0019] 图11是图1中所示的第二示例性上混矩阵编码器的概括框图;
[0020] 图12是根据示例性实施例的音频解码系统的概括框图;
[0021] 图13描述了用于对上混矩阵的行进行稀疏编码(sparseencoding)的编码方法;
[0022] 图14描述了用于上混矩阵的示例性行的图10的编码方法的部分;
[0023] 图15描述了用于上混矩阵的示例性行的图10的编码方法的部分;
[0024] 所有图都是示意性的,并且一般只显示对于阐明本公开所必要的部分,而其它部 分可能被省略或者仅作暗示。除非另外指出,否则在不同附图中相同的附图标记指代相同 的部分。
【具体实施方式】
[00巧]鉴于W上所述,一个目标是提高编码音频信号的效率和质量的编码器、解码器W及相关联的方法。
[002引I.概述-编码器
[0027] 根据第一方面,示例性实施例提出了用于编码的编码方法、编码器和计算机程序 产品。所提出的方法、编码器和计算机程序产品一般可W具有相同的特征和优点。
[0028] 根据示例性实施例,提供一种用于在音频编码系统中对参数向量进行编码的方 法,每个参数对应于非周期量,向量具有第一元素和至少一个第二元素,该方法包括:通过 可取N个值的索引值来表示向量中的每个参数;使所述至少一个第二元素中的每一个与符 号相关联,其中符号是如下计算的:计算第二元素的索引值与向量中它前面的元素的索引 值之间的差;对差应用模N运算。该方法还包括如下步骤:通过基于包含符号概率的概率表 对与所述至少一个第二元素相关联的符号进行赌编码来对所述至少一个第二元素中的每 一个进行编码。
[0029] 该方法的优点是与不对差应用模N运算的传统差值编码策略相比,可能的符号的 数量减少了大约一半。因此,概率表的大小减少了大约一半。结果,存储概率表需要更少的 存储器,并且由于概率表通常存储于编码器中的昂贵存储器中,所此方式编码器可W 变得更便宜。另外,可W提高在概率表中查找符号的速度。另外的优点是:由于概率表中的 所有符号都是与特定的第二元素相关联的可能的候选,所W编码效率可W提高。与之相比, 对于传统的差值编码策略,在概率表中只有大约一半的符号是与特定的第二元素相关联的 候选。
[0030] 根据实施例,该方法还包括使向量中的第一元素与符号关联,符号是运样计算的: 按偏移值使表示向量中的第一元素的索引值移位;对经移位的索引值应用模N运算。该方 法还包括如下步骤:通过使用用于对至少一个第二元素进行编码的相同的概率表对与第一 元素相关联的符号进行赌编码来对第一元素进行编码。
[0031] 该实施例利用了如下事实:第一元素的索引值的概率分布与所述至少一个第二元 素的符号的概率分布相似,虽然按偏移值相对于彼此移位。因此,对于向量中的第一元素, 可W使用相同的概率表,而非专用的概率表。根据W上,运可W导致降低存储器需求和更便 宜的编码器。
[0032] 根据实施例,偏移值等于第一元素的最可能的索引值与概率表中所述至少一个第 二元素的最可能的符号之间的差。运意味着概率分布的峰值是对齐的。因此,对于第一元 素,相比于为第一元素使用专用的概率表,保持了基本上相同的编码效率。
[0033] 根据实施例,参数向量的第一元素和所述至少一个第二元素在特定的时间帖对应 于在音频编码系统中使用的不同频带。运意味着与多个频带对应的数据可W在同一个操作 中被编码。例如,参数向量可W对应于随多个频带变化的上混或重构系数。
[0034] 根据实施例,参数向量的第一元素和所述至少一个第二元素在特定的频带对应于 在音频编码系统中使用的不同时间帖。运意味着与多个时间帖对应的数据可W在同一个操 作中被编码。例如,参数向量可W对应于随多个时间帖变化的上混或重构系数。
[0035] 根据实施例,概率表被转译成哈夫曼码书,其中与向量中的元素相关联的符号被 用作码书索引,并且其中编码步骤包括通过用码书中按与第二元素关联的码书索引进行索 引的码字表示第二元素,来对所述至少一个第二元素中的每一个进行编码。通过使用符号 作为码书索引,可W提高查找用于表示元素的码字的速度。
[0036] 根据实施例,编码步骤包括通过用哈夫曼码书中按与第一元素关联的码书索引进 行索引的码字表示第一元素,使用用于对所述至少一个第二元素进行编码的相同的哈夫曼 码书,对向量中的第一元素进行编码。因此,在编码器的存储器中只需存储一个哈夫曼码 书,根据W上,运可W导致更便宜的编码器。
[0037] 根据另一个实施例,参数向量对应于由音频编码系统确定的上混矩阵中的元素。 运可W减少在音频编码/解码系统中所需要的比特率,因为上混矩阵可W被高效地编码。
[0038] 根据示例性实施例,提供一种包含计算机代码指令的计算机可读介质,当所述计 算机代码指令在具有处理能力的设备上执行时适于执行第一方面的任何方法。
[0039] 根据示例性实施例,提供一种用于在音频编码系统中对参数向量进行编码的编码 器,每个参数对应于非周期量,向量具有第一元素和至少一个第二元素,该编码器包括:接 收组件,适于接收所述向量;索引组件,适于用可取N个值的索引值来表示向量中的每个参 数;关联组件,适于使所述至少一个第二元素中的每一个与符号关联,其中符号是运样计算 的:计算第二元素的索引值与向量中它前面的元素的索引值之间的差;对差应用模N运算。 该编码器还包括编码组件,用于通过基于包含符号概率的概率表对与所述至少一个第二元 素关联的符号进行赌编码来对所述至少一个第二元素中的每一个进行编码。
[0040] II.概述-解码器
[0041] 根据第二方面,示例性实施例提出了用于解码的解码方法、解码器和计算机程序 产品。所提出的方法、解码器和计算机程序产品一般可W具有相同的特征和优点。
[0042] 关于在上面编码器的概述中所呈现的特征和设置的优点对于解码器的相应特征 和设置一般也可W是有效的。
[0043] 根据示例性实施例,提供一种用于在音频解码系统中将经赌编码的符号的向量解 码成与非周期量有关的参数向量的方法,经赌编码的符号的向量包含第一经赌编码的符号 和至少一个第二经赌编码的符号,并且参数向量包含第一元素和至少一个第二元素,该方 法包括:通过使用概率表W可取N个整数值的符号来表示经赌编码的符号的向量中的每个 经赌编码的符号;使第一经赌编码的符号与索引值相关联;使所述至少一个第二经赌编码 的符号中的每一个与索引值相关联,所述至少一个第二经赌编码的符号的索引值是运样计 算的:计算与在经赌编码的符号的向量中第二经赌编码的符号前面的经赌编码的符号相关 联的索引值和表示第二经赌编码的符号的符号的和;对该和应用模N运算。该方法还包括 如下步骤:W对应于与所述至少一个第二经赌编码的符号相关联的索引值的参数值表示参 数向量的所述至少一个第二元素。
[0044] 根据示例性实施例,对于经赌编码的符号的向量中的所有经赌编码的符号,使用 相同的概率表来执行W符号表示经赌编码的符号的向量中的每个经赌编码的符号的步骤, 其中与第一经赌编码的符号相关联的索引值是运样计算的:按偏移值对表示经赌编码的符 号的向量中的第一经赌编码的符号的符号进行移位;对移位后的符号应用模N运算。该方 法还包括如下步骤:用对应于与第一经赌编码的符号相关联的索引值的参数值来表示参数 向量的第一元素。
[0045] 根据实施例,概率表被转译成哈夫曼码书并且每个经赌编码的符号对应于哈夫曼 码书中的码字。
[0046] 根据另外的实施例,哈夫曼码书中的每个码字与码书索引相关联,并且W符号表 示经赌编码的符号的向量中的每个经赌编码的符号的步骤包括用与对应于经赌编码的符 号的码字相关联的码书索引来表示经赌编码的符号。
[0047] 根据实施例,经赌编码的符号的向量中的每个经赌编码的符号在特定的时间帖对 应于在音频解码系统中使用的不同频带。
[0048] 根据实施例,经赌编码的符号的向量中的每个经赌编码的符号在特定的频带对应 于在音频解码系统中使用的不同时间帖。
[0049] 根据实施例,参数向量对应于由音频解码系统使用的上混矩阵中的元素。
[0050] 根据示例性实施例,提供一种包含计算机代码指令的计算机可读介质,所述计算 机代码指令当在具有处理能力的设备上执行时适于执行第二方面的任何方法。
[0051] 根据示例性实施例,提供一种用于在音频解码系统中将经赌编码的符号的向量解