基于上下文的算术解码设备和方法
【专利说明】
[00011 本申请是申请日为2010年6月18日、申请号为201080027852.X、题为"基于上下文 的算术编码设备和方法以及基于上下文的算术解码设备和方法"的专利申请的分案申请。
技术领域
[0002] -个或多个实施例涉及一种音频信号的编码和解码方法,更具体地说,涉及一种 无损编码和解码方法。
【背景技术】
[0003]通常可在频域中执行音频信号的编码和解码。作为代表性示例,可给出高级音频 编码(AACKAAC编解码器可执行改进离散余弦变换(MDCT)用于变换到频域中,并考虑到心 理学声音使用信号的掩蔽程度来执行频谱量化。为了进一步压缩执行量化的结果,可采用 无损压缩方案,可在AAC中使用霍夫曼编码。作为无损压缩方案,可使用位片算术编码 (BSAC)编解码器,在位片算术编码(BSAC)编解码器中,可应用算术编码而不应用霍夫曼编 码。
[0004]通常可在时域中执行语音信号的编码和解码。大多数语音编解码器在时域中的压 缩可涉及码激励线性预测(CELPhCELP可以是语音编码技术,并且广泛使用的G. 729、自适 应多速率宽带(AMR-WB)、互联网低比特率编解码器(iLBC)、增强型可变速率编解码器 (EVRC)等可以是基于CELP的语音编码器。可在使用线性预测来获得语音信号的假设下,开 发这些编码方案。在对语音进行编码中,可能需要线性预测系数和激励信号。通常,可使用 线谱对(LSP)来对线性预测系数进行编码,并且可使用若干码本对激励信号进行编码。作为 基于CELP开发的编码方案的示例,可给出代数码激励线性预测(ACELP)编码方案、共辄结构 码激励线性预测(CS-CELP)编码方案等。
[0005]由于考虑到数据速率和心理学声音的限制的低频段和高频段之间的敏感性的差 异,因此低频段可对语音/音乐频率的精细结构敏感,而高频段可对精细结构更不敏感。因 此,低频段可应用大量比特来对精细结构进行精确编码,而高频段可应用更少量比特来对 精细结构进行编码。在这种情况下,低频段可采用使用AAC编解码器的编码方案,而高频段 可采用使用能量信息和调整信息的编码方案(被称为频带复制(SBR)技术hSBR可复制正交 镜像滤波器(QMF)域中的低频信号以产生高频信号。
[0006]即使在立体声信号中,也可应用减少使用的比特的数量的方案。更具体地说,可在 将立体声信号转换为单声道信号之后提取指示立体声信息的参数,可发送通过对立体声参 数和单声道信号进行压缩而获得的数据,并且可在解码器中使用发送的参数对立体声信号 进行解码。作为对立体声信息进行压缩的方案,可使用参数立体声(PS)技术,作为提取多声 道信号以及立体声信号的参数并发送提取的信号的方案,可使用运动图像专家组(MPEG)环 绕声技术。
[0007]此外,更具体地说,考虑到上述的无损编码的对象,可当被量化的频谱的量化索引 被假设为一个码元时,执行无损编码。此外,可以这样的方式执行无损编码:被量化的频谱 的索引被映射到位平面上以打包(bundle)比特。
[0008] 在执行基于上下文的无损编码的情况下,可使用关于先前帧的信息来执行无损编 码。
【发明内容】
[0009] 根据一个或多个实施例的一方面,可提供了一种基于上下文的算术编码设备,所 述设备包括:N元组上下文确定单元,确定将被编码的当前N元组的上下文;转义码编码单 元,基于当前N元组的上下文,对转义码执行编码;最高有效位(MSB)上下文确定单元,确定 与当前N元组的MSB码元相应的MSB上下文;概率模型映射单元,使用当前N元组的上下文和 MSB上下文来确定概率模型;MSB编码单元,基于确定的概率模型来对MSB执行编码;最低有 效位(LSB)编码单元,基于从对转义码进行编码而得到的LSB的比特深度,对LSB执行编码。
[0010] 所述设备还包括:上下文重设单元,当当前帧是重设帧时,执行上下文重设;上下 文映射单元,当当前帧不是重设帧时,在当前帧的长度和先前帧的长度之间映射上下文以 映射频率索引。
[0011] 所述设备还包括:上下文模式编码单元,当MSB被编码时,对来自将被使用的多个 MSB上下文的单个上下文模式执行编码。
[0012] 根据一个或多个实施例的另一方面,可提供一种基于上下文的算术解码设备,所 述设备包括:N元组上下文确定单元,确定将被解码的当前N元组的上下文;转义码解码单 元,基于当前N元组的上下文,对转义码执行解码;MSB上下文确定单元,确定与当前N元组的 MSB码元相应的MSB上下文;概率模型映射单元,使用当前N元组的上下文和MSB上下文来确 定概率模型;MSB解码单元,基于确定的概率模型来对MSB执行解码;LSB解码单元,基于从对 转义码进行解码而得到的LSB的比特深度,对LSB执行解码。
[0013] 所述设备可还包括:上下文重设单元,当当前帧是重设帧时,执行上下文重设;上 下文映射单元,当当前帧不是重设帧时,在当前帧的长度和先前帧的长度之间映射上下文 以映射频率索引。
[0014] 所述设备还可包括:上下文模式解码单元,当MSB被解码时,对来自将被使用的多 个MSB上下文的单个上下文模式执行解码。
[0015] 根据一个或多个实施例的另一方面,可提供一种基于上下文的算术解码方法,所 述方法包括:使用基于与将被解码的当前N元组邻近的邻近N元组的N元组上下文,对当前N 元组的MSB执行解码;使用基于MSB的符号信息的LSB上下文,对当前N元组的LSB执行解码。
[0016] 根据一个或多个实施例的另一方面,可提供一种基于上下文的算术解码方法,所 述方法包括:使用基于与将被解码的当前N元组邻近的邻近N元组的N元组上下文,对当前N 元组的MSB执行解码;使用基于MSB的符号信息和LSB的比特深度的LSB上下文,对当前N元组 的LSB执行解码。
[0017] 根据一个或多个实施例的另一方面,可提供一种基于上下文的算术解码方法,所 述方法包括:根据N元组上下文是否在特定子集状态,使用以下项之一来对将被解码的当前 N元组的MSB执行解码:(1)基于与当前N元组邻近的邻近N元组的N元组上下文和(2)N元组上 下文和附加上下文;使用基于MSB的符号信息的LSB上下文,对当前N元组的LSB执行解码。
[0018] 根据一个或多个实施例的另一方面,可提供一种基于上下文的算术解码方法,所 述方法包括:根据N元组上下文是否在特定状态,使用以下项之一来对将被解码的当前N元 组的MSB执行解码:(1)基于与当前N元组邻近的邻近N元组的N元组上下文和(2)N元组上下 文和附加上下文;使用基于MSB的符号信息和LSB的比特深度的LSB上下文,对当前N元组的 LSB执行解码。
[0019] 根据一个或多个实施例的另一方面,可提供一种基于上下文的算术解码方法,所 述方法包括:对将被解码的当前N元组的上下文模板执行解码;确定当前N元组的N元组上下 文;基于N元组上下文,对转义码执行解码;基于解码的上下文模板,确定与当前N元组的MSB 码元相应的MSB上下文;使用N元组上下文和MSB上下文确定概率模型;基于确定的概率模 型,对MSB执行解码;基于从对转义码进行解码而得到的LSB的比特深度,对LSB执行解码。
[0020] 根据一个或多个实施例的另一方面,可提供一种基于上下文的算术解码方法,所 述方法包括:使用基于与将被解码的当前1元组邻近的邻近1元组的1元组上下文,对当前1 元组的MSB执行解码;当MSB被解码时,使用用于执行当前1元组的lev0估计的邻近1元组中 的每一个的绝对值,执行1evO估计;对当前1元组的LSB执行解码。
[0021] 根据一个或多个实施例的另一方面,可提供一种基于上下文的算术解码方法,所 述方法包括:使用基于与将被解码的当前2元组邻近的邻近2元组的2元组上下文以及附加 上下文中的至少一个,对当前2元组的MSB执行解码;当当前2元组的MSB被解码时,对当前2 元组的LSB执行解码。
[0022] 根据一个或多个实施例的另一方面,提供了至少一个计算机可读介质,所述介质 存储用于实现一个或多个实施例的方法的计算机可读指令。
[0023] 实施例的另外方面将在下面的描述中部分地阐明,并且从描述中部分是清楚的, 或者通过本公开的实施可以被理解。
[0024] 根据实施例,可提高编码效率并可减少需要的存储空间。
【附图说明】
[0025] 从以下结合附图进行的对实施例的描述中,这些和/或其它方面将变得明显,并更 易于理解,其中:
[0026] 图1示出联合语音和音频编码(USAC)编码器;
[0027] 图2详细示出根据实施例的算术编码设备的第一示例的配置;
[0028] 图3详细示出根据实施例的算术解码设备的第一示例的配置;
[0029]图4是用于描述根据实施例的N元组(N-tuple)、最高有效位(MSB)和最低有效位 (LSB)的示图;
[0030]图5示出根据实施例的上下文和概率模型;
[0031 ]图6是示出根据实施例的MSB解码方法的第一示例的流程图;
[0032] 图7是示出根据实施例的LSB解码方法的第一示例的流程图;
[0033] 图8是示出根据实施例的使用符号分类的MSB解码方法的流程图;
[0034] 图9是示出根据实施例的使用线谱频率(LSF)的编码方法和解码方法中的每种的 流程图;
[0035] 图10详细示出根据实施例的算术编码设备的第二示例的配置;
[0036] 图11详细示出根据实施例的算术解码设备的第二示例的配置;
[0037] 图12示出根据另一实施例的上下文和概率模型;
[0038] 图13示出根据实施例的MSB解码方法的第二示例;
[0039] 图14示出根据实施例的LSB解码方法的第二示例;
[0040] 图15示出根据实施例的上下文模式;
[0041] 图16是示出根据实施例的针对N元组的基于上下文的算术解码方法的流程图;
[0042] 图17是示出根据实施例的针对N元组的基于上下文的算术编码方法的流程图; [0043]图18示出根据实施例的执行上下文模式的示例;
[0044]图19详细示出根据实施例的算术编码设备的第三示例的配置;
[0045]图20详细示出根据实施例的算术解码设备的第三示例的配置;
[0046] 图21示出根据实施例的1元组、MSB和LSB;
[0047] 图22示出根据实施例的上下文模板的示例;
[0048]图23示出根据实施例的频谱无噪声编码的处理;
[0049] 图24是示出根据实施例的针对1元组的基于上下文的算术解码方法的流程图;
[0050] 图25示出根据实施例的针对2元组的上下文模板;
[0051] 图26详细示出根据实施例的算术编码设备的第四示例的配置;
[0052] 图27详细示出根据实施例的算术解码设备的第四示例的配置;
[0053]图28是示出根据实施例的针对2元组的基于上下文的算术解码方法的流程图; [0054]图29是用于描述根据实施例的针对2元组执行算术编码和解码的处理的示图。
【具体实施方式】
[0055] 现在将详细参照实施例,实施例的示例在附图中示出,其中,相同的标号始终表示 相同的元件。以下通过参照附图描述实施例以解释本公开。
[0056] 图1A示出联合语音和音频编码(USAC)编码器,图1B示出USAC解码器。
[0057]运动图像专家组(MPEG)-D USAC可简要地包括三种操作模式。第一,在立体声信号 模式下,可使用MPEG环绕声来将立体声信号表示为参数,可在高频段中采用增强型频带复 制(eSBR),可在低频段中使用核编码方案。第二,在立体声信号模式下,可针对高频段中的 两个声道采用eSBR,可在所述两个声道的低频段中使用核编码方案。第三,在单声道信号模 式下,可使用eSBR对高频段进行编码,可使用核编码方案对低频信号进行编码。
[0058]核编码方案包括两种模式。在频域(FD)中,可使用改进离散余弦变换(MDCT)来将 适合于编码器的信号变换到频域,可对变换的信号执行编码,可使用加权LP变换编码 (wLPT)方案或代数码激励线性预测(ACELP)方案来对不适合于编码器的信号执行编码。在 wLPT方案的情况下,可使用MDCT将加权LP信号变换到频域以对变换的信号执行编码。可对 使用MDCT被变换的两种模式的信号执行量化,从而提取量化谱,可对量化谱执行算术编码, 从而执行无损编码。USAC解码器的解码可针对USAC编码器的编码反向地执行解码。
[0059] 低频段中的USAC编码器和USAC解码器可选择ro编码模式和线性预测域(Lro)编码 模式之一来对信号执行编码或解码。
[0060] 在这种情况下,针对FD,USAC编码器和USAC解码器可在MDCT域中对频谱执行量化 或无噪声编码。针对LPD,USAC编码器和USAC解码器可根据ACELP方案或wLPT方案来选择性 地执行编码或解码。
[0061] 在这种情况下,USAC编码器和USAC解码器可根据ACELP方案,通过线性预测(LP)、 自适应码本和固定码本之一,来执行编码和解码。USAC编码器和USAC解码器可根据wLPT方 案,使用MDCT将加权LP残留信号变换到频域,并对变换的信号执行量化和无噪声编码以执 行编码和解码。
[0062] 在高频段中,USAC编码器可通过eSBR使用参数对高频信号执行编码。随后,USAC解 码器可对编码的信号执行解码,并基于解码的信号产生高频信号。
[0063]USAC编码器可通过使用Mpeg环绕声(MPS)将立体声信息表示为参数来执行编码,USAC解码器可基于解码的信息产生立体声信号。
[0064] 将详细描述的实施例可涉及在USAC编码器和USAC解码器中执行的无噪声编码,更 具体地说,涉及对通过ro方案或WLPT方案量化的谱数据执行的无损编码和解码。算术编码 设备100可在USAC编码器中执行基于上下文的算术编码,算术解码设备101可在USAC解码器 中执行基于上下文的算术解码。
[0065]图2详细示出根据实施例的算术编码设备100(第一示例)的第一示例的配置。
[0066] 算术编码设备100包括上下文重设单元201、上下文映射单元202、N元组上下文确 定单元203、最高有效位(MSB)上下文确定单元204、转义码编码单元205、概率映射单元206、 MSB编码单元207、最低有效位(LSB)编码单元208和上下文更新单元209。根据实施例,可不 包括转义码编码单元205。
[0067] 这里,可以按照帧单位操作上下文重设单元201和上下文映射单元202,可以按照 帧中的频率单位操作N元组上下文确定单元203、MSB上下文确定单元204、转义码编码单元 205、概率映射单元206、MSB编码单元207和LSB编码单元208。具体地,算术编码设备100可通 过增加频率索引对同一帧执行编码。
[0068]当将被编码的当前帧是重设帧时,上下文重设单元201可将先前帧的频谱初始化 为"0"。在当前帧不是重设帧时,上下文映射单元202可在当前帧的频谱长度与先前帧的频 谱长度不同的情况下,将先前帧的长度对齐为当前帧的长度。
[0069]N元组上下文确定单元203可使用与将被编码的当前N元组210(4元组)邻近的邻近N元组211、212、213和214的量化谱值,来确定关于当前~元组210的上下文。可通过已编码的 四个邻近N元组211、212、213和214来对当前~元组210进行编码。
[0070]这里,N元组可表示这样的集合,在所述集合中,按照以频率递增顺序的连续的N个 频谱为单位打包量化频谱。这里,N可不限于特定数字,并可基于系统的配置而改变。N元组 可被配置为按照任意数字"N"为单位打包量化频谱的集合,并表示构成该集合的量化频谱 的数量。"N"可以是正整数。例如,N元组可被用作4元组,也就是说,以四个频谱为单位打包 量化频谱的集合。根据实施例,描述了 "N"为4的情况,然而,N不限于特定数字。将参照图4进 一步描述N元组。
[0071] N元组上下文确定单元203可执行缩减,直到关于当前N元组210的邻近N元组212和 214中的每一个的量化谱值在-4到3的范围中。随后,N元组上下文确定单元203可基于执行 缩减的次数来估计lev0,S卩,初始LSB比特深度。将参照图4描述等级。
[0072] 此外,N元组上下文确定单元203可通过执行按lev0的缩减来提取MSB,重复地执 行缩减,直到提取的MSB具有范围从-4到3的值。
[0073]MSB上下文确定单元204可针对将被编码的MSB,从当前N元组210的邻近N元组212 和214确定MSB上下文。具体地,MSB上下文确定单元204可针对将被编码的MSB,将与先前帧 的频率相同的频率的MSB和当前帧的先前频率的MSB确定为MSB上下文。
[0074]转义码编码单元205可使用基于关于当前N元组210的上下文的概率模型对转义码 执行编码。
[0075]概率映射单元206可使用当前N元组的上下文和MSB上下文来映射最终概率模型。[0076] MSB编码单元207可使用当前N元组210的上下文和MSB上下文来对当前N元组210的 MSB顺序地执行算术编码。
[0077] LSB编码单元208可以按照比特单元对LSB执行算术编码,直到与等级相应的比特 深度。
[0078] 上下文更新单元209可更新量化样本以对下一N元组进行编码。随后,MSB上下文确 定单元204可针对所述下一N元组,使用更新的量化样本来确定MSB上下文。
[0079]图3详细示出根据实施例的算术解码设备101的第一示例的配置。
[0080] 算术解码单元101包括上下文重设单元301、上下文映射单元302、N元组上下文确 定单元303、上下文确定单元304、转义码解码单元305、概率映射单元306、MSB解码单元307、 LSB解码单元308、量化样本产生单元309和上下文更新单元310。
[00811可以按照帧单位操作上下文重设逆时针301和上下文映射单元303,可以按照帧中 的频率单位操作N元组上下文确定单元303、MSB上下文确定单元304、转义码解码单元305、 概率映射单元306、MSB解码单元307、LSB解码单元308。具体地,算术解码设备101可通过增 加频率索引对同一帧执行解码。
[0082]当将被解码的当前帧是重设帧时,上下文重设单元301可将先前帧的频谱初始化 为"0"。当当前帧不是重设帧时,上下文映射单元303可在当前帧的频谱长度与先前帧的频 谱长度不同的情况下,将先前帧的长度对齐为当前帧的长度。
[0083] N元组上下文确定单元203可通过使用与将被编码的当前N元组311(4元组)邻近的 邻近N元组312、313、314和315的量化的谱值,来确定当前N元组311的上下文。可通过已解码 的四个邻近N元组312、313、314和315来对当前N元组311进行解码。将参照图4进一步描述N 元组。
[0084] N元组上下文确定单元303可执行缩减,直到关于当前N元组311的邻近N元组313和 315中的每一个的量化的谱值在-4到3的范围中。随后,N元组上下文确定单元303可基于执 行缩减的次数来估计lev0,S卩,初始LSB比特深度。将参照图4进一步描述等级。
[0085] MSB上下文确定单元304可基于解码的MSB来确定将被用作上下文的MSB。
[0086] 转义码编码单元305可使用基于N元组上下文确定单元303