音频压缩的利记博彩app

文档序号:2829289阅读:343来源:国知局
专利名称:音频压缩的利记博彩app
技术领域
本申请总体上涉及音频压缩。
背景技术
音频压缩通常在用于存储或传输数字音频信号的现代消费者设 备中使用。消费者设备可以是电信设备、视频设备、音频播放器、 无线电设备和其它消费型设备。较高的压缩比能够支持更好的存储 能力,或者经由通信信道的更高效传输,其中通信信道即无线通信 信道或者有线通信信道。但是同时,对应于压缩比,还应当将压缩 信号的质量保持在较高的水平。音频编码的目标通常在于,将涉及 给定压缩比即比特率的音频质量最大化。
在过去几十年中,已经研发出了众多音频编码技术。高级音频 编码系统有效地利用了人耳的性质。主要思想在于,可以将编码噪 声置于对感官质量影响最小的信号区域中,使得可以在未引入听觉 失真的前提下减小数据速率。因此,心理声学理论是现代音频编码 的重要部分。
在公知的音频编码器中,输入信号被分为有限数量的子频带。
每个子频带信号都可以量化。根据心理声学理论,公知的是频谱 中的最高频率在感知上没有低频重要。通过将与低频子频带相比而 言较少的比特分配给高频子频带的量化,这可以在某种程度上在编 码器中加以考虑。
更复杂的音频编码利用了这样的事实,即,在大部分情况下, 音频信号的低频区域和高频区域之间存在很大的相关性,即频谱较 高的那半部分通常与其较低的那半部分相当类似。低频区域可以被 认为是声谱的低半部分,而高频可以被认为是声谱的高半部分。应当理解,低频和高频的边界并不固定,而是可以在2kHz到15kHz 之间,甚至可以超越这些边界。
频带复制编码(SBR )是当前公知的对高频区域进行编码的方法。 此技术在以下文章中进行了描述2002年5月在德国慕尼黑举行的 第112届AES大会上M.Dietz, L丄iljeryd、 K. Kj6rling和O.Kunz的 "Spectral Band Replication, a novel approach in audio coding", 以及 2002年11月在比利时鲁汶举行的第一届IEEE Benelux Workshop on Model Based Processing and Coding of Audio 上 P.Ekstrand 的 "Bandwidth extension of audio signals by spectral band replication"。 所 描述的方法可以应用到普通音频编码器中,诸如,例如AAC或 MPEG-l层III (MP3)编码器,以及其它多种代表本领域技术发展 水平的编码器。
根据现有技术的方法的缺点在于仅仅将低频带调换到高频带 可能导致原始高频带与利用被调换的低频对其的重建之间不相似。 另 一 缺点在于,需要使用公知方法将噪声和正弦波添加到频谱中。
因此,本申请的目标在于提供一种改进的音频编码技术。本申 请的进一步目的在于提供一种编码技术,其更正确地表示输入信号, 同时具有合理低的比特速率。

发明内容
为了克服上述缺点,根据一个方面,本申请提供了一种用于编 码音频信号的方法,包括接收输入音频信号,将该音频信号至少 划分为低频带和高频带,将该高频带至少划分为两个高频子频带信 号,在该低频带信号部分内确定哪个与高频子频带信号最匹配,以 及产生至少涉及与高频带子频带信号最匹配的低频带信号部分的参 数。
本申请提供了 一种对输入信号的高频区域进行编码的新方法。 输入信号可以被划分为时间上连续的帧。每个帧都表示输入信号的 时间实例。在每个帧中,输入信号都可以由其频谱成分来表示。频谱成分或者采样表示输入信号内的频率。
本申请不是盲目地将低频区域调换到高频,而是将原始高频频
谱成分与编码后的高频频镨成分之间的相似性最大化。根据本申请, 高频区域是使用信号已经编码过的低频区域来形成的。
通过比较低频信号采样与所接收信号的高频子频带,可以在低 频中找到与实际高频子频带最匹配的信号部分。本申请提供了在整 个低频频谱中一个采样接着一个采样地搜索与高频子频带最相似的 信号部分。换言之,由于信号部分与采样序列对应,所以本申请提 供了找到与高频子频带最匹配的采样序列。此采样序列可以在低频 带中的任何位置开始,除了低频带中最后被考虑的起点应该是低频 带中的最后采样减去将被匹配的高频子频带的长度。
与实际高频子频带最匹配的低频信号部分的索引或者链接可以 用来对高频子频带进行建模。仅需要对索引或者链接进行编码并且 存储或者传输,以便允许在接收端还原对相应高频子频带的表示。
根据实施方式,在低频带中搜索最相似的匹配,即与高频子频 带最相似的信号部分频谱形状。在编码器中创建至少涉及所找至Q的 与高频子频带最相似的信号部分的参数。参数可以包括用于将所找 到部分缩放成高频带的缩放因子。在解码器侧,这些参数用来将相 应的低频信号部分调换到高频区域,以便重建高频子频带。
缩放可以使用缩放因子应用到复制的低频信号部分。根据实施 方式,只有缩放因子和到低频信号部分的链接需要编码。
当使用最匹配的低频信号部分来重现高频子频带时,与公知方 法相比,高频区域的形状能更紧密地遵循原始高频频谱。由于振幅、 形状和频率位置都与原始信号更相似,所以可以更准确地建才莫感知 上重要的频谱峰值。由于所建模的高频子频带可以与原始高频子频 带相比较,所以可以轻易地发现遗失的频谱成分,即正弦波或噪声, 然后将它们添加上。
为了得到包络形状,实施方式通过使用参数将低频信号采样调 换到高频子频带信号而提供了对低频信号部分的利用,其中参数包括缩放因子,使得所调换的低频信号部分的包络遵循所接收信号的 高频子频带信号的包络。缩放因子使得能够调节复制的低频信号部 分的能量和形状,以便更好地与实际高频子频带相匹配。
参数可以包括到低频信号部分的链接,以便根据实施方式表示 相应的高频子频带信号。链接可以是到低频信号部分的指针或者索 引。通过此信息,在构建高频子频带时,可以参考低频信号部分。
为了减小量化比特的数量,可以将高频子频带信号的包络标准 化。标准化使得低频带和高频带都在标准化的振幅范围内。这样减 小了需要用来将缩放因子量化的比特数量。用来标准化的信息必须 由编码器提供,以便在解码器中构建高频子频带的表示。实施方式 利用线性预测编码提供了包络标准化。可以利用倒谱建模来标准化 包络。倒谱建模使用信号功率频谱对数的逆傅立叶变换。
产生缩放因子可以包括,在线性域中产生缩放因子以便在频谙 中至少匹配振幅峰值。产生缩放因子还可以包括,根据实施方式, 至少在对数域中匹配频谱能量和/或形状。
实施方式提供了使用改进离散余弦变换(MDCT )在低频带中和 /或高频带中产生信号采样。MDCT变换提供了优选为实数的频谱系 数。根据实施方式的MDCT变换可以与任何适合的帧大小一起〗吏用, 尤其可以与用于普通帧的2048个采样以及用于瞬态帧的256采样的 帧大小,以及其间任意其它数值的帧大'J、 一起使用。
为了获得与相应高频子频带信号最匹配的低频信号部分,实施 方式提供了使用标准化的相关性或者Euclidian距离来计算相似性度 量。
为了编码输入信号,实施方式提供了对低频信号采样进行量化 以及至少对缩放因子进行量化。到低频信号部分的链接可以是整数。
还可以增加附加的正弦波,以便改进高频信号的质量。为了遵 从这样的正弦波,实施方式提供了将输入信号划分为时间上连续 的帧,以及在输入信号内的两个连续帧中检测有音调的部分。有音 调的部分可以通过增加附加正弦波来增强。通过增大相应高频区域中的高频子频带数量,高度有音调的部分可以另外增强。输入帧可 以划分为不同的音调组,例如,非音调、有音调和强音调。
检测有音调部分可以包括使用移位离散傅立叶变换(SDFT)。 SDFT的结果可以在编码器中利用以便提供MDCT变换。
本申请的另一方面是用于解码音频信号的方法,包括接收经 过编码的比特流,从该比特流中解码出至少低频信号和至少涉及低 频信号部分的参数,利用该低频信号的采样以及涉及该低频信号部 分的参数来重建至少两个高频子频带信号,以及输出包括至少该低 频信号和至少两个高频子频带信号的输出信号。
本申请的进一步方面是用于编码音频信号的编码器,包括接 收装置,其被布置以接收输入音频信号;滤波装置,其被布置以将 该音频信号至少划分为低频带和高频带,并进一步被布置以将该高 频带分为至少两个高频子频带信号;以及编码装置,其被布置以产 生至少涉及与该高频带子频带信号最匹配的低频带信号部分的参 数。
本申请的进一步方面是用于解码音频信号的解码器,包括接 收装置,其被布置以接收经过编码的比特流;解码装置,其被布置 以从该比特流中解码出至少低频信号和至少涉及低频信号部分的参 数;产生装置,其被布置以利用该低频信号的采样以及涉及该低频 信号部分的参数来重建至少两个高频子频带信号。
本申请的进一步方面是用于音频压缩的系统,包括所描述的解 码器和所描述的编码器。
本申请的进一步方面涉及用于编码音频信号的计算机程序产 品,该程序包括可操作以引起处理器执行以下步骤的指令接收输 入音频信号,将该音频信号至少划分为低频带和高频带、将该高频 带至少划分为两个高频子频带信号,以及产生至少涉及与高频带子 频带信号最匹配的低频带信号部分的参数。
本申请的另 一 方面是用于解码比特流的计算机程序产品,该程 序包括可操作以引起处理器执行以下步骤的指令接收经过编码的比特流,从该比特流中解码出至少低频信号和至少涉及低频信号部 分的参数,利用该低频信号的采样以及涉及该低频信号部分的参数 来重建至少两个高频子频带信号,以及输出包括至少该低频信号和 至少两个高频子频带信号的输出信号。


在附图中示出
图1是根据现有技术的编码音频信号的系统;
图2是根据现有技术的编码器;
图3是根据现有技术的解码器;
图4是SBR编码器;
图5是SBR解码器;
图6是不同阶段音频信号的频谱表示;
图7是根据第一实施方式的系统;
图8根据第二实施方式的系统;
图9是其包络标准化了的频谱;
图IO是使用音调检测的编码增强。
具体实施例方式
如图1示意性地示出,通用音频编码系统由编码器和解码器组 成。示出的编码系统2具有编码器4、存储器或者媒体信道6以及解 码器8。
编码器4压缩输入音频信号10,生成比特流12,然后该比特流 12可以被存储或者通过媒体信道6传输。可以在解码器8中接收比 特流12。解码器8解压缩比特流12并产生输出音频信号14。与输 入信号IO有关的比特流12的比特速率以及输出音频信号14的质量 是主要特征,这两个特征定义了编码系统2的性能。
现代音频編码器4的典型结构在图2中示意性示出。使用分析 滤波器组结构16将输入信号IO划分成子频带。每个子频带都可以使用心理声学模型20提供的信息在编码装置18中进行量化和编码。 编码可以是Huffman编码。量化设置和编码才几制可以由心理声学冲莫 型18规定。经过量化和编码的信息在比特流格式器22中使用,用 于创建比特流12。
比特流12可以在解码器8中解码,如图3示意性所示。解码器 8可以包括比特流解包装置24、子频带重建装置26和合成滤波器组 28。
解码器8计算编码器4的逆运算,并将比特流12变换回输出音 频信号14。在解码处理期间,在子频带重建装置26中将比特流12 去量化为子频带信号。子频带信号被馈送入合成滤波器组28,该合 成滤波器组2 8将来自子频带信号的音频信号进行合成并创建输出信 号14。
这在很多情况下都可能高效并感觉上正确地使用仅低频区域和 有限量的附加控制信息来合成高频区域。最理想地,高频部分的编 码仅需要少量控制参数。由于频谱的整个上面部分都可以使用少量 信息来合成,所以可以在总比特速率中实现相当的节约。
当前的编码,诸如MP3pro,除了心理声学编码外,通过引入SBR 编码机制来利用音频信号中的这些属性。在SBR中,可以使用已编 码的低频区域来单独产生高频区域,如图4和图5示意性所示。
图4示意性示出了编码器4。编码器4包括低通滤波装置30、 编码装置31、 SBR装置32、包络提取装置34和比特流格式器22。
低通滤波器30首先定义截止频率,该截止频率以上的输入信号 IO都被过滤掉。效果在图6a中示出。只有低于截止频率36的频率 才能通过该滤波器。
编码装置31利用32个低频子频带执行量化和Huffman编码。 低频内容在编码装置31中转换到QMF域中。基于编码器31的输出 来调换低频内容。该调换在SBR装置32中完成。低频到高频的调 换所带来的效果在图6b中示出。调换被盲目地执行,使得低频子频 带采样仅仅是复制到高频子频带采样中。在输入信号的每一帧中类似地执行、并且独立于输入信号的特征执行此操作。
在SBR装置32中,高频子频带可以基于附加信息进行调节。这 样做是为了使所合成高频区域的具体特征与原始高频区域的具体特 征更为相似。诸如正弦波或噪声的附加成分可以被添加到高频区域, 以便增大与原始高频区域的相似性。最后,在包络提取装置34中调 节包络,以便遵循原始高频频镨的包络。结果在图6c中可见,其中 高频成分被缩放为更接近于输入信号的实际高频成分。
比特流12中包括已编码的低频信号与缩放和包络调节参数。比 特流12可以在解码器中被解码,如图5示意性示出。
图5示出了解码器8,其具有解包装置24、低频解码器38、高 频重建装置40、成分调节装置42和包络调节装置44。低频子频带 在解码器38中重建。在高频重建装置40中,从低频子频带中静态 地重建出高频子频带。可以在成分调节装置42中添加正弦波并且在 包络调节装置44中调节包络。
根据本申请,从低频信号采样到高频子频带的调换是动态完成 的,例如,需要检验哪个低频信号部分与高频子频带最匹配。创建 相应低频信号部分的索引。对这个索引进行编码并在解码器中使用, 以便根据低频信号构建出高频子频带。
图7示出了编码系统,其具有编码器4和解码器8。编码器4由 高频编码装置50、低频编码器52和比特流格式器22组成。编码器 4可以是更复杂音频编码机制的一部分。本申请几乎可以在任何旨在 以低比特速率获得高质量的音频编码器中使用。例如,本申请可以 完全与实际的低比特速率音频编码器分开使用,例如,本申请可以 置于心理声学编码器(例如,AAC、 MPEG等)的前面。
由于高频区域通常包含与低频区域类似的频谱形状,所以通常 可以达到良好的编码性能。由于只需要将复制的频谱索引和缩放因 子传输至解码器,所以这可以用相对较低的总比特速率来实现。
在低频编码器22内,对低频采样x"W进行编码。在高频编码器 50中,为了编码而创建表示变换的参数"i、表示缩放的参数"2和表示包络形成的参数Z,以下对此进行更详细描述。
首先,将高频频镨划分为nb个子频带。为每个子频带从低频区 域搜索最相似匹配(即,最相似频谱形状)。
该方法可以在改进离散余弦变换(MDCT)域中进行。由于其良 好的性质(50%的覆盖以及临界采样和灵活窗口切换等),MDCT 域在最能代表本领域技术水平音频编码器中使用。MDCT变换按照
下式执行 '" wz- q
其中,x(^是输入信号,W")是长度为2W ( 0 - ic < W)的时 间分析窗口。通常,W在音频编码中是1024 (普通帧)或者128采 样(瞬态)。频谱系数X《W可以是实际数目。提及的帧大小和任何
其它的帧大小都是可行的。
为了创建对高频子频带进行描述的参数,需要找到与高频编码 器50内的高频子频带最匹配的低频信号部分。高频编码器50和低 频编码器52可以创建N个MDCT编码成分,其中x'乂"表示低频成
分,x"^)表示高频成分。
利用低频编码器52,可以对^个低频MDCT系数^(W, o 5 ic < ^进行编码。通常恥》 w/s,但是也可以进行其它选择。
利用^W和原始频谱XW,目标在于创建在所使用度量方面与原 始高频信号^W-X(^ + W, 0 S ic < W - ^最相似的高频成分
。 和—起形成了合成频镨
原始高频频谱^W被划分为^个非重叠子频带。原则上,频带
的数量和频带的宽度都可以任意地选择。例如,当W等于1024个采 样时,可以使用8个等宽的频带。另一合理的选择是基于人耳的 感知特性来选择频带。例如,Bark标度或等效矩形带宽(ERB)标 度都可以用来选择频带数量和频带宽度。可以在高频编码器中计算高频信号和低频成分之间的相似性度量。
让"作为包含^W的第J个频带的列向量,该X"(k)为^采样长 度。X "可以按照以下方式与编码的低频频谱^ W相比较
<formula>formula see original document page 15</formula>(3)
其中S(a' b)是向量3和b之间的相似度量,义"是包含编码低
频频语^(W的索引"力^ * < 1(力+ ^的向量。所期待低频信号 部分的长度与当前高频子频带的长度一样,从而基本上仅需要的信 息是索引i<j),该索引i^指示各个低频信号部分从哪开始。
相似性度量可以用来选择提供最高相似性的索引"力。相似性 度量用来描述向量的形状如何相似,而它们的相对振幅并不重要。 对于相似性度量存在很多选择。 一种可能的实现可以是标准化的相 关性
<formula>formula see original document page 15</formula>
《4>
该公式提供了对振幅a和b并不敏感的度量。另一合理的可选方 案是基于Euclidian距离的相似性度量
胁pV {5> 相应地,很多其它相似性度量也可以使用。
低频信号采样中这些最相似的部分可以复制到高频子频带并可 以使用特定缩放因子来进行缩放。缩放因子关注的是经过编码的 高频频谱包络遵循原始频谱包络。
利用索引"W,与"在形状上最为相似的所选择向量^'"需要 缩放到与X"相同的振幅。存在很多缩放的不同技术。例如,缩放可 以在两个阶段执行,首先在线性域中执行以便与频谱中的高振幅峰 值相匹配,然后在对数域中执行以便与能量和形状相匹配。使用这 些缩放因子对向量进行缩放会产生编码后的高频成分"。线性域缩放仅按照如下执行 其中根据以下公式获得",(/〕
注意,可以是正值也可以是负值。在对数缩放之前,可以
存储向量采样的符号和^的最大对数值
=max(log,0|;^j) 《9)
现在,可以执行对数缩放,并且将"更新为
v、 ,(/,剩),)+气' (io)
-10Vii(K^)T , (11)
其中根据以下公式获得缩放因子&"》
(1og,0(i相)—r(iogi。(ixw)) (12)
〗ogu)(l^j)- 〖(log,Q(网)-气
此缩放因子将对数域中波形之间的相似性最大化。可选地,"2(/) 可以这样选择使得能量被设置成大约相等的水平
在上述等式中,变量^"的目的在于确定"中最大值的振幅 (即,频谱峰)不会缩放到太高(第一缩放因子",(/)已经将这些振 幅设置到正确的水平)。由于在到对数域的变换期间原始采样的符 号信息会丢失,所以变量K"用来存储原始采样的符号。
在已经对频带进行缩放完毕后,合成的高频频谱W可以通过
合并向量&' j = °' ""' & — i来获取。
在已经选择完参数以后,需要对参数进行量化以便将高频区域重建信息传输至解码器8。
为了能够在解码器8中重建&W,对于每个频带都需要参数 ^力、W力和"2(i)。在解码器8中,高频产生装置54利用这些参数。 由于索引i(力是整数,则可以将其如此提交。"i(乃和"2("可以使用
例如标量量化或者向量量化来进行量化。
这些参数经过量化的版本A")和^(/)在高频产生装置54中使
用,以便根据等式(6)和(10)来构建义"W。
低频解码装置56根据公式2从输出信号14中将低频信号与重 建高频子频带一起解码出来。
利用包络标准化装置图7中所示系统可以进一步增强。图8中 所示系统除了包括图7中所示系统以外,还包括包络标准化装置58 和包络合成装置60。
在此系统中,高频编码技术用于使用编码器4中的包络标准化 装置58来产生包络标准化频谱。实际包络合成在解码器8中单独的 包络合成装置60中执行。
包络标准化可以利用例如LPC-分析或者倒谱建模来执行。应 当注意,在具有包络标准化的情况下,描述原始高频频谱包络的包 络参数必须提交给解码器,如图8所示。
在SBR中,将附加正弦波和噪声成分添加到高频区域。在以 上描述的应用中,这同样是可行的。如果需要的话,附加成分还可 以轻易地添加。这是因为在所描述的方法中,可以测量原始频谱与 合成频镨之间的不同,并且由此找到频谱形状中存在显著不同的位 置。例如,由于在普通BWE编码器中,频谱形状与原始频谱显著不 同,所以通常确定是否应该添加附加的正弦波或者噪声成分变得更 加困难。
已经注意到,在某些情况中,当输入信号很有音调(tonal), 则与原始信号相比,编码信号的质量会降低。这是因为编码的高频 区域可能没有与原始信号 一 样继续保持帧与另 一 帧之间的周期性。 周期性丢失是因为某些周期(正弦)成分可能丟失,或者现有周期成分的振幅在帧与另 一 帧之间变换过大。
为了在即使被用来重建高频子频带的低频信号采样并不能代 表整个正弦波时也包括音调部分,需要提供两个更进一步的步骤。
在第一步骤中,可以检测到具有可能质量降低的音调信号部
分。可以通过在移位离散傅立叶变换(SDFT)域比较两个连续帧之 间的相似性来检测该音调部分。对于此目的,SDFT是有用的变换, 因为其还包含相位信息,却仍然紧密涉及在编码器其它部分中使用 的MDCT变换。
可以在刚好完成瞬态检测之后并且在初始化实际高频区域编 码之前,执行音调检测。由于瞬态帧通常不包含音调成分,则仅在 当前帧和之前的帧是正常的长帧(例如,2048采样)时,应用音调 检测。
如上所述,音调检测是基于移位离散傅立叶变换(SDFT)进 行的,其中SDFT可以针对2N个采样长帧进行定义
Z /1(/1)jc(m) exp(i2;r(rt + + v) / 2iV), (14》
神4
其中h&)是窗口 , x(n)是输入信号,u和v分别表示时域移
位和频域移位。这些域移位可以这样选择使得u = (N + "/2并且 v = 1/2,自此之后,保持X⑨^al《y(k))。
这样,不需要单独计算SDFT和MDCT变换,而是可以首先
为音调分析计算SDFT变换,然后直接获取作为SDFT系数实部的
MDCT变换。这样,音调检测并不显著增大计算的复杂度。
在yifc"和nWM分别表示当前帧和之前帧的SDFT变换的情
况下,帧之间的相似度可以用以下7>式来测量
其中地+l对应于高频编码的极限频率。参数s越小,高频频 -潜越相似。基于S的值,可以将帧进^f于如下分类
18<formula>formula see original document page 19</formula>
极限因子和slim2的良好选择分别是0.02和0.2。但是, 也可以做出其他选择。另外,可以使用不同的变量,并且例如,这 些类中的一个类可以完全地被删除。
如图10所示,如上所述的音调检测(62)可以基于输入信号 10执行。
基于音调检测(62),输入帧分被为三组非音调(64)、有 音调(66)和强音调(66),如图10所示。
在音调检测(62)后,在第二步,可以通过将附加正弦波添加 到高频区域以及可能地通过增大用来如上所述创建高频区域的高频 子频带数量,来改善音调部分的质量。
最典型的情况是信号是非音调(64),然后继续进行如上所 述的编z码。
如果将输入信号分类到有音调(66),则可以在如上所迷应用 编码后,将附加正弦波添加到高频频谱。可以向MDCT域频谱添加 固定数量的正弦波。正弦波可以直接添加到原始频谱与编码后的频 谱之间绝对差最大的频率处。正弦波的位置和振幅被量化并提交给 解码器。
当检测到帧是有音调的(或者强音调的),则可以将正弦波添 加到频谱的高频区域。在x "和&w分别表示原始高频子频带成々 和经过编码的高频子频带成分的前提下,可以将第一正弦波添加到 索引&,该索引^可以从以下公式获得
<formula>formula see original document page 19</formula>
正弦波的振幅(包括其符号)可以按照以下公式进行定义 <formula>formula see original document page 19</formula> (18)说明书第15/15页
最后,可以将^W更新为
<formula>formula see original document page 20</formula> (19)
可以重复等式(17) - ( 19),直到已经添加了期待数量的正 弦波为止。通常,已经存在的四个附加正弦波可以在音调部分期间 产生明显改善的结果。正弦波的振幅Ai可以被量化然后提交到解码 器8。还可以提交正弦波的位置& 。另外,可以通知解码器8当前 帧是有音调的。
已经注意到,在音调部分期间,第二缩放因子"2可能不能改 善质量,继而被删除。
当检测到强音调部分(68)时,已知的是,当前部分对于高频 区域编码尤其有挑战性。因此,仅仅添加正弦波是不够的。可以通 过增大高频编码的准确性来进一步改善质量。这可以通过添加用来 创建高频区域的频带数量来进行。
在强音调部分期间,高频子频带的帧与另 一 帧之间非常相似。 为了在编码后的信号中维持这种相似,可以应用专用动作。特别是 如果高频子频带的数量nb相对较低(即,8或者更低),则高频子
频带的数量可以增大到更高的等级。例如,16个高频子频带通常可 以提供更准确的性能。
除了较大数量的频带外,还可以添加较大数量的正弦波。通常, 良好的解决办法是在"正常,,的有音调期间使用两倍的多个正弦波。
与"正常,,帧相比,增大高频子频带的数量以及增大正弦波的 数量都可以轻易地将强音调部分的比特速率增加一倍。但是,强音 调部分是非常特殊的情况,并且很少发生,所以对于平均比特速率 的增加是非常小的。
权利要求
1.一种用于编码音频信号的方法,包括-接收输入音频信号,-将该音频信号至少划分为低频带和高频带,-将该高频带至少划分为两个高频子频带信号,-在低频带信号部分内确定哪个部分与高频子频带信号最匹配,以及-产生至少涉及与高频带子频带信号最匹配的低频带信号部分的参数。
2. 根据权利要求1的方法,其中产生参数进一步包括产生用于缩 放该低频带信号部分的至少一个缩放因子。
3. 根据权利要求2的方法,其中该缩放因子是这样产生的使 用该参数调换到该高频子频带信号的该低频信号部分的包络遵循所 接收信号的高频子频带信号的包络。
4. 根据权利要求2的方法,其中产生缩放因子包括在线性域中 产生缩放因子以便至少与该频谱的振幅峰值匹配。
5. 根据权利要求2的方法,其中产生缩放因子包括在对数域中 产生缩放因子以便至少与该频谱的能量和/或形状匹配。
6. 根据权利要求1的方法,其中产生参数包括产生到代表该相 应高频子频带信号的低频信号部分的链接。
7. 根据权利要求1的方法,其中在该低频带信号部分中确定哪 个与高频子频带信号最匹配包括至少使用以下各项之一A)标准化的相关性, B ) Euclidian距离。
8. 根据权利要求1的方法,其中至少该低频信号部分的采样是 使用改进离散余弦变换产生的。
9. 根据权利要求1的方法,进一步包括标准化该高频子频带信号的包络。
10. 根据权利要求2的方法,进一步包括将对低频信号的采样进 行量化,并至少对该缩放因子进行量化。
11. 根据权利要求1的方法,其中该输入信号被划分为时间连续 帧,并进一步包括在该输入信号中两个连续帧内检测有音调部分。
12. 根据权利要求U的方法,其中检测有音调部分包括使用移 位离散傅立叶变换。
13. 根据权利要求11的方法,进一步包括向有音调部分添加正 弦波。
14. 根据权利要求11的方法,进一步包括增大用于有音调部分 的高频子频带数量。
15. —种用于解码音频信号的方法,具有 -接收经编码的比特 流,-从该比特流中解码出至少低频信号和至少涉及低频信号部分 的参数,-利用该低频信号的采样以及涉及该低频信号部分的参数来重 建至少两个高频子频带信号,以及-输出包括至少该低频信号和至少两个高频子频带信号的输出 信号。
16. —种用于编码音频信号的编码器,包括 -接收装置,其被布置以接收输入音频信号,-滤波装置,其被布置以将该音频信号至少划分为低频带和高频 带,并进一步被布置以将该高频带分为至少两个高频子频带信号, 以及-编码装置,其被布置以产生至少涉及与该高频带子频带信号最 匹配的低频带信号部分的参数。
17. 根据权利要求16的编码器,其中该编码装置被布置以产生 用于缩放该低频带信号部分的至少一个缩放因子。
18. 根据权利要求16的编码器,其中该编码装置被布置以产生该缩放因子,使得使用该参数调换到该高频子频带信号的该低频信 号部分的包络遵循所接收的信号的高频子频带信号的包络。
19. 根据权利要求16的编码器,其中该滤波装置被布置以将该 输入信号划分为时间连续帧,并用于检测该输入信号中两个连续帧 内有音调的部分。
20. 根据权利要求19的编码器,其中该滤波器被布置以使用移 位离散傅立叶变换检测有音调部分。
21. 根据权利要求19的编码器,其中该编码装置被布置以向有 音调部分添加正弦波。
22. 根据权利要求19的编码器,其中该编码装置被布置以增大 用于有音调部分的高频子频带数量。
23. —种用于解码音频信号的解码器,包括-接收装置,其被布置以接收经过编码的比特流,-解码装置,其被布置以从该比特流中解码出至少低频信号和至少涉及低频信号部分的参数,-产生装置,其被布置以利用该低频信号的采样以及涉及该低频信号部分的参数来重建至少两个高频子频带信号。
24. —种用于数字音频压缩的系统,包括根据权利要求23的解 码器和根据权利要求16的编码器。
25. —种用于编码音频信号的计算机程序产品,该程序包括可操 作以引起处理器执行以下步骤的指令-接收输入音频信号,-将该音频信号至少划分为低频带和高频带, -将该高频带至少划分为两个高频子频带信号,以及 -产生至少涉及与高频带子频带信号最匹配的低频带信号部分 的参数。
26. 根据权利要求25的计算机程序,其可操作以引起处理器将 该输入信号划分为时间连续帧,并检测该输入信号中两个连续帧内 有音调部分。
27. 根据权利要求26计算机程序产品,其可操作以引起处理器 使用移位离散傅立叶变换来检测有音调部分。
28. 根据权利要求26的计算机程序产品,其可操作以引起处理 器增大用于有音调部分的高频子频带数量。
29. —种用于解码比特流的计算机程序产品,该程序包括可操作 以引起处理器执行以下步骤的指令- 4妄收经编码的比特 流,-从该比特流中解码出至少低频信号和至少涉及低频信号部分 的参数,-利用该低频信号的采样以及涉及该低频信号部分的参数来重 建至少两个高频子频带信号,以及-输出包括至少该低频信号和至少两个高频子频带信号的输出 信号。
全文摘要
本申请涉及音频编码和解码技术。为了增强已编码的音频信号,提供了将音频信号至少划分为低频带和高频带,将高频带至少划分为两个高频子频带信号,并产生至少涉及与高频子频带信号最匹配的低频带信号部分的参数。
文档编号G10L19/02GK101297356SQ200580051976
公开日2008年10月29日 申请日期2005年11月4日 优先权日2005年11月4日
发明者M·塔米 申请人:诺基亚公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1