谐波音频信号的带宽扩展的利记博彩app

文档序号:2825881阅读:288来源:国知局
谐波音频信号的带宽扩展的利记博彩app
【专利摘要】一种在编解码器中支持谐波音频信号的带宽扩展(BWE)的方法和装置。编解码器的解码器部分中的方法包括:接收与频带b及频带b的多个相邻频带相关联的多个增益值。所述方法还包括:确定重建的对应频带b’是否包括谱峰。当频带b’包括谱峰时,基于接收到的多个增益值将与频带b’相关的增益值设置为第一值;否则基于接收到的多个增益值将所述增益值设置为第二值。本发明使得增益值与带宽扩展频域中的波峰位置一致。
【专利说明】谐波音频信号的带宽扩展

【技术领域】
[0001] 本发明涉及音频信号的编码和解码,更具体地,涉及支持谐波音频信号的带宽扩 展(臓)。

【背景技术】
[0002] 基于变换的编码是当今的音频压缩/传输系统中最常用的方案。这种方案的主 要步骤是首先通过合适的变换(例如DFT(离散傅立叶变换)、DCT(离散余弦变换)或 MDCT (修正离散余弦变换))将信号波形的短块转换到频域。然后变换系数被量化、发送或 存储且随后用于重建音频信号。这种方案对于一般的音频信号有效,但是需要足够高的比 特速率以创建变换系数的足够好的表示。下面将给出这种变换域编码方案的高层概述。
[0003] 将要编码的波形逐块地变换到频域。用于此目的一个常用变换是所谓的修正离散 余弦变换(MDCT)。将由此得到的频域变换矢量分成频谱包络(缓慢变化的能量)和频谱残 留。频谱残留是使用所述频谱包络对所获得的频域矢量进行归一化而获得的。对频谱包络 进行量化,将量化指标发送到解码器。接下来,使用量化的频谱包络作为比特分配算法的输 入,并基于频谱包络的特性分配用于编码残留矢量的比特。作为此步骤的结果,某个数量的 比特被分配给残留的不同部分(残留矢量或"子矢量")。一些残留矢量不接收任何比特且 必定是充满噪声的或带宽扩展的。通常,残留矢量的编码是两个步骤的过程;首先对矢量项 的幅值进行编码,接着对非零项的符号(不要与"相位"混淆,相位是与例如傅立叶变换相 关的)进行编码。将针对于残留幅值和符号的量化指标发送给解码器,在解码器中将残留 和频谱包络进行组合,并最终变换回时域。
[0004] 电信网络的容量在持续增长。然而,尽管有增长的容量,仍然存在限制每一通信信 道所需带宽的强驱动力。在移动网络中,用于每个呼叫的较小的传输带宽在移动设备和服 务于该设备的基站两者中都产生较低的功率消耗。这转化成了移动运营商能量和成本的节 约,同时,最终用户将体验到延长的电池寿命和增长的通话时间。此外,每一用户消耗的带 宽越少,移动网络能够(并行地)服务的用户就越多。
[0005] 提高将被以低的或中等的比特速率传送的音频信号质量的一个方法是集中可用 的比特以精确地表示音频信号中的较低频率。因此,使用BWE技术来基于仅需要少量比特 的较低频率塑造较高频率。这些技术的背景是人类听觉系统的灵敏度取决于频率。具体而 言,人类听觉系统(例如我们的听力)对于较高频率不太精确。
[0006] 在典型的频域BWE方案中,高频变换系数按照频带进行分组。针对每个频带,对增 益(能量)进行计算、量化并发送(至信号的解码器)。在解码器端,用高频增益对所接收 到的低频系数的翻转或平移(translate)及能量归一化版本进行缩放(scale)。这样,BWE 并不完全是"瞎的",因为至少频谱能量与目标信号的高频频带的频谱能量相似。
[0007] 然而,某些音频信号的BWE可能会导致音频信号包含瑕疵,这对听众带来烦恼。


【发明内容】

[0008] 本文提出了支持和改善谐波音频信号的BWE的技术。
[0009] 根据本发明的第一方面,提出了一种变换音频解码器中的方法。该方法用于支持 谐波音频信号的带宽扩展(BWE)。所提出的方法可以包括与频带b及频带b的多个相邻频 带相关的多个增益值的接收。所提出的方法还包括确定带宽扩展频率区域的重建的对应频 带b'是否包括谱峰。此外,如果该频带包括至少一个谱峰,该方法包括基于所接收到的多 个增益值将与频带b'相关的增益值G b设置为第一值。如果该频带不包括任何谱峰,该方 法包括基于所接收到的多个增益值将与频带b'相关的增益值G b设置为第二值。因此使得 增益值与频谱的带宽扩展部分中的波峰位置一致。
[0010] 此外,该方法可能包括:接收反映原始信号的高频部分的至少一段的波峰能量与 噪声底能量之间关系的参数或系数α。该方法还可以包括:基于接收到的系数α,将对应 的重建的高频段的变换系数与噪声混合。从而使得可以重建/仿真原始信号的高频部分的 噪声特性。
[0011] 根据本发明的第二方面,提出了一种支持谐波音频信号的带宽扩展(BWE)的变换 音频解码器或编解码器。该变换音频编解码器包括适于执行上面描述的动作的功能单元。 此外,提出了一种变换音频编码器或编解码器,包括适于导出或提供一个或更多个参数的 功能单元,当将所述一个或更多个参数提供给变换音频解码器时,能够进行本文描述的噪 声混合。
[0012] 根据本发明的第三方面,提出了一种用户终端,其包括根据本发明第二方面的变 换音频编解码器。用户终端可能是例如移动终端、平板设备、计算机、智能电话等诸如此类 的设备。

【专利附图】

【附图说明】
[0013] 现在将通过示例性的实施例并参照附图的方式更详细地描述本发明,在附图中:
[0014] 图1示出了谐波音频频谱,即谐波音频信号的频谱。这种类型的频谱通常针对于 例如单一乐器声音、嗓音等。
[0015] 图2示出了谐波音频频谱的带宽扩展。
[0016] 图3a示出了用解码器接收到的对应BWE频带增益(?来进行缩放的BWE频谱(也 在图2中示出)。频谱的BWE部分严重失真。
[0017] 图3b示出了本文提出的利用修正的BWE频带增益0Am° d来进行缩放的BWE频谱。在 这种情况下,频谱的BWE部分得到了所希望的形状。
[0018] 图4a和图4b是示出了根据示例性实施例的变换音频解码器中的过程中的动作的 流程图。
[0019] 图5是示出了根据示例性实施例的变换音频解码器的框图。
[0020] 图6是示出了根据示例性实施例的变换音频编码器中的过程中的动作的流程图。
[0021] 图7是示出了根据示例性实施例的变换音频编码器的框图。
[0022] 图8是示出了根据示例性实施例的变换音频解码器中的装置的框图。

【具体实施方式】
[0023] 如上所述,音频信号的带宽扩展与一些问题相关联。在解码器中,当翻转或平移低 频带(即经编码、传输和解码的频带部分)以形成高频带时,不能确定谱峰将会与原始信号 或"真实的"高频带中的谱峰结束于(end up)相同的频带中。来自低频带中的谱峰也许会 结束于在原始信号没有波峰的频带中。还可能是另一种方式,即,低频信号的没有波峰的部 分(在翻转或平移之后)结束于原始信号具有波峰的频带中。图1提供了谐波频谱的示例, 图2提供了 BWE原理的图示,接下来将对此作进一步的描述。
[0024] 如上描述的效果可能导致具有主要谐波内容的信号产生严重质量下降。原因是波 峰和增益位置间的这种不匹配将导致不必要的波峰衰减,或者两个谱峰之间低能量频谱系 数的放大。
[0025] 本文描述的方案涉及一种基于与波峰位置有关的信息来控制带宽扩展区域的带 宽增益的新方法。此外,本文提出的BWE算法能够通过所发送的噪声混合等级来控制"谱峰 噪声底比"。这导致了在扩展的高频中保留大量结构的BWE。
[0026] 本文描述的方案适用于谐波音频信号。图1示出了谐波音频信号的频谱(还可以 表示为谐波频谱)。从图中可以看出,频谱包括波峰。这种类型的频谱典型地适用于例如单 一乐器(如长笛)的声音或者嗓音等。
[0027] 本文将讨论谐波音频信号频谱的两个部分。一个包括较低频率的下部,其中"下" 表示低于将要进行带宽扩展的部分;一个包括较高频率的上部,例如比下部高。本文使用的 像"下部"或"低/较低频率"之类的表达指的是谐波音频频谱的低于BWE交叉频率的部分 (参见图2)。类似地,像"上部"或者"高/较高频率"之类的表达指的是谐波音频频谱的 高于BWE交叉频率的部分(参见图2)。
[0028] 图2示出了谐波音频信号的频谱。本文接下来讨论的两个部分,在BWE交叉频率 左边的可看作下部,在BWE交叉频率右边的可看作上部。在图2中,用浅灰色示出了原始频 谱,即(在编码器端看到的)原始音频信号的频谱。用深/较深灰色示出了频谱的带宽扩 展部分。频谱的带宽扩展部分不由编码器进行编码,而是通过使用先前描述的接收到的频 谱的下部在解码器端进行重建。在图2中,出于比较的原因,对于较高频率能看到原始(浅 灰色)频谱和BWE(深灰色)频谱两者。较高频率的原始频谱对于解码器是未知的,针对于 每一个BWE频带(或者高频带)的增益值例外。在图2中,BWE频带用虚线分隔。
[0029] 为了更好地理解在频谱的带宽扩展部分中的增益值和波峰位置之间的不匹配的 问题,可以研究图3a。在频带302a,原始频谱包括波峰,但重建的BWE频谱不包括波峰。这 在图2的频带202中可以看到。因此,当将针对包括波峰的原始频带计算的增益应用于不 包括波峰的BWE频带时,如在频带302a中看到的那样,将放大BWE频带的低能量频谱系数。
[0030] 图3a中的频带304a表示了相反的情况,即,原始频谱的对应频带不包括波峰,但 重建的BWE频谱的对应频带包括波峰。因此,针对(从编码器接收到的)频带所获得的增 益是针对于低能量频带计算的。当将该增益应用于包括波峰的对应频带时,结果变成了衰 减的波峰,如在图3a的频带304a中所见。从感知或心理声学的观点来看,因为多种原因, 频带302a中示出的情况比频带304a中的情况对听众来说要更糟糕。简单地描述,也就是, 与声音分量的异常缺失相比,体验到声音分量的异常出现通常令听众更加不愉快。
[0031] 接下来将描述新的BWE算法的一个示例,以阐述本文所描述的概念。
[0032] 设Y (k)表示BWE区域(高频变换系数)中变换系数的集合。将这些变换系数分组 到B个频带

【权利要求】
1. 一种由变换音频解码器执行的用于支持谐波音频信号的带宽扩展"BWE"的方法,所 述方法包括: -接收(401a)与频带b及频带b的多个相邻频带相关联的多个增益值; -确定(404a)带宽扩展频率区域的重建的对应频带b'是否包括谱峰,以及: 当重建的频带b'包括至少一个谱峰时: -基于接收到的多个增益值,将与重建的频带b'相关联的增益值设置(406a:l)为第 一值;以及 当重建的频带b'不包括任何谱峰时: -基于接收到的多个增益值,将与重建的频带b'相关联的增益值设置(406a :2)为第 二值,其中,所述第二值小于或等于所述第一值; 从而使得增益值与所述带宽扩展频率区域中的波峰位置一致。
2. 根据权利要求1所述的方法,其中,所述第一值是接收到的多个增益值的加权和。
3. 根据权利要求2所述的方法,其中,所述加权和是接收到的多个增益值的平均值。
4. 根据前述权利要求的任意一项所述的方法,其中,所述第二值是接收到的多个增益 值中最小的增益值之一。
5. 根据前述权利要求中任一项所述的方法,其中,所述第二值是接收到的多个增益值 之中的最小增益值。
6. 根据前述权利要求中任一项所述的方法,还包括: -接收(402b)反映原始信号的高频部分的至少一段的波峰能量与噪声底能量之间的 关系的系数α ; -基于接收到的系数α,将对应的重建的高频段的变换系数与噪声混合(403b), 从而能够实现所述原始信号的所述高频部分的噪声特性的重建。
7. -种用于支持谐波音频信号的带宽扩展"BWE"的音频解码器(501),所述音频解码 器包括: -接收单元,适于接收与频带b及频带b的多个相邻频带相关联的多个增益值; -确定单元(504),适于确定带宽扩展频率区域的重建的对应频带b'是否包括谱峰; -增益应用单元(508),适于: -当重建的频带b'包括至少一个谱峰时,基于接收到的多个增益值将与重建的频带b' 相关联的增益值设置为第一值;以及 -当重建的频带b'不包括任何谱峰时,基于接收到的多个增益值将与重建的频带b'相 关联的增益值设置为第二值,其中,所述第二值小于或等于所述第一值; 从而使得增益值与所述带宽扩展频率区域中的波峰位置一致。
8. 根据权利要求7所述的音频解码器,其中,所述第一值是接收到的多个增益值的加 权和。
9. 根据权利要求8所述的音频解码器,其中,所述加权和是接收到的多个增益值的平 均值。
10. 根据权利要求7-9中任一项所述的音频解码器,其中,所述第二值是接收到的多个 增益值之中最小的增益值之一。
11. 根据权利要求7-10中任一项所述的音频解码器,其中,所述第二值是接收到的多 个增益值之中的最小增益值。
12. 根据权利要求7-11中任一项所述的音频解码器,还适于接收反映原始信号的高频 部分的至少一段的波峰能量和噪声底能量之间的关系的系数α ;以及还包括: -噪声混合单元(510),适于基于接收到的系数α将对应的重建的高频段的变换系数 与噪声混合, 从而能够实现所述原始信号的所述高频部分的噪声特性的重建。
13. -种包括根据权利要求6-12中任一项所述的音频解码器的用户设备。
14. 一种由变换音频编码器执行的用于支持谐波音频信号的带宽扩展"BWE"的方法, 所述方法包括: -确定(602)与在谐波音频信号的频谱的上部中的频带b相关联的波峰能量; -确定(603)与所述频带b相关联的噪声底能量; -基于所确定的波峰能量和噪声底能量,确定(604)与所述频带b相关联的噪声混合系 数α ;以及 -向对应的变换音频解码器提供(606)所述噪声混合系数α。
15. 根据权利要求14所述的方法,其中,所述频谱的上部是包括比BWE交叉频率更高频 率的部分。
16. -种用于支持谐波音频信号的带宽扩展"BWE"的音频编码器,所述音频编码器包 括: -确定单元(704),适于确定与在谐波音频信号的频谱的上部中的频带b相关联的波峰 能量和噪声底能量; -噪声系数单元(706),适于基于所确定的波峰能量和噪声底能量,确定与所述频带b 相关联的噪声混合系数α ;以及 -提供单元(708),适于向对应的变换音频解码器提供所述噪声混合系数α。
17. -种包括计算机可读代码的计算机程序(810),当在处理单元中运行时,使得音频 解码器执行根据权利要求1-6中任一项所述的方法。
18. -种计算机程序产品(808),包括计算机可读介质和存储在所述计算机可读介质 中的根据权利要求16所述的计算机程序(810)。
【文档编号】G10L21/038GK104221082SQ201280071983
【公开日】2014年12月17日 申请日期:2012年12月21日 优先权日:2012年3月29日
【发明者】塞巴斯蒂安·内斯隆德, 沃洛佳·格兰恰诺夫, 托马斯·詹森·托夫特戈德 申请人:瑞典爱立信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1