用于高频带宽扩展的对信号进行编码和解码的设备和方法_2

文档序号:9889533阅读:来源:国知局
将时域输入信号从3沈化采样率下采样到12.SIfflz的采样率。
[0054] 核屯、编码单元202可对下采样的时域输入信号进行核屯、编码。换而言之,核屯、编码 单元202可执行WB编码。例如,核屯、编码单元202可还行CELP型WB编码。
[0055] 频率变换单元203可将时域输入信号变换为频域输入信号。例如,频率变换单元 203可使用快速傅里叶变换(FFT)或MDCT来将时域输入信号变换为频域输入信号。W下,假 设采用MDCT。
[0056] 扩展编码单元204可使用频域输入信号的基础信号执行带宽扩展编码。特别地,扩 展编码单元204可基于频域输入信号执行SWB BWE编码。
[0057] 另外,扩展编码单元204可使用频域输入信号的特征W及频域输入信号的基础信 号的特征执行带宽扩展编码。运里,根据频域输入信号的特征的源,扩展编码单元204可如 图4或图5被配置。
[0058] 将参照W下的图4和图5进一步描述扩展编码单元204的操作。
[0059] 在图2中,上边的路径指示核屯、编码,下边的路径指示带宽扩展编码。具体地,输入 信号的能量信息可通过SWB BWE编码被传递到解码设备102。
[0060] 图3示出核屯、编码单元202的框图。
[0061] 参照图3,核屯、编码单元202可包括例如信号分类器301和编码器302。
[0062] 信号分类器301可对具有12.8KHZ采样率的下采样的输入信号的特征进行分类。特 别地,信号分类器301可根据频域输入信号的特征,确定将应用到频域输入信号的编码模 式。例如,在国际电信联盟-电信标准(ITU-T)G.718编解码器中,信号分类器301可将语音信 号确定为有声语音编模式(voiced speech encoding mode)、无声语音编码模式(unvoiced speech encoding mode)、瞬态编码模式(transient encoding mode)和通用编码模式 (generic encoding mode)中的一个或多个。在此示例中,无声语音编码模式可被设计为对 无声的语音帖和大部分的不活动帖进行编码。
[0063] 编码器302可执行基于信号分类器301所分类的频域输入信号优化的编码。
[0064] 图4示出图2的扩展编码单元204的示例的框图。
[0065] 参照图4,扩展编码单元204可包括例如基础信号产生器401、因子估算器402、能量 提取器403、能量控制器404和能量量化器405。在示例中,扩展编码单元204可在没有接收到 编码模式的输入的情况下估算能量控制因子。在另一示例中,扩展编码单元204可基于从核 屯、编码单元202接收的编码模式估算能量控制因子。
[0066] 基础信号产生器401可使用频域输入信号的频谱来产生输入信号的基础信号。基 础信号可表示用于基于WB信号执行SWB BWE的信号。换句话说,基础信号可表示用于形成低 频域的精细结构的信号。将参照图6进一步描述产生基础信号的操作。
[0067] 在示例中,因子估算器402可使用基础信号估算能量控制因子。特别地,编码设备 101可将输入信号的能量信息发送到解码设备102, W便在解码设备102中产生SWB域中的信 号。另外,因子估算器402可估算能量控制因子,从而控制感觉方面中的能量。将参照图7进 一步描述估算能量控制因子的操作。
[0068] 在另一示例中,因子估算器402可使用基础信号和频域输入信号的特征估算能量 控制因子。在此示例中,可从核屯、编码单元202接收频域输入信号的特征。
[0069] 能量提取器403可从频域输入信号提取能量。提取的能量可被发送到解码设备 102。运里,可针对每个频带提取能量。
[0070] 能量控制器404可使用能量控制因子控制提取的能量。特别地,能量控制器404可 将能量控制因子应用到针对每个频带提取的能量,并可控制能量。
[0071] 能量量化器405可量化受控的能量。能量可被转换为分贝(dB)标度,并可被量化。 特别地,能量量化器405可获取全局能量(即,总能量),并可对全局能量执行标量量化(SQ), 并对全局能量和每个频带的能量之间的差执行标量量化。另外,第一频带可直接量化能量, 后面的频带可对当前频带和先前频带之间的差进行量化。此外,能量量化器405可直接针对 每个频带对能量进行量化,而不使用频带之间的差值。当针对每个频带量化能量时,可使用 SQ或向量量化(VQ)。下面将参照图8和图9进一步描述能量量化器405。
[0072] 图5示出扩展编码单元204的另一示例的框图。
[0073] 图5的扩展编码单元204还可包括信号分类器501,并且因此可与图4的扩展编码单 元204不同。例如,因子估算器402可使用基础信号和频域输入信号的特征来估算能量控制 因子。在此示例中,可从信号分类器501而不是核屯、编码单元202接收频域输入信号的特征。
[0074] 信号分类器501可使用MDCT频谱,基于频域输入信号的特征对具有32K化采样率的 输入信号进行分类。特别地,信号分类器501可根据频域输入信号的特征确定将被应用于频 域输入信号的编码模式。
[0075] 当输入信号的特征被分类时,可从信号提取能量控制因子并可控制能量。在实施 例中,可仅从适合用于估算能量控制因子的信号提取能量控制因子。例如,不包括音调分量 的信号(诸如噪声信号或无声语音信号)可能不适合用于估算能量控制因子。运里,当输入 信号被分类为无声语音编码模式时,扩展编码单元204可执行带宽扩展编码,而不是估算能 量控制因子。
[0076] 图5中示出的基础信号产生器401、因子估算器402、能量提取器403、能量控制器 404和能量量化器405可执行与图4中示出的基础信号产生器401、因子估算器402、能量提取 器403、能量控制器404和能量量化器405相同的功能,因此将省略对其的进一步描述。
[0077] 图6示出基础信号产生器401的框图。
[007引参照图6,基础信号产生器401可包括例如人工信号产生器601、包络估算器602和 包络应用器603。
[0079] 人工信号产生器601可通过复制和折叠频域输入信号的低频部分来产生与高频部 分对应的人工信号。特别地,人工信号产生器601可复制频域输入信号的低频频谱,并可在 SWB域中产生人工信号。将参照图10进一步描述产生人工信号的操作。
[0080] 包络估算器602可使用窗口来估算基础信号的包络。基础信号的包络可用于移除 SWB域中的人工信号的频谱中所包括的低频域的包络信息。可使用位于预定频率之前或之 后的频谱来确定预定频率索引的包络。另外,可通过移动平均来估算包络。例如,当MDCT用 于变换频率时,可使用MDCT变换后的频谱的绝对值来估算基础信号的包络。
[0081]运里,包络估算器602可形成白化频带(whitening band),并可将每个白化频带的 频率幅度的平均值估算为每个白化频带中包含的频率的包络。包含在白化频带中的频谱的 数量可被设置为少于用于提取能量的频带的数量。
[0082] 当每个白化频带的频率幅度的平均值被估算为包含在每个白化频带中的频率的 包络时,包络估算器602可发送包括白化频带中的频谱的数量的信息,并可调整基础信号的 平滑度。特别地,包络估算器602可基于白化频带是包括八个频谱还是Ξ个频谱来发送包括 白化频带中的频谱的数量的信息。例如,当白化频带包括Ξ个频谱时,与包括八个频谱的白 化频带相比,可产生更加平坦的基础信号。
[0083] 另外,包络估算器602可基于在核屯、编码单元202的编码期间使用的编码模式来估 算包络,而不是发送包括白化频带中的频谱的数量的信息。核屯、编码单元202可基于输入信 号的特征将输入信号分类为有声语音编码模式、无声语音编码模式、瞬态编码模式和通用 编码模式,并可对输入信号进行编码。
[0084] 运里,包络估算器602可基于根据输入信号的特征的编码模式来控制包含在白化 频带中的频谱的数量。在一示例中,当输入信号基于有声语音编码模式被编码时,包络估算 器602可形成具有Ξ个频谱的白化频带,并可估算包络。在另一示例中,当输入信号基于除 了有声语音编码模式之外的编码模式被编码时,包络估算器602可形成具有Ξ个频谱的白 化频带,并可估算包络。
[0085] 包络应用器603可将估算的包络应用于人工信号。将估算的包络应用于人工信号 的操作被称为"白化",人工信号可被包络平滑。包络应用器603可将人工信号划分为每个频 率索引的包络,并可产生基础信号。
[0086] 图7示出因子估算器402的框图。
[0087] 参照图7,因子估算器402可包括例如第一音调计算单元701、第二音调计算单元 702和因子计算单元703。
[0088] 第一音调计算单元701可计算频域输入信号的高频部分的音调。换而言之,第一音 调计算单元701可计算SWB域(即,输入信号的高频部分)的音调。
[0089] 第二音调计算单元702可计算基础信号的音调。
[0090] 可通过测量频谱平坦度来计算音调。特别地,可使用如下的等式1来计算音调。可 基于频谱的几何平均和算术平均之间的关系来测量频域平坦度。
[00川[等式U
[0092]
[0093] 1':音调,5化):频谱,
[0094] N:频谱系数的长度,r:常数
[00%]因子计算单元703可使用高频域的音调和基础信号的音调来计算能量控制因子。 运里,可使用W下的等式2来计算能量控制因子:
[0096] [等式 2]
[0097]
[009引T。:原始频谱的音调,Tb:基础频谱的音调,
[0099] N。:原始频谱的噪声因子,化:基础频谱的噪声因子
[0100] 在等式2中,α表示能量控制因子,T康示输入信号的音调,T康示基础信号的音调。 另外,化表示噪声因子,其指示信号中包含多少噪声分量。
[0101] 还可使用W下的等式3来计算能量控制因子:
当前第2页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1