编码设备和编码方法
【专利摘要】本发明公开了一种编码设备和编码方法。该编码设备包括:子带划分装置,配置成将输入信号划分成多个子带,并生成低频子带信号和高频子带信号;特征量计算装置,配置成使用输入信号和低频子带信号中的至少一个来计算特征量;伪高频子带功率计算装置,配置成基于特征量来计算伪高频子带功率;伪高频子带功率差异计算装置,配置成根据高频子带信号来计算高频子带功率,并计算伪高频子带功率差异;高频编码装置,配置成对伪高频子带功率差异进行编码,以生成高频编码数据;低频编码装置,配置成对低频信号进行编码,以生成低频编码数据;以及多路复用装置,配置成对低频编码数据和高频编码数据进行多路复用,以获得输出代码串。
【专利说明】编码设备和编码方法
[0001]本申请为2010年9月29日提交的国际申请号为PCT/JP2010/066882、发明名称为“频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序”的PCT申请的分案申请,该PCT申请进入中国国家阶段日期为2012年4月6日,国家申请号为201080045206.6。
【技术领域】
[0002]本发明涉及频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序,具体地涉及其中由于频带的扩展而使得音乐信号能够以较高的音质进行播放的频带扩展设备和方法、编码设备和方法、解码设备和方法、以及程序。
【背景技术】
[0003]近年来,通过网络等来分发音乐数据的音乐分发服务越来越被广泛地使用。对于这样的音乐分发服务,通过编码音乐信号而获得的编码数据被作为音乐数据分发。作为音乐信号的编码方法,抑制编码数据的文件容量并降低比特率以便于减小降低在下载事件中花费的时间量的编码方法已成为主流。
[0004]这样的音乐信号编码方法大体上分为:例如MP3 (MPEG (运动图像专家组)音频层3)(国际标准IS0/IEC11172-3)等的编码方法;以及例如HE-AAC(高效MPEG4AAC)(国际标准IS0/IEC14496-3)等的编码方法。
[0005]在由MP3代表的编码方法中,删除了很难被人耳检测到的、大约15kHz或更高的高频带(下文称为“高频”)的音乐信号分量,并对剩余的低频带(下文称为“低频”)的信号分量进行编码。这种编码方法在下文中将被称为高频删除编码方法。关于该高频删除编码方法,可以抑制编码数据的文件容量。然而,高频声音可以尽管极细微地被人检测到,所以如果根据通过解码所述编码数据获得的解码后的音乐信号来生成并输出声音,会发生音质的劣化,例如丢失原始声音所具有的真实感或声音变得低沉。
[0006]相反地,在由HE-AAC代表的编码方法中,从高频信号分量中提取特征信息,并且该特征信息与低频信号分量一起编码。这种编码方法将在下文中称为高频特征编码方法。在高频特征编码方法中,只有高频信号分量的特征信息被编码为与高频信号分量相关的信息,由此可以在抑制音质的劣化的同时提高编码效率。
[0007]在解码已使用高频特征编码方法进行编码的编码数据中,低频信号分量和特征信息被解码,并且根据解码之后的低频信号分量和特征信息来生成高频信号分量。从而,通过根据低频信号分量生成高频信号分量,这种扩展低频信号分量的频带的技术在下文将被称为频带扩展技术。
[0008]作为频带扩展技术的应用示例,会存在在对使用上述高频删除编码方法的编码数据进行解码之后的后处理。在该后处理中,通过从解码之后的低频信号分量中生成在编码中丢失的高频信号分量来对低频信号分量的频带进行扩展(参见PTL1)。注意,在PTLl中的用于频带扩展的方法在下文中将被称为PTLl带扩展方法。
[0009]关于PTLl带扩展方法,设备根据输入信号的功率谱来估计高频功率谱(下文在适用的情况下称为高频包络),其中使用解码之后的低频信号分量作为输入信号,并根据所述低频信号分量生成具有所述高频的频率包络的高频信号分量。
[0010]图1示出了作为输入信号的解码后的低频功率谱以及估计的高频包络的示例。
[0011]在图1中,竖轴表示对数方式的功率,而横轴表示频率。
[0012]设备根据与输入信号相关的编码格式的类型以及例如为采样率、比特率等的信息(下文称为“边信息”)来确定高频信号分量的低频端的频段(下文称为“扩展起始频段”)。接着,设备将作为低频信号分量的输入信号划分成多个子带信号。设备求出划分之后的多个子带信号,即,从扩展起始频段开始的、在低频率侧(下文简称为“低频侧”)上的多个子带信号的每一个子带信号的功率的时间方向的每个组的平均值(下文称为“组功率”)。如图1所示,设备使用在低频侧的多个子带信号的各个组功率的平均值来作为功率,并使用扩展起始频段的下边缘上的频率处的点来作为起点。设备估计以预定的斜率通过起点的线性线来作为从扩展起始频段开始的在高频率侧(下文称为高频侧)的频率包络。注意,用于起点的功率方向的位置可以由用户来调节。设备根据在低频侧的多个子带信号生成在高频侧的多个子带信号的每一个,以如所估计的那样变成在高频侧的频率包络。设备将添加在高频侧的多个生成的子带信号,以作为高频信号分量,并且进一步地添加低频信号分量并进行输出。从而,在频带扩展之后的音乐信号变得更接近原始音乐信号。因此,可以播放具有较高音质的音乐信号。
[0013]以上描述的PTLl频段扩展方法具有如下优点:能够在解码音乐信号的编码数据之后扩展音乐信号的频带,其中这样的编码数据具有各种高频删除编码方法和各种比特率。
[0014]引用列表
[0015]专利文献
[0016]PTLl:日本未审查专利申请公报N0.2008-139844
【发明内容】
[0017]技术问题
[0018]然而,PTLl频段扩展方法可以对于如下点进行改进:估计的高频侧频率包络是具有预定斜率的线性线,即,对于频率包络的形状是固定的这点。
[0019]也就是说,音乐信号的功率谱具有各种形状,并且取决于音乐信号的类型不少情况将会从使用PTLl频段扩展方法估计的高频侧频率包络发生较大的变化。
[0020]图2示出了攻击型的音乐信号(攻击型音乐信号)的原始功率谱的示例,其伴随有时间上的突变,例如当大声击鼓一次时。
[0021]注意,图2还一起示出了作为输入信号的攻击性音乐信号的低频侧信号分量以及按照PTLl频段扩展方法根据该输入信号估计的高频侧频率包络。
[0022]如图2中所示,攻击型音乐信号的原始高频侧功率谱近似平坦。
[0023]相反地,估计的高频侧频率包络具有预定的负斜率,即使在起点处将它调整到更接近原始功率谱的功率,与原始功率谱的差异也会随着频率的增加而增加。
[0024]从而,对于PTLl频段扩展方法,估计的高频侧频率包络不能够以高的精确度实现原始高频侧频率包络。因此,如果声音从频带扩展之后的音乐信号中生成并输出,则从听的角度来看,与原始声音相比,将会丢失声音的清晰度。
[0025]另外,对于例如上述HE-ACC等的高频特征编码方法,高频侧频率包络被用作为待编码的高频信号分量的特征信息,但是,需要解码侧以高度精确的方式来再生原始高频侧频率包络。
[0026]本发明已将这样的情况纳入考虑,并使得音乐信号能够由于频带的扩展而以高音质播放。
[0027]问题的解决方案
[0028]根据本发明的第一方面的频带扩展设备,包括:信号划分装置,所述信号划分装置被配置成将输入信号划分成多个子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述信号划分装置所划分的多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;高频子带功率估计装置,所述高频子带功率估计装置被配置成基于由所述特征量计算装置所计算的特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及高频信号分量生成装置,所述高频信号分量生成装置被配置成基于由所述信号划分装置所划分的多个子带信号和由所述高频子带功率估计装置所计算的高频子带功率的估计值来生成高频信号分量;从而使用由所述高频信号分量生成装置所生成的高频信号分量来扩展所述输入信号的频带。
[0029]特征量计算装置可以计算作为所述多个子带信号的功率的低频子带功率,以作为特征量。
[0030]特征量计算装置可以计算作为所述多个子带信号的功率的低频子带功率的时间变化,以作为特征量。
[0031]特征量计算装置可以计算所述输入信号在预定频带中的最大功率与最小功率之间的差异,以作为特征量。
[0032]特征量计算装置可以计算所述输入信号在预定频带中的功率的最大值与最小值之间的差异的时间变化,以作为特征量。
[0033]特征量计算装置可以计算所述输入信号在预定频带中的功率的斜率,以作为特征量。
[0034]特征量计算装置可以计算所述输入信号在预定频带中的功率的斜率的时间变化,以作为特征量。
[0035]高频子带功率估计装置可以基于所述特征量和预先通过学习获得的用于每个高频子带的系数来计算所述高频子带功率的估计值。
[0036]可以通过对利用通过使用多个教学信号的回归分析所获得的每个高频子带的系数计算的所述高频信号分量的残差向量执行聚类以及针对通过所述聚类所获得的每个簇使用属于所述簇的所述教学信号执行回归分析来生成所述每个高频子带的系数。
[0037]可以使用多个所述残差向量的每个分量的离差值来归一化所述残差向量,并且对归一化后的所述向量进行聚类。
[0038]高频子带功率估计装置可以基于所述特征量、用于每个所述高频子带的系数和常量来计算所述高频子带功率的估计值;所述常量是根据通过使用利用属于所述簇的所述教学信号进行的回归分析所获得的每个高频子带的系数进一步计算所述残差向量并执行将所述残差向量聚类为多个新簇所获得的所述新簇的重心向量来计算的。
[0039]高频子带功率估计装置可以以相关联的方式记录用于每个所述高频子带的系数和用于确定所述每个高频子带的系数的指针,并且还记录多组所述指针和所述常量,所述多组中的一些组可包括具有相同值的指针。
[0040]高频信号生成装置可以根据作为所述多个子带信号的功率的低频子带功率和所述高频子带功率的估计值来生成所述高频信号分量。
[0041]根据本发明的第一方面的频带扩展方法,包括:信号划分步骤,所述信号划分步骤被设置成将输入信号划分成多个子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述信号划分步骤中的处理所划分的所述多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;高频子带功率估计步骤,所述高频子带功率估计步骤被设置成基于由在所述特征量计算步骤中的处理所计算的所述特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及高频信号分量生成步骤,所述高频信号分量生成步骤被设置成基于由所述信号划分步骤中的处理所划分的所述多个子带信号和由所述高频子带功率估计步骤中的处理所计算的所述高频子带功率的所述估计值来生成高频信号分量;从而使用由所述高频信号分量生成步骤中的处理所生成的所述高频信号分量来扩展所述输入信号的频带。
[0042]根据本发明的第一方面的程序,包括:信号划分步骤,所述信号划分步骤被设置成将输入信号划分成多个子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述信号划分步骤中的处理所划分的所述多个子带信号中的至少一个来计算表示所述输入信号的特征的特征量;高频子带功率估计步骤,所述高频子带功率估计步骤被设置成基于由在所述特征量计算步骤中的处理所计算的特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;以及高频信号分量生成步骤,所述高频信号分量生成步骤被设置成基于由在所述信号划分步骤中的处理所划分的所述多个子带信号和由在所述高频子带功率估计步骤中的处理所计算的所述高频子带功率的估计值来生成高频信号分量;从而使得计算机执行用于使用由在所述高频信号分量生成步骤中的处理所生成的所述高频信号分量来扩展所述输入信号的频带的处理。
[0043]关于本发明的第一方面,将输入信号划分成多个子带信号;使用所述输入信号和多个划分的子带信号中的至少一个来计算表示所述输入信号的特征的特征量;基于所计算的特征量来计算高频子带功率的估计值,所述高频子带功率是具有高于所述输入信号的频带的频带的子带信号的功率;基于多个所划分的子带信号和所计算的高频子带功率的估计值来生成高频信号分量;以及使用所生成的高频信号分量来生成所述输入信号的频带。
[0044]根据本发明的第二方面的编码设备,包括:子带划分装置,所述子带划分装置被配置成将输入信号划分成多个子带,并生成由在低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述子带划分装置生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;伪高频子带功率计算装置,所述伪高频子带功率计算装置被配置成基于由所述特征量计算装置所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;伪高频子带功率差异计算装置,所述伪高频子带功率差异计算装置被配置成根据由所述子带划分装置所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由所述伪高频子带功率计算装置所计算的所述伪高频子带功率的差异;高频编码装置,所述高频编码装置被配置成对由所述伪高频子带功率差异计算装置所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;低频编码装置,所述低频编码装置被配置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及多路复用装置,所述多路复用装置被配置成对由所述低频编码装置生成的所述低频编码数据和由所述高频编码装置生成的所述高频编码数据进行多路复用,以获得输出代码串。
[0045]所述编码设备还可以包括低频解码装置,所述低频解码装置被配置成对由所述低频编码装置生成的所述低频编码数据进行解码,以生成低频信号;所述子带划分装置根据由所述低频解码装置所生成的低频信号来生成低频子带信号。
[0046]所述高频编码装置可以计算在所述伪高频子带功率差异与在预定的多个伪高频子带功率差异空间中的代表向量或代表值之间的相似度,以生成与其相似度是最大值的代表向量或代表值对应的索引,以作为所述高频编码数据。
[0047]所述伪高频子带功率差异计算装置可以基于每个子带的所述伪高频子带功率和所述高频子带功率来针对用于计算所述伪高频子带功率的多个系数中的每一个计算评价值;所述高频编码装置生成指示作为最高评价值的所述评价值的系数的索引,以作为所述高频编码数据。
[0048]伪高频子带功率差异计算装置可以基于每个子带的所述伪高频子带功率差异的平方和、所述子带的所述伪高频子带功率的绝对值的最大值或每个子带的所述伪高频子带功率差异的平均值中的至少任何一个来计算所述评价值。
[0049]伪高频子带功率差异计算装置可以基于不同帧的所述伪高频子带功率差异来计算所述评价值。
[0050]伪高频子带功率差异计算装置可以使用乘以权重的所述伪高频子带功率差异来计算所述评价值,所述权重是针对每个子带的权重,使得所述子带越处于低频侧,所述子带的权重就越大。
[0051]伪高频子带功率差异计算装置可以使用乘以权重的所述伪高频子带功率差异来计算所述评价值,所述权重是针对每个子带的权重,使得子带的所述高频子带功率越大,所述子带的权重就越大。
[0052]根据本发明的第二部分的编码方法,包括:子带划分步骤,所述子带划分步骤被设置成将输入信号划分成多个子带,并生成由低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和在所述子带划分步骤中的处理所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;伪高频子带功率计算步骤,所述伪高频子带功率计算步骤被设置成基于在所述特征量计算步骤中的处理所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;伪高频子带功率差异计算步骤,所述伪高频子带功率差异计算步骤被设置成根据由在所述子带划分步骤中的处理所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由在所述伪高频子带功率计算步骤中的处理所计算的所述伪高频子带功率的差异;高频编码步骤,所述高频编码步骤被设置成对在所述伪高频子带功率差异计算步骤中的处理所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;低频编码步骤,所述低频编码步骤被设置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及多路复用步骤,所述多路复用步骤被设置成对在所述低频编码步骤中的处理所生成的所述低频编码数据和在所述高频编码步骤中的处理所生成的所述高频编码数据进行多路复用,以获得输出代码串。
[0053]根据本发明的第二方面的使得计算机执行如下处理的程序,所述处理包括:子带划分步骤,所述子带划分步骤被设置成将输入信号划分成多个子带,并生成由低频侧的多个子带组成的低频子带信号和由高频侧的多个子带组成的高频子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述子带划分步骤中的处理所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;伪高频子带功率计算步骤,所述伪高频子带功率计算步骤被设置成基于由在所述特征量计算步骤中的处理所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;伪高频子带功率差异计算步骤,所述伪高频子带功率差异计算步骤被设置成根据在所述子带划分步骤中的处理所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由在所述伪高频子带功率计算步骤中的处理所计算的所述伪高频子带功率的差异;高频编码步骤,所述高频编码步骤被设置成对在所述伪高频子带功率差异计算步骤中的处理所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据;低频编码步骤,所述低频编码步骤被设置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及多路复用步骤,所述多路复用步骤被设置成对在所述低频编码步骤中的处理所生成的所述低频编码数据和在所述高频编码步骤中的处理所生成的所述高频编码数据进行多路复用,以获得输出代码串。
[0054]关于本发明的第二方面,将输入信号划分成多个子带;生成由低频侧的多个子带组成的低频子带信号和由高频侧的多个子带组成的高频子带信号;使用所述输入信号和所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量;基于所计算的特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率;根据所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率;计算伪高频子带功率差异,所述伪高频子带功率差异是相对于所计算的伪高频子带功率的差异;对所计算的伪高频子带功率差异进行编码,以生成高频编码数据;对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及对所生成的低频编码数据和所生成的高频编码数据进行多路复用,以获得输出代码串。
[0055]根据本发明的第三方面的解码设备,包括:多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成至少低频编码数据和索引;低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成所述低频子带的每一个的低频子带信号;以及生成装置,所述生成装置被配置成基于所述索引和所述低频子带信号来生成所述高频信号。
[0056]所述索引可以在对输入信号进行编码并输出所述编码数据的设备处基于在编码之前的所述输入信号和根据所述输入信号估计的所述高频信号来获得。
[0057]所述索引可以不被编码。
[0058]所述索引可以是是指示用于生成所述高频信号的估计系数的信息。
[0059]所述生成装置可以基于多个所述估计系数中的由所述索引所指示的所述估计系数来生成所述高频信号。
[0060]所述生成装置可以包括:特征量计算装置,所述特征量计算装置被配置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;高频子带功率计算装置,所述高频子带功率计算装置被配置成通过使用所述特征量和所述估计系数的计算来关于组成所述高频信号的频段的多个高频子带的每一个高频子带,计算所述高频子带的高频子带信号的高频子带功率;以及高频信号生成装置,所述高频信号生成装置被配置成基于所述高频子带功率和所述低频子带信号来生成所述高频信号。
[0061]所述高频子带功率计算装置可以通过通过使用为每个所述高频子带准备的所述估计系数来线性组合多个所述特征量以计算所述高频子带的所述高频子带功率。
[0062]所述特征量计算装置可以计算每个所述低频子带的所述低频子带信号的低频子带功率,以作为所述特征量。 [0063]所述索引可以是指示多个所述估计系数中如下的估计系数的信息,作为根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数生成的所述高频子带功率之间的比较的结果,获得最接近根据在编码之前的所述输入信号的所述高频信号所获得的所述高频子带功率的所述高频子带功率。
[0064]所述索引可以是指示如下的估计系数的信息,对于每个所述高频子带获得的在根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数而生成的所述高频子带功率之间的差异的平方和变为最小。
[0065]所述编码数据还可以包括表示在根据编码前的所述输入信号的所述高频信号而获得的所述高频子带功率与基于所述估计系数而生成的所述高频子带功率之间的差异的差异?目息。
[0066]所述差异/[目息可以是已编码的。
[0067]所述高频子带功率计算装置将包括在所述编码数据中的以所述差异信息表示的所述差异加到由使用所述特征量和所述估计系数的计算而获得的所述高频子带功率上;所述高频信号生成装置基于所述低频子带信号和已加上所述差异的所述高频子带功率来生成所述高频信号。
[0068]所述估计系数可以通过使用最小二乘法的回归分析来获得,其中,所述特征量作为解释变量,而所述高频子带功率作为被解释变量。
[0069]解码设备还可以包括系数输出装置,其中所述索引是指示由每个所述高频子带的所述差异所组成的差异向量的信息,其中所述差异向量以在根据编码前的所述输入信号的所述高频信号所获得的所述高频子带功率与基于所述估计系数所生成的所述高频子带功率之间的差异来作为元素,所述系数输出装置被配置成获得在所述差异的特征空间中的代表向量或代表值与由所述索引所指示的所述差异向量之间的距离,所述代表向量或代表值以预先针对每个所述估计系数所获得的所述高频子带的所述差异作为元素,并将多个所述估计系数中的所述距离最短的所述代表向量或所述代表值的所述估计系数提供给所述高频子带功率计算装置。
[0070]所述索引可以是指示多个所述估计系数中的如下估计系数的信息,作为编码前的所述输入信号的所述高频信号与基于所述估计系数而生成的所述高频信号之间的比较的结果,获得最接近编码前的所述输入信号的所述高频信号的所述高频信号。
[0071]所述估计系数可以通过回归分析来获得。
[0072]所述生成装置可以基于对编码的所述索引进行解码所获得的信息来生成所述高
频信号。
[0073]所述索引可以已经进行熵编码。
[0074]根据第三方面的解码方法或程序,包括:多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成至少低频编码数据和索引;低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;以及生成步骤,所述生成步骤被设置成基于所述索引和所述低频子带信号来生成所述高频信号。
[0075]关于本发明的第三方面,将输入编码数据多路解复用成至少低频编码数据和索引;对所述低频编码数据进行解码,以生成低频信号;将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信;以及基于所述索引和所述低频子带信号来生成所述高频信号。
[0076]根据本发明的第四方面的解码设备,包括:多路解复用装置,所述多路解复用装置被配置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;低频解码装置,所述低频解码装置被配置成对所述低频编码数据进行解码,以生成低频信号;子带划分装置,所述子带划分装置被配置成将所述低频信号的频段划分成多个低频子带,以生成每个所述低频子带的低频子带信号;特征量计算装置,所述特征量计算装置被配置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;高频子带功率计算装置,所述高频子带功率计算装置被配置成通过将所述特征量乘以估计系数并获得已乘以所述估计系数的所述特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带的预先准备的多个所述估计系数的所述索引来确定;以及高频信号生成装置,所述高频信号生成装置被配置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
[0077]所述特征量计算装置可以计算每个所述低频子带的所述低频子带信号的低频子带功率,以作为所述特征量。
[0078]所述索引可以是用于获得所述多个估计系数中的如下估计系数的信息,针对每个所述高频子带获得的差异的平方和变为最小,所述差异是在根据所述高频信号的真实值获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异。
[0079]所述索引还可以包括差异信息,所述差异信息表示在根据所述真实值获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异;所述高频子带功率计算装置还将包括在所述索引中的所述差异信息所表示的所述差异加到通过获得已乘以所述估计系数的所述特征量的总和从而获得的所述高频子带功率上;并且其中,所述高频信号生成装置使用所述低频子带信号和已经通过所述高频子带功率计算装置加上所述差异的所述高频子带功率来生成所述高频信号。
[0080]所述索引可以是指示所述估计系数的信息。
[0081]所述索引可以是通过对指示所述估计系数的信息进行熵编码所获得的信息;所述高频子带功率计算装置使用由通过解码所述索引所获得的信息所指示的估计系数来计算所述高频子带功率。
[0082]所述多个估计系数可以预先通过使用最小二乘法的回归分析来获得,其中,所述特征量作为解释变量,而所述高频子带功率作为被解释变量。
[0083]所述解码设备还可以包括系数输出装置,其中,所述索引是指示由每个所述高频子带的所述差异所组成的所述差异向量的信息,所述差异向量以根据所述高频信号的真实值所获得的所述高频子带功率与使用所述估计系数生成的所述高频子带功率之间的差异作为元素,所述系数输出装置被配置成获得在所述差异的特征空间中的代表向量或代表值与由所述索引所指示的差异向量之间的距离,所述代表向量或代表值以预先针对每个所述估计系数所获得的所述高频子带的所述差异作为元素,以及所述系数输出装置还被配置成将多个所述估计系数中的所述距离最短的所述代表向量或所述代表值的所述估计系数提供给所述高频子带功率计算装置。
[0084]根据本发明的第四方面的解码方法或程序,包括:多路解复用步骤,所述多路解复用步骤被设置成将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;低频解码步骤,所述低频解码步骤被设置成对所述低频编码数据进行解码,以生成低频信号;子带划分步骤,所述子带划分步骤被设置成将所述低频信号的频段划分成多个低频子带,以生成每个低频子带的低频子带信号;特征量计算步骤,所述特征量计算步骤被设置成使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;高频子带功率计算步骤,所述高频子带功率计算步骤被设置成通过将所述特征量乘以估计系数并获得已乘以所述估计系数的所述特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带预先准备的多个所述估计系数的所述索引来确定;以及高频信号生成步骤,所述高频信号生成步骤被设置成使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
[0085]关于本发明的第四方面,将输入编码数据多路解复用成低频编码数据和用于获得用来生成高频信号的估计系数的索引;对所述低频编码数据进行解码,以生成低频信号;将所述低频信号的频段划分成多个低频子带,以生成每个低频子带的低频子带信号;使用所述低频信号和所述低频子带信号中的至少一个来计算表示所述编码数据的特征的特征量;通过将所述特征量乘以估计系数并获得已乘以所述估计系数的所述特征量的总和来计算所述高频子带的高频子带信号的高频子带功率,所述估计系数由关于组成所述高频信号的频段的多个高频子带的每一个高频子带预先准备的多个所述估计系数的所述索引来确定;以及使用所述高频子带功率和所述低频子带信号来生成所述高频信号。
[0086]本发明的有益效果[0087]根据本发明的第一方面至第四方面,音乐信号可以由于频带的扩展而以较高的音质来播放。
【专利附图】
【附图说明】
[0088]图1是示出了用作输入信号的、解码后的低频功率谱和估计的高频包络的示例的图。
[0089]图2是示出了伴随有时间突变的攻击型音乐信号的原始功率谱的示例的图。
[0090]图3是示出了根据本发明的第一实施例的频带扩展设备的功能配置示例的框图。
[0091]图4是描述通过图3中的频带扩展设备的频带扩展处理的示例的流程图。
[0092]图5是示出了输入到图3中的频带扩展设备中的信号的功率谱以及带通滤波在频率轴上的定位的图。
[0093]图6是示出声乐段的频率特征以及估计高频功率谱的示例的图。
[0094]图7是示出了输入到图3的频带扩展设备中的信号的功率谱的示例的图。
[0095]图8是示出了图7的输入信号在同态滤波之后的功率谱的示例的图。
[0096]图9是示出了执行对在图3的频带扩展设备的高频信号生成电路中使用的系数的学习的系数学习设备的功能配置示例的框图。
[0097]图10是描述图9中的系数学习设备的系数学习处理的示例的流程图。
[0098]图11是示出根据本发明的第二实施例的编码设备的功能配置示例的框图。
[0099]图12是通过描述图11中的编码设备的编码处理的示例的流程图。
[0100]图13是示出了根据本发明的第二实施例的解码设备的功能配置示例的框图。
[0101]图14是描述了通过图13中的解码设备的解码处理的示例的流程图。
[0102]图15是示出了执行对在图11中的编码设备的高频编码电路中使用的代表向量以及在图13的解码设备的高频解码电路中使用的解码高频子带功率估计系数的学习的系数学习设备的功能配置示例的框图。
[0103]图16是描述通过图15中的系数学习设备的系数学习处理的示例的流程图。
[0104]图17是示出由图11中的编码设备输出的代码串的示例的图。
[0105]图18是示出了编码设备的功能配置示例的框图。
[0106]图19是描述编码处理的流程图。
[0107]图20是示出解码设备的功能配置示例的框图。
[0108]图21是描述解码处理的流程图。
[0109]图22是描述编码处理的流程图。
[0110]图23是描述解码处理的流程图。
[0111]图24是描述编码处理的流程图。
[0112]图25是描述编码处理的流程图。
[0113]图26是描述编码处理的流程图。
[0114]图27是描述编码处理的流程图。
[0115]图28是示出系数学习设备的配置示例的框图。
[0116]图29是描述系数学习处理的流程图。
[0117]图30是示出了通过程序执行应用了本发明的处理的计算机硬件的配置示例的框图。
【具体实施方式】
[0118]将参照附图来描述本发明的实施例。注意,将会以如下顺序给出描述。
[0119]1.第一实施例(将本发明应用于频带扩展设备的情况)
[0120]2.第二实施例(将本发明应用于编码设备和解码设备的情况)
[0121]3.第三实施例(在高频编码数据中包括系数索引的情况)
[0122]4.第四实施例(在高频编码数据中包括系数索引和伪高频子带功率差异的情况)
[0123]5.第五实施例(使用估计值来选择系数索引的情况)
[0124]6.第六实施例(共享一部分系数的的情况)
[0125]〈1.第一实施例〉
[0126]根据第一实施例,对于通过解码使用高频删除编码方法编码的编码数据而获得的解码后低频信号分量来执行扩展频带的处理(下文称为频带扩展处理)。 [0127][频带扩展设备的功能配置示例]
[0128]图3示出应用了本发明的频带扩展设备的功能配置示例。
[0129]对于作为输入信号的、解码后的低频信号分量,频带扩展设备10对于其输入信号执行频带扩展处理,并且输出作为结果获得的频带扩展处理后的信号,作为输出信号。
[0130]频带扩展设备10包括低通滤波器11、延迟电路12、带通滤波器13、特征量计算电路14、高频子带功率估计电路15、高频信号生成电路16、高通滤波器17以及信号相加单元18。
[0131]低通滤波器11以预定的截止频率对输入信号进行滤波,并将低频信号分量(即,低频率的信号分量)作为滤波后信号提供给延迟电路12。
[0132]为了在将来自低通滤波器11的低频信号分量与之后描述的高频信号分量相加时进行同步,延迟电路12将低频信号分量延迟一定量的延迟时间并随后将它提供给信号相加单元18。
[0133]带通滤波器13包括每一个具有不同通带的带通滤波器13-1至13-N。带通滤波器13-1(l ^ i ^N)允许输入信号的预定通带信号通过,以作为多个子带信号中的一个子带信号,并将它提供给特征量计算电路14和高频信号生成电路16。
[0134]特征量计算电路14使用输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算一个或更多个特征量,并将所述特征量提供给高频子带功率估计电路15。现在,特征量是表示输入信号的信号特征的信息。
[0135]高频子带功率估计电路15基于来自特征量计算电路14的一个或多个特征量来计算每个高频子带的高频子带功率(即,高频子带信号的功率)的估计值,并将它们提供给高频信号生成电路16。
[0136]高频信号生成电路16基于来自带通滤波器13的多个子带信号和来自高频子带功率估计电路15的多个子带功率的估计值来生成高频信号分量(即,高频率的信号分量),并将它们提供给高通滤波器17。
[0137]高通滤波器17以对应于在低通滤波器11中的截止频率的截止频率来对来自高频信号生成电路16的高频信号分量进行滤波,并将它提供给信号相加单元18。[0138]信号相加单元18将来自延迟电路12的低频信号分量与来自高通滤波器17的高频信号分量进行相加,并将它输出为输出信号。
[0139]注意,根据图3中的配置,使用带通滤波器13来获得子带信号,但是该配置不局限于此,例如,可以使用例如在PTLl中公开的频段划分滤波器。
[0140]另外,类似地,根据图3中的配置,使用信号相加单元18来对子带信号进行合成,但是该配置不局限于此,例如,可以使用例如在PTLl中公开的频段合成滤波器。
[0141][频带扩展设备的频带扩展处理]
[0142]接下来,将参照图4中的流程图来描述使用图3中的频带扩展设备的频带扩展处理。
[0143]在步骤SI中,低通滤波器11以预定的截止频率对输入信号进行滤波,并将作为滤波后信号的低频信号分量提供给延迟电路12。
[0144]低通滤波器11可以设置可选频率来作为截止频率,但是根据本实施例,其中以预定的频段来作为之后描述的扩展起始频段,截止频率被设置成对应于扩展起始频段的下端的频率。因此,低通滤波器11将作为滤波后信号的低频信号分量(频段低于扩展起始频段的信号分量)提供给延迟电路12。
[0145]另外,低通滤波器11还可以根据输入信号的编码参数例如高频删除编码方法和比特率等来设置作为截止频率的最佳频率。例如,可以将在PTLl中的频段扩展方法所使用的边信息用作编码参数。
[0146]在步骤S2中,延迟电路12将来自低通滤波器11的低频信号分量延迟正好一定量的延迟时间,并将它提供给信号相加单元18。
[0147]在步骤S3中,带通滤波器13 (带通滤波器13-1至13_N)将输入信号划分成多个子带信号,并将划分后的多个子带信号中的每个子带信号提供给特征量计算电路14和高频信号生成电路16。注意,将会在之后描述使用带通滤波器13来划分输入信号的处理的细节。
[0148]在步骤S4中,特征量计算电路14使用所述输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算一个或多个特征量,并将所述特征量提供给高频子带功率估计电路15。注意,将在之后描述使用特征量计算电路14来计算特征量的处理的细节。
[0149]在步骤S5中,高频子带功率估计电路15基于来自特征量计算电路14的一个或多个特征量来计算多个高频子带功率的估计值,并将这些估计值提供给高频信号生成电路16。注意,将会在之后描述使用高频子带功率估计电路15来计算高频子带功率的估计值的处理的细节。
[0150]在步骤S6中,高频信号生成电路16基于来自带通滤波器13的多个子带信号和来自高频子带功率估计电路15的多个高频子带功率的估计值来生成高频信号分量,并将这些高频信号分量提供给高通滤波器17。高频信号分量在此处为频段高于扩展起始频段的信号分量。注意,将在之后描述使用高频信号生成电路16来生成高频信号分量的处理的细节。
[0151]在步骤S7中,高通滤波器17对来自高频信号生成电路16的高频信号分量进行滤波,由此去除从重复分量到包括在高频信号分量中的低频的的噪声,并将高频信号分量提供给信号相加单元18。[0152]在步骤S8中,信号相加单元18将来自延迟电路12的低频信号分量和来自高通滤波器17的高频信号分量进行相加,并输出相加后的信号以作为输出信号。
[0153]根据以上处理,可以在解码之后针对解码后的低频信号分量来扩展频带。
[0154]接下来,将描述图4的流程图中的步骤S3至S6中的每一个步骤的处理的细节。
[0155][带通滤波器的处理的细节]
[0156]首先,将描述图4的流程图的步骤S3中的带通滤波器13的处理的细节。
[0157]注意,为了便于说明,下文中,带通滤波器13的数量N将会为:N = 4。
[0158]例如,可以将通过将输入信号的奈奎斯特频率划分成16个相等部分从而获得的16个子带中的一个子带设置为扩展起始频段,在所述16个子带中,分别将频段低于扩展起始频段的四个子带中的每一个子带设置为带通滤波器13-1至13-4的通带。
[0159]图5示出了带通滤波器13-1至13-4的每个通带在频率轴上的位置。
[0160]如图5所示,如果来自频段低于扩展起始频段的频带(子带)的高频的第一子带索引被表示为Sb,并 且第二子带索引表示为sb-Ι,第I个子带索引表示为Sb-(I — I),则带通滤波器13-1至13-4的每一个被指派为低于扩展起始频段的子带中的、具有Sb至sb-3的索引的每个子带的通带。
[0161]注意,根据本发明,将带通滤波器13-1至13-4的每一个通带描述为通过将输入信号的奈奎斯特频率划分成16个相等部分从而获得的16个子带中的预定的四个通带,但是不局限于此,通带可以是通过将输入信号的奈奎斯特频率划分成256个相等部分从而获得的256个子带中的预定的四个子带。另外,带通滤波器13-1至13-4中的每一个带通滤波器的带宽可以互不相同。
[0162][特征量计算电路的处理的细节]
[0163]接下来,将描述在图4的流程图的步骤S4中的特征量计算电路14的处理的细节。
[0164]特征量计算电路14使用输入信号和来自带通滤波器13的多个子带信号中的至少一个来计算被高频子带功率估计电路15用来计算高频子带功率估计值的一个或多个特征量。
[0165]更具体地,特征量计算电路14根据来自带通滤波器13的四个子带信号来计算每个子带的子带信号的功率(子带功率(下文中,还称为低频子带功率))作为特征量,并将它们提供给高频子带功率估计电路15。
[0166]也就是说,特征量计算电路14使用下面的表达式⑴根据从带通滤波器13提供的四个子带信号X(ib,η)求出某一预定时间帧内的低频子带功率,该低频子带功率称为power (ib, J)。此处,ib表示子带索引,η表示离散时间索引。注意,一个帧的样本数量为FSIZE,而功率以分贝表达。
[0167][表达式I]
f/(J+1)FSIZE-1β\I
power C ib, J) = 10 1gIO ^ Σ x( ib, n)2 /FSIZE >
L\ n=J*FSTZE/J
[0168]
(sb-3<ib<sb)
[0169]从而,使用特征量计算电路14求出的低频子带功率power (ib,J)被作为特征量提供给高频子带功率估计电路15。
[0170][使用高频子带功率估计电路的处理的细节]
[0171]接下来,将描述在图4的流程图的步骤S5中的使用高频子带功率估计电路15的处理的细节。
[0172]高频子带功率估计电路15基于从特征量计算电路14提供的四个子带功率来计算待扩展到索引为sb+Ι的子带(扩展起始频段)之上的频段(频率扩展频段)的子带功率(高频子带功率)的估计值。
[0173]也就是说,如果假定频率扩展频段的最高频段的子带索引为eb,则高频子带功率估计电路15估计其中索引为sb+Ι至eb的(eb_sb)个子带的子带功率。
[0174]在索引为ib的频率扩展频段的子带功率的估计值Powerest (ib,J)使用从特征量计算电路14提供的四个子带功率power (ib,J),并且例如可以以下面的表达式(2)来表达。
[0175][表达式2]
【权利要求】
1.一种编码设备,包括: 子带划分装置,所述子带划分装置被配置成将输入信号划分成多个子带,并生成由在低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号; 特征量计算装置,所述特征量计算装置被配置成使用所述输入信号和由所述子带划分装置生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量; 伪高频子带功率计算装置,所述伪高频子带功率计算装置被配置成基于由所述特征量计算装置所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率; 伪高频子带功率差异计算装置,所述伪高频子带功率差异计算装置被配置成根据由所述子带划分装置所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由所述伪高频子带功率计算装置所计算的所述伪高频子带功率的差异; 高频编码装置,所述高频编码装置被配置成对由所述伪高频子带功率差异计算装置所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据; 低频编码装置,所述低频编码装置被配置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及 多路复用装置,所述多路复用装置被配置成对由所述低频编码装置生成的所述低频编码数据和由所述高频编码装置生成的所述高频编码数据进行多路复用,以获得输出代码串O
2.根据权利要求1所述的编码设备,还包括: 低频解码装置,所述低频解码装置被配置成对由所述低频编码装置生成的所述低频编码数据进行解码,以生成低频信号; 其中,所述子带划分装置根据由所述低频解码装置生成的所述低频信号来生成所述低频子带信号。
3.根据权利要求1所述的编码设备,其中,所述高频编码装置计算在所述伪高频子带功率差异与在预定的多个伪高频子带功率差异空间中的代表向量或代表值之间的相似度,以生成与其相似度是最大值的代表向量或代表值对应的索引,以作为所述高频编码数据。
4.根据权利要求1所述的编码设备,其中,所述伪高频子带功率差异计算装置基于每个子带的所述伪高频子带功率和所述高频子带功率来针对用于计算所述伪高频子带功率的多个系数中的每一个计算评价值; 并且其中,所述高频编码装置生成指示作为最高评价值的所述评价值的系数的索引,以作为所述高频编码数据。
5.根据权利要求4所述的编码设备,其中,所述伪高频子带功率差异计算装置基于每个子带的所述伪高频子带功率差异的平方和、所述子带的所述伪高频子带功率的绝对值的最大值或每个子带的所述伪高频子带功率差异的平均值中的至少任何一个来计算所述评价值。
6.根据权利要求5所述的编码设备,其中,所述伪高频子带功率差异计算装置基于不同帧的所述伪高频子带功率差异来计算所述评价值。
7.根据权利要求5所述的编码设备,其中,所述伪高频子带功率差异计算装置使用乘以权重的所述伪高频子带功率差异来计算所述评价值,所述权重是针对每个子带的权重,使得所述子带越处于低频侧,所述子带的权重就越大。
8.根据权利要求5所述的编码设备,其中,所述伪高频子带功率差异计算装置使用乘以权重的所述伪高频子带功率差异来计算所述评价值,所述权重是针对每个子带的权重,使得子带的所述高频子带功率越大,所述子带的权重就越大。
9.一种编码方法,包括: 子带划分步骤,所述子带划分步骤被设置成将输入信号划分成多个子带,并生成由低频侧的多个子带组成的低频子带信号和由在高频侧的多个子带组成的高频子带信号; 特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和在所述子带划分步骤中的处理所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量; 伪高频子带功率计算步骤,所述伪高频子带功率计算步骤被设置成基于在所述特征量计算步骤中的处理所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率; 伪高频子带功率差异计算步骤,所述伪高频子带功率差异计算步骤被设置成根据由在所述子带划分步骤中的处理所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功 率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由在所述伪高频子带功率计算步骤中的处理所计算的所述伪高频子带功率的差异; 高频编码步骤,所述高频编码步骤被设置成对在所述伪高频子带功率差异计算步骤中的处理所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据; 低频编码步骤,所述低频编码步骤被设置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及 多路复用步骤,所述多路复用步骤被设置成对在所述低频编码步骤中的处理所生成的所述低频编码数据和在所述高频编码步骤中的处理所生成的所述高频编码数据进行多路复用,以获得输出代码串。
10.一种使得计算机执行如下处理的程序,所述处理包括: 子带划分步骤,所述子带划分步骤被设置成将输入信号划分成多个子带,并生成由低频侧的多个子带组成的低频子带信号和由高频侧的多个子带组成的高频子带信号; 特征量计算步骤,所述特征量计算步骤被设置成使用所述输入信号和由在所述子带划分步骤中的处理所生成的所述低频子带信号中的至少一个来计算表示所述输入信号的特征的特征量; 伪高频子带功率计算步骤,所述伪高频子带功率计算步骤被设置成基于由在所述特征量计算步骤中的处理所计算的所述特征量来计算作为所述高频子带信号的伪功率的伪高频子带功率; 伪高频子带功率差异计算步骤,所述伪高频子带功率差异计算步骤被设置成根据在所述子带划分步骤中的处理所生成的所述高频子带信号来计算作为所述高频子带信号的功率的高频子带功率,并计算伪高频子带功率差异,所述伪高频子带功率差异是相对于由在所述伪高频子带功率计算步骤中的处理所计算的所述伪高频子带功率的差异; 高频编码步骤,所述高频编码步骤被设置成对在所述伪高频子带功率差异计算步骤中的处理所计算的所述伪高频子带功率差异进行编码,以生成高频编码数据; 低频编码步骤,所述低频编码步骤被设置成对作为所述输入信号的低频信号的低频信号进行编码,以生成低频编码数据;以及 多路复用步骤,所述多路复用步骤被设置成对在所述低频编码步骤中的处理所生成的所述低频编码数据 和在所述高频编码步骤中的处理所生成的所述高频编码数据进行多路复用,以获得输出代码串。
【文档编号】G10L19/02GK103996402SQ201410208486
【公开日】2014年8月20日 申请日期:2010年9月29日 优先权日:2009年10月7日
【发明者】山本优树, 知念彻, 本间弘幸, 光藤祐基 申请人:索尼公司