专利名称:音调周期搜索范围设置装置和音调周期搜索装置的利记博彩app
技术领域:
本发明涉及音调(pitch)周期搜索范围设置装置和音调周期搜索装置,特别涉及码激励线性预测(CELP)型语音编码装置的音调周期搜索范围设置装置和音调周期搜索装置。
背景技术:
在诸如以数字通信和因特网通信为代表的分组通信、或语音存储等领域中,语音信号编码/解码技术是高效利用无线电波传输路径容量和存储介质的关键,当前已开发了许多语音编码/解码方法。
其中,在以中等或低位速率编码/解码语音信号时,码激励线性预测(CELP)型语音编码/解码方法广泛作为主流方法使用。在文献1(Proc.ICASSP′85,pp.937-pp.940,1985)中公开了CELP型语音编码/解码方法。
在CELP型语音编码/解码方法中,将已数字化的语音信号划分为大约20ms的多个帧,为每个帧进行对语音信号的线性预测分析,求出线性预测数和线性预测剩余向量,并单个地对线性预测数和线性预测剩余向量进行编码/解码。线性预测剩余向量也叫做激励信号向量。
使用自适应代码本和固定代码本对线性预测剩余向量进行编码/解码,所述自适应代码本中保存有过去产生的驱动声源信号,所述固定代码本中存储指定数量的定形向量(固定代码向量)。
该自适应代码本用于代表线性预测剩余向量具有的循环分量。另一方面,固定代码本用于代表线性预测剩余向量中不能由自适应代码本代表的非循环分量。一般而言,在通过将帧划分为较短的时间单元(大约5ms至10ms)而得到的子帧单元中进行线性预测剩余向量编码/解码处理。
使用CELP,从线性预测剩余向量中寻找音调周期,并进行编码。下面描述传统线性预测剩余音调周期搜索装置。图1是展示传统音调周期搜索装置的构造的方框图。
图1中的音调周期搜索装置10主要包括音调周期指示器(PCI)11、自适应代码本(ACB)12、自适应声源向量发生器(ASSVG)13、整数音调周期搜索器(IPCS)14、小数音调周期自适应声源向量发生器(FPCASSVG)15、小数音调周期搜索器(FPCS)16、以及失真比较器(DC)17。
音调周期指示器(PCI)11给自适应声源向量发生器(ASSVG)13依次指示预设音调周期搜索范围内想要的音调周期T-int。例如,当CELP语音编码/解码装置对16kHz语音信号进行编码/解码,并且从32至267以整数精确度预设目标向量音调周期搜索范围,而从32+1/2、33+1/2、...、至51+1/2以1/2小数精确度预设目标向量音调周期搜索范围时,音调周期指示器(PCI)11向自适应声源向量发生器(ASSVG)13输出236种音调周期T-int(T-int=32、33、...、267)。自适应代码本(ACB)12存储过去产生的驱动声源信号。
接着,自适应声源向量发生器(ASSVG)13从自适应代码本(ACB)12中提取具有从音调周期指示器(PCI)11接收到的整数精确度音调周期T-int的自适应声源向量p(t-int),并将其输出到整数音调周期搜索器(IPCS)14。
下面描述从自适应代码本(ACB)12中提取具有从整数精确度音调周期T-int的自适应声源向量p(t-int)的处理。图2展示帧构造的例子。
在图2中,帧21和帧31是存储在自适应代码本中的过去的驱动声源信号序列。自适应声源向量发生器(ASSVG)13在音调周期搜索范围的下限32和上限267之间搜索帧音调周期。
由于从帧21检索到的音调周期22长于子帧23的长度,自适应声源向量发生器(ASSVG)13把从帧21中以子帧的帧长度提取出的部分23当作自适应声源向量。
同样,由于从帧31检索到的音调周期32短于子帧33的长度,自适应声源向量发生器(ASSVG)13提取自适应声源向量直到音调周期32,并把通过迭代提取向量部分33直到子帧长度的长度而获得的向量部分当作自适应声源向量。
此外,自适应声源向量发生器(ASSVG)13从自适应代码本(ACB)12中提取当求出对应于小数精确度音调周期的自适应声源向量时必要的自适应声源向量,并将其输出到小数音调周期自适应声源向量发生器(FPCASSVG)15。
接下来,整数音调周期搜索器(IPCS)14从具有整数音调周期T-int的自适应声源向量p(t-int)、组合滤波器脉冲响应矩阵H、以及目标向量X,计算整数音调周期选择标准DIST(T-int)。
公式(1)用于计算整数音调周期选择标准(measure)DIST(T-int)。
DIST(T-int)=[xHP(T-int)]2|Hp(T-int)|2(T-int=32,33,...,267)]]>公式(1)当计算整数音调周期选择标准DIST(T-int)时,可以通过给组合滤波器脉冲响应矩阵H乘以听觉加权滤波器脉冲响应矩阵W获得矩阵H′,而在公式(1)中使用矩阵H′来代替组合滤波器脉冲响应矩阵H。
这里,整数音调周期搜索器(IPCS)14使用公式(1),对由音调周期指示器(PCI)11指示的从音调周期32至267的音调周期T-int的236个变化,重复执行整数音调周期选择标准DIST(T-int)计算处理。
整数音调周期搜索器(IPCS)14还从236个计算出的整数音调周期选择标准DIST(T-int)中,选择具有最大值的DIST(T-int),并向失真比较器(DC)17输出所选择的DIST(T-int)。另外,整数音调周期搜索器(IPCS)14向失真比较器(DC)17,输出与计算DIST(T-int)时参考的自适应声源向量音调周期T-int对应的索引,作为IDX(INT)。
接下来,小数音调周期自适应声源向量发生器(FPCASSVG)15通过对从自适应声源向量发生器(ASSVG)13接收的自适应声源向量和SYNC函数的乘积求和操作,求出具有小数精确度音调周期T-frac(32+1/2、33+1/2、...、51+1/2)的自适应声源向量p(T-frac),并向小数音调周期搜索器(FPCS)16输出该p(T-frac)。
然后,小数音调周期搜索器(FPCS)16用具有小数音调周期T-frac的自适应声源向量p(T-frac)、组合滤波器脉冲响应矩阵H、以及目标向量X,计算小数音调周期选择标准DIST(T-frac)。公式(2)用于计算小数音调周期选择标准DIST(T-frac)。
DIST(T-frac)=[xHP(T-frac)]2|Hp(T-frac)|2(T-frac=32+12,33+12,...,51+12)]]>公式(2)当计算小数音调周期选择标准DIST(T-frac)时,可以通过给组合滤波器脉冲响应矩阵H乘以听觉加权滤波器脉冲响应矩阵W获得矩阵H',而在公式(1)中使用矩阵H′来代替组合滤波器脉冲响应矩阵H。
这里,小数音调周期搜索器(FPCS)16使用公式(2),对从音调周期32+1/2至51+1/2的小数音调周期T-frac的20个变化,重复执行小数音调周期选择标准DIST(T-frac)计算处理。
小数音调周期搜索器(FPCS)16还从20个计算出的小数音调周期选择标准DIST(T-frac)中,选择具有最大值的DIST(T-frac),并向失真比较器(DC)17输出所选择的DIST(T-frac)。
另外,小数音调周期搜索器(FPCS)16向失真比较器(DC)17,输出与计算DIST(T-frac)时参考的自适应声源向量音调周期T-frac对应的索引,作为IDX(FRAC)。
接下来,失真比较器(DC)17比较从整数音调周期搜索器(IPCS)14接收的DIST(INT)和从小数音调周期搜索器(FPCS)16接收的DIST(FRAC)的值。然后,失真比较器(DC)17确定当计算出具有较大的DIST(INT)和DIST(FRAC)值的音调周期选择标准DIST时的音调周期为最佳音调周期,并输出对应于最佳音调周期的索引作为最佳索引IDX。
与上例中一样,当选择从32至267的整数精确度音调周期搜索范围、和从32+1/2至51+1/2的小数精确度音调周期搜索范围为音调周期搜索范围时,总共提供256(256=236+20)个整数精确度和小数精确度音调周期搜索候选者,并将最佳索引IDX编码为8位二进制数据。
上述“使用自适应代码本的线性预测剩余音调周期搜索装置”的特征在于,在对应于比以整数精确度搜索的音调周期搜索范围短的音调周期的部分,既以整数精确度进行音调周期搜索,又进行1/2小数精确度音调周期搜索,还进行从以整数精度检索出的最佳音调周期和以小数精确度检索出的最佳音调周期中,对最终音调周期的选择。
因此,使用传统音调搜索装置,对包含许多相对较短的音调周期的女性嗓音,可以有效地对线性预测剩余音调周期进行编码/解码。在文献2(IEEEJOURNAL ON SELECTED AREAS IN COMMUNICATIONS,pp.31-pp.41,VOL.13,No.1,JANUARY 1995)等中公开了上述特征和效果。
然而,使用传统音调搜索装置,以小数精确度搜索音调周期的范围限于很短的音调周期,所以,对于包含许多相对较长的音调周期的男性嗓音,在以小数精确度搜索音调周期的范围之外搜索音调周期,只以整数精确度搜索音调周期,这导致音调周期分辨率下降的问题,从而难于有效地进行编码/解码。
发明内容
本发明的目的是提供使得能够有效地对语音信号音调周期进行编码/解码的音调搜索装置。
通过不固定以小数精确度搜索音调周期的范围,而在从先前子帧中检索出的音调周期的附近以小数精确度搜索,来实现该目的。
本发明提供了一种音调周期搜索范围设置装置,包括音调周期指示部件,其在以子帧为基础搜索语音信号中包括的音调周期的音调周期搜索处理中,以整数精确度给自适应声源向量发生部件依次指示预设音调周期搜索范围内的音调周期候选者;自适应声源向量发生部件,用于从存储过去的驱动声源的自适应代码本中,提取具有由所述音调周期指示部件指示的音调周期的自适应声源向量;以及上一子帧整数音调周期存储部件,用于存储对先前子帧的音调周期搜索处理中最后选择的音调周期的整数分量,其中所述音调周期搜索范围设置装置将整数精确度音调周期搜索候选者和小数精确度音调周期搜索候选者的双方或两者之一设置为在正在处理的子帧部分的音调周期搜索处理中的音调周期搜索对象,其中由所述音调周期指示部件指示所述整数精确度音调周期候选者,所述小数精确度音调周期搜索候选者以小数精确度覆盖在从所述上一子帧整数音调周期存储部件中读取的整数精确度音调周期的附近的音调周期。
图1是展示传统音调周期搜索装置结构的方框图;图2展示帧结构的例子;图3是展示本发明实施例1的音调周期搜索装置的构造的方框图;图4是展示该实施例的音调周期搜索装置的操作的例子的流程图;图5是展示本发明实施例2的解码自适应声源向量发生装置的构造的方框图;图6是展示图4的语音解码部件503内部构造的方框图;
图7是展示语音编码装置403的构造的方框图;图8是展示图6中语音解码部件503的内部构造的方框图。
具体实施例方式
下面参考附图详细描述本发明的实施例。
(实施例1)图3是展示本发明实施例1的音调周期搜索装置的构造的方框图。图3中的音调周期搜索装置100主要包括音调周期指示器(PCI)101、自适应代码本(ACB)102、自适应声源向量发生器(ASSVG)103、整数音调周期搜索器(IPCS)104、小数音调周期自适应声源向量发生器(FPCASSVG)105、小数音调周期搜索器(FPCS)106、失真比较器(DC)107、上一子帧整数音调周期存储器(LSFIPCS)108、最佳音调周期精确度判断部件(OPCAJS)109、以及比较判断部件(CJS)110。
音调周期指示器(PCI)101给自适应声源向量发生器(ASSVG)103依次指示预设音调周期搜索范围内的音调周期T-int。自适应代码本(ACB)102存储过去产生的驱动声源信号。
自适应声源向量发生器(ASSVG)103根据从音调周期指示器(PCI)101接收到的指令从自适应代码本(ACB)102中提取具有的整数精确度音调周期T-int的自适应声源向量p(t-int),并向整数音调周期搜索器(IPCS)104输出该自适应声源向量p(t-int)。
自适应声源向量发生器(ASSVG)103从上一子帧整数音调周期存储器(LSFIPCS)108中读取在先前的子帧中选择的整数精确度音调周期T0,设置以该音调周期T0为中心的在前的和随后的音调周期为搜索小数精确度音调频率的范围,从自适应代码本(ACB)102中提取具有在这一范围内的小数精确度音调周期T-frac的自适应声源向量p(T-frac),并向小数音调周期自适应声源向量发生器(FPCASSVG)105输出所提取的自适应声源向量。
整数音调周期搜索器(IPCS)104用从自适应声源向量发生器(ASSVG)103接收的自适应声源向量p(t-int)、组合滤波器脉冲响应矩阵H、以及目标向量x,计算整数音调周期选择标准DIST(T-int)。然后,整数音调周期搜索器(IPCS)104从整数音调周期选择标准DIST(T-int)中选择值最大的DIST(T-int),并向失真比较器(DC)107输出所选DIST(T-int)。
小数音调周期自适应声源向量发生器(FPCASSVG)105通过对从自适应声源向量发生器(ASSVG)103接收的自适应声源向量和SYNC函数的乘积求和操作,求出具有小数精确度音调周期T-frac(T-frac=T0-10+1/2、T0-9+1/2、...、T0+9+1/2)的自适应声源向量p(T-frac),并向小数音调周期搜索器(FPCS)106输出该p(T-frac)。
小数音调周期搜索器(FPCS)106用从小数音调周期自适应声源向量发生器(FPCASSVG)105接收的自适应声源向量p(T-frac)、组合滤波器脉冲响应矩阵H、以及目标向量x,计算小数音调周期选择标准DIST(T-frac)。然后,小数音调周期搜索器(FPCS)106从小数音调周期选择标准DIST(T-frac)中选择具有最大值的DIST(T-frac),并向失真比较器(DC)107输出所选择的DIST(T-frac)。
失真比较器(DC)107比较从整数音调周期搜索器(IPCS)104接收的DIST(INT)和从小数音调周期搜索器(FPCS)106接收的DIST(FRAC)的值。然后,失真比较器(DC)107确定当计算出具有较大的DIST(INT)和DIST(FRAC)值的音调周期选择标准DIST时的音调周期为最佳音调周期,并输出IDX(INT)和IDX(FRAC)的、对应于最佳音调周期的索引作为最佳索引IDX。
然后,失真比较器(DC)107向上一子帧整数音调周期存储器(LSFIPCS)108输出最佳音调周期整数分量T0,并向最佳音调周期精确度判断部件(OPCAJS)109输出最佳音调周期。
上一子帧整数音调周期存储器(LSFIPCS)108存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0,并且在搜索下一子帧的音调周期时,向自适应声源向量发生器(ASSVG)103输出该最佳音调周期整数分量T0。
最佳音调周期精确度判断部件(OPCAJS)109判断最佳音调周期为整数精确度还是小数精确度。比较判断部件(CJS)110限制在最佳音调周期中选择小数精确度音调信息的次数。
接下来,将描述本实施例的音调周期搜索装置的操作。图4是展示本实施例的音调周期搜索装置的操作的例子的流程图。
在图4中,在步骤(下文中简称为“ST”)201,由自适应声源向量发生器(ASSVG)103从上一子帧整数音调周期存储器(LSFIPCS)108中,读取在先前子帧中选择的整数精确度音调周期T0。
在ST202,由自适应声源向量发生器(ASSVG)103产生自适应声源向量。在ST203,由整数音调周期搜索器(IPCS)104搜索最佳整数精确度音调周期T-int。
在ST204,比较判断部件(CJS)110判断是否需要小数精确度音调周期搜索。如果需要小数精确度音调周期搜索,则处理流程进入ST205。如果不需要小数精确度音调周期搜索,则处理流程进入ST207。
在ST205,由小数音调周期自适应声源向量发生器(FPCASSVG)105产生具有小数精确度音调周期T-frac的自适应声源向量。在ST206,由小数音调周期搜索器(FPCS)106搜索最佳小数精确度音调周期T-frac。
在ST207,由失真比较器(DC)107从最佳整数精确度音调周期T-int和最佳小数精确度音调周期T-frac中选择最佳音调周期。在ST208,在上一子帧整数音调周期存储器(LSFIPCS)108中存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0。
在ST209,最佳音调周期精确度判断部件(OPCAJS)109判断由失真比较器(DC)107选择的最佳音调周期是整数精确度音调周期还是小数精确度音调周期。
在ST210,由比较判断部件(CJS)110将指示选择小数精确度音调周期为最佳音调周期的次数的计数器重置为0。在ST211,由比较判断部件(CJS)110使指示选择小数精确度音调周期为最佳音调周期的次数的计数器增加1。
在ST212,如果音调周期搜索装置100的处理没有结束,则处理流程返回ST201。
下面,以在对16kHz语音信号进行编码/解码的CELP语音编码/解码装置中的、具有上述构造的音调周期搜索装置100具有8位大小的自适应代码本,并进行目标音调周期搜索为例,描述详细操作。
音调周期指示器(PCI)101给自适应声源向量发生器(ASSVG)103依次指示预设音调周期搜索范围内的音调周期T-int。例如,当在对采样频率为16kHz的语音信号进行编码/解码的CELP语音编码/解码装置中,从32至267以整数精确度预设目标向量音调周期搜索范围,而从32+1/2至51+1/2以小数精确度预设目标向量音调周期搜索范围,音调周期指示器(PCI)101向自适应声源向量发生器(ASSVG)103依次输出音调周期T-int(T-int=32、33、...、267)。
接下来,自适应声源向量发生器(ASSVG)103根据从音调周期指示器(PCI)101接收到的指令从自适应代码本(ACB)102中提取具有整数精确度音调周期T-int的自适应声源向量p(t-int),并向整数音调周期搜索器(IPCS)104输出该自适应声源向量p(t-int)。
自适应声源向量发生器(ASSVG)103从上一子帧整数音调周期存储器(LSFIPCS)108中读取在先前的子帧中选择的整数精确度音调周期T0,设置以该音调周期T0为中心的在前的和随后的音调周期为搜索小数精确度音调频率的范围,从自适应代码本(ACB)102中提取具有在这一范围内的小数精确度音调周期T-frac的自适应声源向量p(T-frac),并向小数音调周期自适应声源向量发生器(FPCASSVG)105输出所提取的自适应声源向量。
具体说来,自适应声源向量发生器(ASSVG)103以整数分量T0为中心设置20个音调周期T-frac(T-frac=T0-10+1/2、T0-9+1/2、...、T0+9+1/2),并从自适应代码本(ACB)102中提取具有这些音调周期的自适应声源向量p(T-frac)。
然后,整数音调周期搜索器(IPCS)104使用下面给出的公式(3),用从自适应声源向量发生器(ASSVG)103接收的自适应声源向量p(t-int)、组合滤波器脉冲响应矩阵H、以及目标向量x,计算整数音调周期选择标准DIST(T-int)。
DIST(T-int)=[xHP(T-int)]2|Hp(T-int)|2(T-int=32,33,...,267)]]>公式(3)这里整数音调周期搜索器(IPCS)104使用公式(3),对由音调周期指示器(PCI)101指示的从音调周期32至267的音调周期T-int的236个变化,重复执行整数音调周期选择标准DIST(T-int)计算处理。
整数音调周期搜索器(IPCS)104还从236个计算出的整数音调周期选择标准DIST(T-int)中,选择具有最大值的DIST(T-int),并向失真比较器(DC)107输出所选择的DIST(T-int)。另外,整数音调周期搜索器(IPCS)104向失真比较器(DC)107,输出与计算DIST(T-int)时参考的自适应声源向量音调周期T-int对应的索引,作为IDX(INT)。
接下来,小数音调周期自适应声源向量发生器(FPCASSVG)105通过对从自适应声源向量发生器(ASSVG)103接收的自适应声源向量和SYNC函数的乘积求和操作,求出具有小数精确度音调周期T-frac(T-frac=T0-10+1/2、T0-9+1/2、...、T0+9+1/2)的自适应声源向量p(T-frac),并向小数音调周期搜索器(FPCS)106输出该p(T-frac)。
然后,小数音调周期搜索器(FPCS)106用具有小数音调周期T-frac的自适应声源向量p(T-frac)、组合滤波器脉冲响应矩阵H、以及目标向量X,计算小数音调周期选择标准DIST(T-frac)。公式(4)用于计算小数音调周期选择标准DIST(T-frac)。
DIST(T-frac)=[xHP(T-frac)]2|Hp(T-frac)|2]]>(T-frac=T0-10+12,T0-9+12,...,T0+9+12)]]>公式(4)这里,小数音调周期搜索器(FPCS)106使用公式(4),对从音调周期T0-10+1/2至T0+9+1/2的小数音调周期T-frac的20个变化,重复执行小数音调周期选择标准DIST(T-frac)计算处理。
然后,小数音调周期搜索器(FPCS)106从20个计算出的小数音调周期选择标准DIST(T-frac)中,选择具有最大值的DIST(T-frac),并向失真比较器(DC)107输出所选择的DIST(T-frac)。另外,小数音调周期搜索器(FPCS)106向失真比较器(DC)107,输出与计算DIST(T-frac)时参考的自适应声源向量音调周期T-frac对应的索引,作为IDX(FRAC)。
接下来,失真比较器(DC)107比较从整数音调周期搜索器(IPCS)104接收的DIST(INT)和从小数音调周期搜索器(FPCS)106接收的DIST(FRAC)的值。然后,失真比较器(DC)107确定当计算出具有较大的DIST(INT)和DIST(FRAC)值的音调周期选择标准DIST时的音调周期为最佳音调周期,并输出IDX(INT)和IDX(FRAC)的、对应于最佳音调周期的索引作为最佳索引IDX。
然后,失真比较器(DC)107向上一子帧整数音调周期存储器(LSFIPCS)108输出最佳音调周期整数分量T0,并向最佳音调周期精确度判断部件(OPCAJS)109输出最佳音调周期。
与上例中一样,当选择从32至267的整数精确度音调周期搜索范围、和从T0-10+1/2至T0+9+1/2的小数精确度音调周期搜索范围为音调周期搜索范围时,总共提供256(256=236+20)个整数精确度和小数精确度音调周期搜索候选者,并将最佳索引IDX编码为8位二进制数据。
上一子帧整数音调周期存储器(LSFIPCS)108存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0,并且在搜索下一子帧的音调周期时,向自适应声源向量发生器(ASSVG)103输出该最佳音调周期整数分量T0。
最佳音调周期精确度判断部件(OPCAJS)109判断最佳音调周期为整数精确度周期还是小数精确度周期。当最佳音调周期为整数精确度,最佳音调周期精确度判断部件(OPCAJS)109将比较判断部件(CJS)110计数器重置为0。当最佳音调周期为小数精确度,最佳音调周期精确度判断部件(OPCAJS)109给比较判断部件(CJS)110计数器加1。
具体说来,比较判断部件(CJS)110拥有指示选择小数精确度音调周期为最佳音调周期的次数的计数器,并且比较判断部件(CJS)110比较计数值和预设非负整数N。如果计数值大于整数N,则比较判断部件(CJS)110向小数音调周期自适应声源向量发生器(FPCASSVG)105,输出指示不进行小数精确度音调周期的指令。如果计数值小于整数N,则比较判断部件(CJS)110向小数音调周期自适应声源向量发生器(FPCASSVG)105,输出指示要进行小数精确度音调周期的指令。
因此,根据本实施例的音调周期搜索装置,通过不固定以小数精确度搜索音调周期的范围,而在先前子帧中检索到的音调周期的附近以小数精确度搜索,即使对具有长音调周期的语音信号或对语音信号线性预测剩余,也有可能以高分辨率执行音调周期搜索。
同样,根据本实施例的音调周期搜索装置,通过在先前子帧中检索到的音调周期的附近以小数精确度搜索,有可能即使音调周期不足也改善对语音信号线性预测剩余的搜索精确度,并有可能进行高质量的语音编码和解码。
在上面的描述中,描述了使用自适应代码本搜索线性预测剩余音调周期的例子,但是音调周期搜索的目的不限于线性预测剩余,本实施例可以应用于任何具有音调周期的语音信号信息。
此外,在上面的描述中,当计算音调周期选择标准时,整数精确度音调周期搜索和小数精确度音调周期搜索被描述为使用闭环程序,但是这不是限制,用任何进行整数精确度音调周期搜索和小数精确度音调周期搜索的程序,并且比较整数精确度音调周期和小数精确度音调周期都可以实现相似的结果。
例如,如果使用上述构造执行两阶段(开环和闭环)音调周期搜索,则构造包括整数音调周期搜索器(IPCS)104和小数音调周期搜索器(FPCS)106的失真比较器(DC)107,使用从自适应声源向量发生器(ASSVG)103接收的具有整数精确度音调周期的自适应声源向量、和从小数音调周期自适应声源向量发生器(FPCASSVG)105接收的具有小数精确度音调周期的自适应声源向量,并在失真比较器(DC)107中,借助于划分为两个阶段(开环搜索和闭环搜索)的程序进行对应于要处理的子帧的最佳音调周期的索引。
此外,在上面的描述中,音调周期搜索范围取为32至267,但是对音调周期搜索范围并没有具体的限定,只要不固定小数精确度音调周期搜索范围,就可以获得与上述情况相似的结果。
同样,在上面的描述中,小数精确度音调周期搜索范围被取为以整数精确度音调周期T0为中心的20个音调周期T-frac(T-frac=T0-10+1/2、T0-9+1/2、...、T0+9+1/2),但是对音调周期范围并没有具体的限定,可以使用基于整数精确度音调周期设置的任何范围。
此外,描述了选择最佳音调周期为小数精确度的最大次数为固定值N的情况,但是,该值N也可以根据通信环境自适应地增加或减小。
此外,在上面的描述中,选择小数精确度的次数被限定为连续N次,但是也有可能将N设置为无穷,并使选择小数精确度音调周期的次数为无穷。
具体说来,如果在发射音调周期索引时——例如在包括该音调周期索引的编码信息被写入存储介质时——不需要考虑差错的出现,在不限定小数精确度音调周期选择次数的情况下,通过使选择小数精确度音调周期的次数为无穷,可以以高分辨率对音调周期搜索的结果进行编码。
此外,在上面的描述中,描述了当选择小数精确度音调周期的次数超过预定界限时不以小数精确度进行音调周期搜索的例子,但是这不是限制,当选择小数精确度音调周期的次数超过预定界限时,也可以在预定范围内——例如从32+1/2至51+1/2——执行小数精确度音调周期搜索。
通过在选择小数精确度音调周期的次数超过预定界限时以这种方式进行小数精确度音调周期搜索,即使在发射音调周期索引时出现差错,也有可能以高分辨率对音调周期搜索的结果进行编码。
在上面的描述中,当计算整数音调周期选择标准DIST(T-int)或DIST(T-frac)时,可以通过给组合滤波器脉冲响应矩阵H乘以听觉加权滤波器脉冲响应矩阵W获得矩阵H′,而使用矩阵H′来代替组合滤波器脉冲响应矩阵H。
(实施例2)图5是展示本发明实施例2的解码自适应声源向量发生装置的构造的方框图。
图5中的自适应声源向量发生装置300主要包括自适应代码本(ACB)301、上一子帧整数音调周期存储器(LSFIPCS)302、音调周期判断部件(PCJS)303、自适应声源向量发生器(ASSVG)304、以及小数音调周期自适应声源向量发生器(FPCASSVG)305。
自适应代码本(ACB)301存储过去产生的驱动声源信号。
上一子帧整数音调周期存储器(LSFIPCS)302接收由音调周期判断部件(PCJS)303判断出的音调周期的整数分量T0,并且在处理下一子帧时,向音调周期判断部件(PCJS)303输出这一T0。
音调周期判断部件(PCJS)303判断对应于索引IDX的音调周期为整数精确度还是小数精确度。然后,音调周期判断部件(PCJS)303使用从编码端发射的索引IDX、和在先前子帧中选择的音调周期的整数分量T0,设置音调周期。
如果,例如,所接收到的IDX指示为整数精确度音调周期,则音调周期判断部件(PCJS)303将对应于索引IDX的音调周期传送给自适应声源向量发生器(ASSVG)304。
如果索引IDX指示为小数精确度音调周期,则音调周期判断部件(PCJS)303从有关对应于索引IDX的音调周期和先前子帧的音调周期整数分量T0的信息中,求出该音调周期,并将所获得的音调周期传送给自适应声源向量发生器(ASSVG)304。具体说来,音调周期判断部件(PCJS)303从小数精确度音调周期范围(-10+1/2、-9+1/2、...、9+1/2)中求出对应于索引IDX的值,并以给该值加上T0所得的结果作为小数精确度音调周期。
音调周期判断部件(PCJS)303还拥有计数器,用于对对应于索引IDX的音调周期为小数精确度音调周期的次数计数。
当,例如,对应于索引IDX的音调周期为小数精确度时,音调周期判断部件(PCJS)303给计数器加1。当对应于索引IDX的音调周期为整数精确度时,音调周期判断部件(PCJS)303将计数器重置为0。
当音调周期为整数精确度时,自适应声源向量发生器(ASSVG)304从自适应代码本(ACB)301中根据从音调周期判断部件(PCJS)303接收到的指令提取具有音调周期T-int的自适应声源向量p(t-int),并输出自适应声源向量p(t-int)。
当音调周期为小数精确度时,自适应声源向量发生器(ASSVG)304从自适应代码本(ACB)301中取出,在根据从音调周期判断部件(PCJS)303接收到的指令提取具有音调周期T-frac的自适应声源向量p(T-frac)时所需要的,自适应声源向量,并将其输出到小数音调周期自适应声源向量发生器(FPCASSVG)305。
小数音调周期自适应声源向量发生器(FPCASSVG)305通过对从自适应声源向量发生器(ASSVG)304接收的自适应声源向量和SYNC函数的乘积求和操作,求出具有小数精确度音调周期T-frac的自适应声源向量p(T-frac),并向小数音调周期搜索器(FPCS)16输出该p(T-frac)。
(实施例3)在实施例3中,描述使用实施例1的音调周期搜索装置或实施例2的解码自适应声源向量发生装置,在发射装置和接收装置中进行通信的例子。
图6是展示本发明实施例3的语音信号发射装置和接收装置的内部结构的方框图。
图6中的语音信号发射装置400主要包括输入部件401、A/D转换器402,语音编码装置403,RF调制器404、以及发射天线405。图6中的语音信号接收装置主要包括接收天线501、RF解调器502、语音解码装置503、D/A转换器504、以及输出部件505。
图6中,由输入部件401将语音信号转换为电信号,然后将其输出到A/D转换器402。A/D转换器402将从输入部件输出的(模拟)信号转换为数字信号,并将该信号输出到语音编码装置403。语音编码装置403拥有根据前述任何一个实施例的信号处理装置,采用如后所述的语言编码方法对从A/D转换器402输出的数字语言信号进行编码,并将编码信息输出到RF调制器404。RF调制器404将从语言编码装置输出的语言编码信息放置到诸如无线电波的传播介质上,转换信号用以发送,并且将其输出到发射天线405。发射天线405将从RF调制器404输出的输出信号作为无线电波(RF信号)发送。
由接收天线501接收RF信号,并输出到RF解调器502。图中的RF信号是从接收端来看的RF信号,并且如果传播路径中没有信号衰减或噪声叠加,则其与发射RF信号完全相同。RF解调器502对从接收天线501输出的RF信号中的语音已编码信息进行解调,并向语音解码部件503输出该信息。语音解码部件503拥有根据前述任何一个实施例的信号处理装置,使用后文中将描述的语音解码方法对从RF解调器502输出的语音已解码信息进行解码,并向D/A转换器504输出所得信号。D/A转换器504将从语音解码部件503输出的数字语音信号转换为模拟电信号,并向输出部件505输出该信号。输出部件505将电信号转换为空气的振动,并输出人类耳朵可以听到的声波。
通过提供上述各类语音信号发射装置和接收装置中至少一个,有可能构造移动通信系统中的基站装置和移动终端装置。
语音信号发射装置400的特别特征在于语音编码装置403。图7是展示语音编码装置403的构造的方框图。
图7中的语音编码装置主要包括预处理部件601、LPC分析部件602、LPC量化部件603、组合滤波器604、加法器605、自适应声源代码本606、量化增益发生器607、固定声源代码本608、乘法器609、乘法器610、加法器611、听觉加权部件612、参数确定部件613、以及多路复用器614。
图7中,将从图6的A/D转换器输出的输入语音信号输入到预处理部件601。预处理部件601进行高通滤波处理以除去输入语音信号中的DC分量,或涉及后续编码处理性能改善的整形处理和预增强处理,并将已处理的语音信号(Xin)输出到LPC分析部件602、加法器605、以及参数确定部件613。在尚未审查的日本专利公开第6-214600号中公开了使用该预处理的CELP编码。
LPC分析部件602使用Xin进行线性预测分析,并向LPC量化部件603输出分析结果(线性预测系数)。
LPC量化部件603将从LPC分析部件602输出的LPC系数转换为LSF参数。对由该转换获得的LSF参数进行向量量化成为量化目标向量,并向多路复用器614输出由该向量量化获得的LPC代码(L)。
同样,LPC量化部件603获得LSF区解码谱包络参数,将所获得的解码谱包络参数转换为解码LPC系数,并向组合滤波器604输出由前述转换获得的解码LPC系数。
组合滤波器604使用前述编码LPC系数和从加法器611输出的驱动声源进行滤波组合,并向加法器605输出该复合信号。
加法器605计算前述Xin和前述复合信号的误差信号,并向听觉加权部件612输出该误差信号。听觉加权部件612对从加法器605输出的误差信号进行听觉加权,在听觉加权区计算Xin和复合信号之间的失真,并向参数确定部件613输出该失真。
参数确定部件613确定在自适应声源代码本606、固定声源代码本608、以及量化增益发生器607中产生的信号,以便使从听觉加权部件612输出的编码失真最小化。通过不但通过使从听觉加权部件612输出的编码失真最小化,而且通过使用Xin组合使用分离的编码失真,来确定应该从前述三个部件输出的信号,可以进一步改善编码性能。
自适应声源代码本606缓存加法器611在过去输出的声源信号,从由参数确定部件613输出的信号(A)指定的位置提取自适应声源向量,并向乘法器609输出该向量。
固定声源代码本608向乘法器610输出由从参数确定部件613输出的信号(F)指定的形状的向量。
量化增益发生器607分别向乘法器609和乘法器610输出由从参数确定部件613输出的信号(G)指定的自适应声源增益和固定声源增益。
乘法器609将从量化增益发生器607输出的量化自适应声源增益与从自适应声源代码本606输出的自适应声源向量相乘,并向加法器611输出相乘结果。乘法器610将从量化增益发生器607输出的量化固定声源增益和从固定声源代码本608输出的固定声源向量相乘,并向加法器611输出相乘结果。
加法器611以乘法器609的增益倍增后的自适应声源向量和来自乘法器610的固定声源向量作为输入,并对自适应声源向量和固定声源向量进行向量加法运算。然后加法器611向组合滤波器604和自适应声源代码本606输出该向量加法运算的结果。
最后,多路复用器614以来自LPC量化部件603的指示量化LPC的代码L、连同来自参数确定部件613的指示自适应声源向量的代码A、指示固定声源向量的代码F、以及指示量化增益的代码G作为输入,量化这些不同的信息项目,并将其作为已编码的信息输出到传播路径中。
接下来将详细描述语音解码部件503。图8是展示图6的语音解码部件503的方框图。
图8中,将从RF解调器502输出的已编码信息输入多路复用分离器701,其中将多路复用的已编码信息分离为单个类型的代码信息。
将分离出的LPC代码L输出到LPC解码器702;将分离出的自适应声源向量代码A输出到自适应声源代码本705;将分离出的声源增益代码G输出到量化增益发生器706;并将分离出的固定声源向量代码F输出到固定声源代码本707。
LPC解码器702借助于实施例中给出的向量量化解码处理,从多路复用分离器701输出的代码L中获得解码谱包络参数,并将所获得的解码谱包络参数转换为解码LPC系数。然后LPC解码器702向组合滤波器703输出由该转换获得的解码LPC系数。
自适应声源代码本705从由多路复用分离器701输出的代码A指定的位置提取自适应声源向量,并将其输出到乘法器708。固定声源代码本707产生由从多路复用分离器701输出的代码F指定的固定声源向量,并将其输出到乘法器709。
量化增益发生器706对由从多路复用分离器701输出的声源增益代码G指定的自适应声源向量增益和固定声源向量增益进行解码,并分别将其输出到乘法器708和乘法器709。
乘法器708将前述自适应代码向量与前述自适应代码向量增益相乘,并将结果输出到加法器710。乘法器709将前述固定代码向量与前述固定代码向量增益相乘,并将结果输出到加法器710。
加法器710对从乘法器708和乘法器709输出的增益倍增后的自适应声源向量和固定声源向量进行加法运算,并将结果输出到组合滤波器703。
组合滤波器703使用组合滤波器,以从LPC解码器702提供的编码LPC系数为滤波系数,以从加法器710输出的声源向量为驱动信号,进行滤波组合,并将组合信号输出到后处理部件704。
后处理部件704执行诸如共振峰增强和音调增强的用来改善语音的主观音质的处理、改善静态噪声的主观音质的处理等等,然后输出最终的已解码的语音信号。
本发明不限于上述实施例,在不脱离本发明的范围的情况下,可以进行各种变更和修饰。例如,在上述实施例中,描述了本发明作为信号处理装置操作的情况,但是这不是限制,也有可能以软件实现该信号处理方法。
例如,可以在只读存储器(ROM)中预先存储执行上述信号处理方法的程序,并由中央处理单元(CPU)来操作。
也有可能将执行上述信号处理方法的程序存储在计算机可读存储介质上,将存储介质上存储的程序记录在计算机的随机存取存储器(RAM)中,并根据该程序操作计算机。
从上述描述中可以明白,根据本发明的音调周期搜索装置,通过不固定以小数精确度搜索音调周期的范围,而在从先前子帧中检索出的音调周期的附近以小数精确度搜索,有可能即使音调周期不足也改善对语音信号线性预测剩余的搜索精确度,并有可能进行高质量的语音编码和解码。
本申请基于2001年8月2日提交的日本专利申请第2001-234559号,其全部内容明白地合并于此作为参考。
工业实用性本发明适用于要对语音信号进行编码和解码的移动通信系统。
权利要求
1.一种音调周期搜索装置,包括音调周期指示部件,以整数精确度给自适应声源向量发生部件依次指示预设音调周期搜索范围内的音调周期候选者;自适应声源向量发生部件,用于从自适应代码本中,提取具有由所述音调周期指示部件指示的整数精确度音调周期的自适应声源向量,并将所提取的自适应声源向量输出;失真比较部件,其具有如下功能,通过对具有由所述自适应声源向量发生部件产生的整数精确度音调周期的自适应声源向量、和补充具有整数精确度音调周期的自适应声源向量所获得的具有小数精确度音调周期的自适应声源向量分别进行整数精确度音调周期搜索和小数精确度音调周期搜索,从该候选者中,在正在处理的子帧部分的线性预测剩余中求出指示最佳音调周期的索引并输出,其还具有输出最佳音调周期整数分量的功能;以及上一子帧整数音调周期存储部件,用于存储所述失真比较部件最后选择的音调周期的整数分量,并且在搜索下一子帧的音调周期时,向所述自适应声源向量发生部件输出该最佳的音调周期整数分量。
2.如权利要求1所述的音调周期搜索装置,还包括比较判断部件,其具有比较判断功能,即,对内部提供的计数器的值和非负整数N进行大小比较,如果计数值小于或等于整数N,向所述小数音调周期自适应声源向量发生部件输出指示要进行小数精确度音调周期搜索处理的指令,如果计数值大于整数N,则向所述小数音调周期自适应声源向量发生部件输出指示不进行小数精确度音调周期搜索处理的指令;以及最佳音调周期精确度判断部件,其具有如下功能,即,判断在正在处理的子帧的音调周期搜索处理中选择作为最佳音调周期的音调周期为整数精确度还是小数精确度,并依照判断结果,对所述比较判断部件中提供的所述计数器的值执行重置为0或增加1的操作。
3.如权利要求2所述的音调周期搜索装置,其中,预先设置任意自然数为非负整数N。
4.如权利要求2所述的音调周期搜索装置,其中,根据通信环境自适应地增加或减小非负整数N。
5.如权利要求2所述的音调周期搜索装置,其中,在小数精确度音调周期搜索中,在预定范围内进行小数精确度音调周期搜索,而当所述计数器的值大于比较对象非负整数N时,将所述计数器重置为0。
全文摘要
自适应声源向量发生器(ASSVG)103设置以在先前子帧中选择的整数精确度音调周期T0为中心的在前的和随后的音调周期为搜索小数精确度音调频率的范围,从自适应代码本(ACB)102中提取具有在这一范围内的小数精确度音调周期T-frac的自适应声源向量P(T-frac)。上一子帧整数音调周期存储器(LSFIPCS)108存储由失真比较器(DC)107选择的最佳音调周期的整数分量T0,并且在搜索下一子帧的音调周期时,向自适应声源向量发生器(ASSVG)103输出该最佳音调周期整数分量T0。最佳音调周期精确度判断部件(OPCAJS)109判断最佳音调周期为整数精确度还是小数精确度。比较判断部件(CJS)110限制作为最佳音调周期的小数精确度音调信息的选择次数。
文档编号H03M7/36GK1664929SQ20051006410
公开日2005年9月7日 申请日期2002年8月1日 优先权日2001年8月2日
发明者佐藤薰, 安永和敏, 森井利幸 申请人:松下电器产业株式会社