估计音调滞后的利记博彩app

文档序号:2832846阅读:215来源:国知局
专利名称:估计音调滞后的利记博彩app
技术领域
本发明大体上涉及信号处理。更具体地说,本发明涉及估计音调滞后。
背景技术
在过去的几十年中,电子装置的使用已变得常见。明确地说,电子技术的进步已降低了越来越复杂且有用的电子装置的成本。成本降低和消费者需求已使电子装置的使用激增,使得其在现代社会中实际上为普遍存在的。随着电子装置的使用扩大,对于电子装置的新的且改进的特征的需求也扩大。更具体来说,常常找到更快、更有效或以更高质量执行功能的电子装置。一些电子装置(例如,蜂窝式电话、智能电话、计算机等)使用语音信号。这些电子装置可编码语音信号以供存储或发射。举例来说,蜂窝式电话使用麦克风俘获用户的话音或语音。举例来说,蜂窝式电话使用麦克风将声学信号转换成电子信号。可接着将此电子信号进行格式化以供发射到另一装置(例如,蜂窝式电话、智能电话、计算机等)或供存储。举例来说,就带宽和/或存储资源来说,发射或发送未经压缩的语音信号可为代价较高的。存在试图更有效率地(例如,使用较少数据)表示语音信号的一些方案。然而,这些方案可能不会很好地表示语音信号的一些部分,从而导致性能降级。如从前述论述可理解,改进语音信号译码的系统和方法可为有益的。

发明内容
揭示一种用于估计音调滞后的电子装置。所述电子装置包括处理器和存储于与所述处理器电子通信的存储器中的指令。所述电子装置获得当前帧。所述电子装置还基于所述当前帧获得残余信号。所述电子装置另外基于所述残余信号确定峰值位置集合。所述电子装置进一步基于所述峰值位置集合获得音调滞后候选者集合。所述电子装置还基于所述音调滞后候选者集合估计音调滞后。获得所述残余信号可进一步基于经量化线性预测系数集合。获得所述音调滞后候选者集合可包括以递增次序布置所述峰值位置集合以产生有序峰值位置集合以及计算所述有序峰值位置集合中的连续峰值位置对之间的距离。确定峰值位置集合可包括基于所述残余信号的样本的绝对值和窗口信号计算包络信号。确定峰值位置集合还可包括基于所述包络信号与所述包络信号的时间移位版本之间的差计算第一梯度信号。确定峰值位置集合可另外包括基于所述第一梯度信号与所述第一梯度信号的时间移位版本之间的差计算第二梯度信号。确定峰值位置集合可进一步包括选择第二梯度信号值降低到第一阈值以下的第一位置索引集合。确定峰值位置集合还可包括通过消除包络值相对于包络中的最大值降低到第二阈值以下的位置索引来从所述第一位置索引集合确定第二位置索引集合。确定峰值位置集合还可包括通过消除相对于相邻位置索引不满足差阈值的位置索引来从所述第二位置索引集合确定第三位置索引集合。所述电子装置还可使用所述当前帧和在所述当前帧之前的信号执行线性预测分析以获得线性预测系数集合。所述电子装置还可基于所述线性预测系数集合确定经量化线性预测系数集合。所述音调滞后可使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合来估计。所述电子装置还可计算对应于所述音调滞后候选者集合的置信测度集合。计算对应于所述音调滞后候选者集合的所述置信测度集合可基于信号包络和所述峰值位置的有序集合中的连续峰值位置对。计算所述置信测度集合可包括对于所述峰值位置的所述有序集合中的每一对峰值位置,基于围绕一对峰值位置中的第一峰值位置的范围选择第一信号缓冲器,且基于围绕所述对峰值位置中的第二峰值位置的范围选择第二信号缓冲器。计算置信测度集合还可包括对于所述峰值位置的所述有序集合中的每一对峰值位置,计算所述第一信号缓冲器与所述第二信号缓冲器之间的经正规化的交叉相关性,且将所述经正规化的交叉相关性添加到所述置信测度集合。所述电子装置还可将基于所述当前帧的所述残余信号计算的第一近似音调滞后值添加到所述音调滞后候选者集合,且将对应于所述第一近似音调滞后值的第一音调增益添加到所述置信测度集合。通过基于所述当前帧的所述残余信号估计自相关性值且搜索在某一位置范围内的所述自相关性值以查找最大值,可估计第一近似音调滞后值且可估计第一音调增益。通过将所述第一近似音调滞后值设置为出现所述最大值所在的位置且将所述第一音调增益值设置为所述第一近似音调滞后值处的经正规化的自相关性,可进一步估计第一近似音调滞后值且还可估计第一音调增益。所述电子装置还可将基于先前帧的残余信号计算的第二近似音调滞后值添加到所述音调滞后候选者集合,且可将对应于所述第二近似音调滞后值的第二音调增益添加到所述置信测度集合。所述电子装置还可发射所述音调滞后。所述电子装置可为无线通信装置。通过基于所述先前帧的所述残余信号估计自相关性值且搜索在某一位置范围内的所述自相关性值以查找最大值,可估计所述第二近似音调滞后值且可估计所述第二音调增益。通过将所述第二近似音调滞后值设置为出现所述最大值所在的位置且将所述音调增益值设置为所述第二近似音调滞后值处的经正规化的自相关性,可进一步估计所述第二近似音调滞后值且可进一步估计所述第二音调增益。使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合来估计所述音调滞后可包括使用所述音调滞后候选者集合和所述置信测度集合计算经加权均值,且确定所述音调滞后候选者集合中的最远离所述经加权均值的音调滞后候选者。使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合来估计所述音调滞后可进一步包括从所述音调滞后候选者集合中移除最远离所述经加权均值的所述音调滞后候选者,且从所述置信测度集合中移除对应于最远离所述经加权均值的所述音调滞后候选者的置信测度。使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合来估计所述音调滞后可进一步包括确定剩余音调滞后候选者数目是否等于指定数目,且在所述剩余音调滞后候选者数目等于所述指定数目的情况下,基于一个或一个以上剩余音调滞后候选者确定所述音调滞后。所述电子装置还可在所述剩余音调滞后候选者数目不等于所述指定数目的情况下反复进行。
Zdici可根据方程式Mw:气^来实现计算所述经加权均值。Mw可为所述经加权均
Ici
i=l
值,L可为音调滞后候选者数目,{dj可为所述音调滞后候选者集合,且IcJ可为所述置信测度集合。可通过找到dk来实现确定所述音调滞后候选者集合中的最远离所述经加权均值的音调滞后候选者,使得对于所有i,|Mw-dk|> IMw-Cli I,其中i关k。dk可为最远离所述经加权均值的音调滞后候选者,Mw可为经加权均值,{dj可为所述音调滞后候选者集合,且i可为索引编号。还揭示另一种用于估计音调滞后的电子装置。所述电子装置包括处理器和存储于与所述处理器电子通信的存储器中的指令。所述电子装置获得语音信号。所述电子装置还基于所述语音信号获得音调滞后候选者集合。所述电子装置进一步确定对应于所述音调滞后候选者集合的置信测度集合。所述电子装置另外使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计音调滞后。使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合来估计所述音调滞后可包括使用所述音调滞后候选者集合和所述置信测度集合计算经加权均值,且确定所述音调滞后候选者集合中的最远离经加权均值的音调滞后候选者。使用迭代修剪算法基于所述音调滞后候选者集合和`所述置信测度集合来估计所述音调滞后可进一步包括从所述音调滞后候选者集合中移除最远离所述经加权均值的音调滞后候选者,且从所述置信测度集合中移除对应于最远离所述经加权均值的所述音调滞后候选者的置信测度。使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合来估计所述音调滞后可另外包括确定剩余音调滞后候选者数目是否等于指定数目,且在所述剩余音调滞后候选者数目等于所述指定数目的情况下,基于一个或一个以上剩余音调滞后候选者确定所述音调滞后。还揭示一种用于在电子装置上估计音调滞后的方法。所述方法包括获得当前帧。所述方法还包括基于所述当前帧获得残余信号。所述方法进一步包括基于所述残余信号确定峰值位置集合。所述方法另外包括基于所述峰值位置集合获得音调滞后候选者集合。所述方法还包括基于所述音调滞后候选者集合估计音调滞后。还揭示另一种用于在电子装置上估计音调滞后的方法。所述方法包含获得语音信号。所述方法还包括基于所述语音信号获得音调滞后候选者集合。所述方法进一步包括确定对应于所述音调滞后候选者集合的置信测度集合。所述方法另外包括使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计音调滞后。还揭示一种用于估计音调滞后的计算机程序产品。所述计算机程序产品包括具有指令的非暂时性有形计算机可读媒体。所述指令包括用于致使电子装置获得当前帧的代码。所述指令还包括用于致使所述电子装置基于所述当前帧获得残余信号的代码。所述指令进一步包括用于致使所述电子装置基于所述残余信号确定峰值位置集合的代码。所述指令另外包括用于致使所述电子装置基于所述峰值位置集合获得音调滞后候选者集合的代码。所述指令还包括用于致使所述电子装置基于所述音调滞后候选者集合估计音调滞后的代码。还揭示另一种用于估计音调滞后的计算机程序产品。所述计算机程序产品包括具有指令的非暂时性有形计算机可读媒体。所述指令包括用于致使电子装置获得语音信号的代码。所述指令还包括用于致使所述电子装置基于语音信号获得音调滞后候选者集合的代码。所述指令进一步包括用于致使所述电子装置确定对应于所述音调滞后候选者集合的置信测度集合的代码。所述指令另外包括用于致使所述电子装置使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计音调滞后的代码。还揭示一种用于估计音调滞后的设备。所述设备包括用于获得当前帧的装置。所述设备还包括用于基于所述当前帧获得残余信号的装置。所述设备进一步包括用于基于所述残余信号确定峰值位置集合的装置。所述设备另外包括用于基于所述峰值位置集合获得音调滞后候选者集合的装置。所述设备还包括用于基于所述音调滞后候选者集合估计音调滞后的装置。还揭示另一种用于估计音调滞后的设备。所述设备包括用于获得语音信号的装置。所述设备还包括用于基于所述语音信号获得音调滞后候选者集合的装置。所述设备进一步包括用于确定对应于所述音调滞后候选者集合的置信测度集合的装置。所述设备另外包括用于使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计音调滞后的装置。


图1为说明其中可实施用于估计音调滞后的系统和方法的电子装置的一个配置的框图;图2为说明用于估计音调滞后的方法的一个配置的流程图;图3为说明来自残余信号的峰值的一个实例的图;图4为说明用于估计音调滞后的方法的另一配置的流程图;图5为说明用于估计音调滞后的方法的较特定配置的流程图;图6为说明用于使用迭代修剪算法估计音调滞后的方法的一个配置的流程图;图7为说明其中可实施用于估计音调滞后的系统和方法的编码器的一个配置的框图;图8为说明解码器的一个配置的框图;图9为说明用于解码语音信号的方法的一个配置的流程图;图10为说明其中可实施用于估计音调滞后的系统和方法的电子装置的一个实例的框图;图11为说明其中可实施用于解码语音信号的系统和方法的电子装置的一个实例的框图;图12为说明音调同步增益按比例缩放和LPC合成块/模块的一个配置的框图13说明可用于电子装置中的各种组件;以及图14说明可包括于无线通信装置内的某些组件。
具体实施例方式本文中所揭示的系统和方法可应用于多种装置,例如电子装置。电子装置的实例包括话音记录器、摄像机、音频播放器(例如,移动图片专家小组I(MPEG-1)或MPEG-2音频层3(MP3)播放器)、视频播放器、音频记录器、桌上型计算机/膝上型计算机、个人数字助理(PDA)、游戏系统等。一种种类的电子装置为通信装置,其可与另一装置通信。通信装置的实例包括电话、膝上型计算机、桌上型计算机、蜂窝式电话、智能电话、无线或有线调制解调器、电子阅读器、平板装置、游戏系统、蜂窝式电话基站或节点、接入点、无线网关和无线路由器。通信装置可根据特定工业标准而操作,例如国际电信联盟(ITU)标准和/或电气与电子工程师学会(IEEE)标准(例如,无线保真或“W1-Fi”标准,例如802.11a、802.lib,802.llg、802.1ln和/或802.llac)。通信装置可遵照的标准的其它实例包括IEEE802.16 (例如,微波接入全球互通或“WiMAX”)、第三代合作伙伴计划(3GPP)、3GPP长期演进(LTE)、全球移动电信系统(GSM)和其它标准(其中通信装置可被称为(例如)用户设备(UE)、节点B、演进型节点B (eNB)、移动装置、移动台、订户台、远程台、接入终端、移动终端、终端、用户终端、订户单元等)。虽然本文中所揭示的系统和方法中的一些系统和方法可能依据一个或一个以上标准来描述,但这不应限制本发明的范围,因为所述系统和方法可适用于许多系统和/或标准。应注意,一些通信装置可以无线方式通信且/或可使用有线连接或链路通信。举例来说,一些通信装置可使用以太网协议与其它装置通信。本文中所揭示的系统和方法可应用于以无线方式通信和/或使用有线连接或链路通信的通信装置。在一个配置中,本文中所揭示的系统和方法可应用于使用卫星来与另一装置通信的通信装置。本文中所揭示的系统和方法可应用于如下描述的通信系统的一个实例。在此实例中,本文中所揭示的系统和方法可提供低位速率(例如,2千位/秒(Kbps))语音编码用于地球移动卫星空中接口(GMSA)卫星通信。更具体来说,本文中所揭示的系统和方法可用于集成的卫星和移动通信网络中。这些网络可提供无缝、透明、可共同操作且普遍存在的无线覆盖范围。基于卫星的服务可用于陆地覆盖范围不可达到的远程位置中的通信。举例来说,此服务可用于人为灾害或自然灾害、广播和/或船队管理以及资产跟踪。可使用L和/或S频带(无线)频谱。在一个配置中,前向链路可使用Ix演进数据优化(EV-DO)版本A空中接口作为用于空中卫星链路的基础技术。反向链路可使用频分多路复用(FDM)。举例来说,反向链路频谱的1.25兆赫(MHz)块可划分成192个窄带频道,每一窄带频道具有6.4千赫(kHz)的带宽。可限制反向链路数据速率。这可提出对于低位速率编码的需要。在一些情况下,例如,信道可能仅能够支持2.4Kbps。然而,在较佳信道条件下,2个FDM信道可能为可用的,从而有可能提供4.8Kbps发射。在反向链路上,例如,可使用低位速率语音编码器。这可允许2Kbps的固定速率用于反向链路上的单个FDM信道指派的活动语音。在一个配置中,反向链路使用1/4卷积译码器用于基本信道编码。在一些配置中,本文中所揭示的系统和方法可另外用于其它编码模式。举例来说,可结合使用原型音调周期波形内插法(PPPWI)的四分之一速率浊音译码或替代使用原型音调周期波形内插法(PPPWI)的四分之一速率浊音编码而使用本文中所揭示的系统和方法。在PPPWI中,原型波形可用以产生可替代实际波形的内插波形,从而允许减少的数目个样本产生重构的信号。举例来说,PPPWI可在全速率或四分之一速率下可用,且/或可产生时间同步输出。此外,可在PPPWI中在频域中执行量化。QQQ可用于浊音编码模式中(例如,代替FQQ(有效二分之一速率))。QQQ为使用四分之一速率原型音调周期波形内插法(QPPP-WI)以40位/帧(有效地,2千位/秒(kbps))来编码三个连续浊音帧的译码型式。FQQ为分别使用全速率原型音调周期(PPP)、四分之一速率原型音调周期(QPPP)和QPPP来编码三个连续浊音帧的译码型式。这可实现4kbps的平均速率。后者可不用于2kbps声码器中。应注意,可以修改的方式使用四分之一速率原型音调周期(QPPP),其中不进行频域中的原型表示的振幅的差量编码且进行13位线谱频率(LSF)量化。在一个配置中,QPPP可使用13个位用于LSF,12个位用于原型波形振幅,6个位用于原型波形功率,7个位用于音调滞后和2个位用于模式,从而产生总共40个位。明确地说,本文中所揭示的系统和方法可用于瞬时编码模式(其可提供QPPP所需的种子)。此瞬时编码模式(例如,在2Kbps声码器中)可使用统一模型用于译码上升瞬时、下降瞬时和浊音瞬时。虽然本文中所揭示的系统和方法可尤其应用于瞬时编码模式,但瞬时编码模式并不是其中可应用这些系统和方法的仅有上下文。其可另外或替代地应用于其它编码模式。本文中所揭示的系统和方法描述执行音调估计。在一些配置中,估计音调滞后可部分地通过反复地修剪线性预测译码(LPC)残余中的包括峰值间距离的候选音调值来实现。可需要准确的音调估计以在位速率非常低的声码器中产生良好的经译码语音质量。一些传统的音调估计算法使用信号的长期统计从语音信号帧和/或对应的LPC残余估计音调。此估计通常对于非稳定的瞬时帧为不可靠的。换句话说,这可能不会为非稳定的瞬时语音帧给出准确的估计。本文中所揭示的系统和方法可通过使用语音帧中的短时间(例如,局部)特性且/或通过使用迭代算法在若干候选者当中选择理想的(例如,最佳可用的)音调值来较可靠地估计音调。举例来说,这可改进低位速率声码器中的语音质量,进而改进所记录或所发射语音质量。更具体来说,本文中所揭示的系统和方法可使用一种估计算法,其提供比传统技术准确的对音调的估计且因此在声码器中针对低位速率编码模式产生改进的语音质量。现参看各图描述各种配置,其中相同参考数字可指示功能上相似的元件。如本文中各图中大体描述和说明的系统和方法可以广泛多种不同配置来布置和设计。因此,如各图中所表示的若干配置的以下较详细描述并不希望限制如所主张的范围,而是仅表示所述系统和方法。图1为说明其中可实施用于估计音调滞后的系统和方法的电子装置102的一个配置的框图。另外或替代地,可在电子装置102中实施用于解码语音信号的系统和方法。电子装置A102可包括编码器104。编码器104的一个实例为线性预测译码(LPC)编码器。编码器104可由电子装置A102使用以编码语音信号106。举例来说,编码器104通过估计或产生可用以合成语音信号的参数集合来将语音信号106编码成“经压缩”格式。在一个配置中,这些参数可表示可用以合成语音信号106的音调(例如,频率)、振幅和共振峰(例如,共振)的估计。编码器104可包括音调估计块/模块126,其根据本文中所揭示的系统和方法来估计音调滞后。如本文中所使用,术语“块/模块”可用以指示可以硬件、软件或两者的组合实施特定元件。应注意,可以多种方式实施音调估计块/模块126。举例来说,音调估计块/模块126可包含峰值搜索块/模块128、置信测度块/模块134和/或音调滞后确定块/模块138。在其它配置中,说明为包括在音调估计块/模块126内的块/模块中的一者或一者以上可被省略且/或由其它块/模块替代。另外或替代地,音调估计块/模块126可被定义为包括其它块/模块,例如线性预测译码(LPC)分析块/模块122。电子装置A102可获得语音信号106。在一个配置中,电子装置A102通过使用麦克风俘获声学信号且/或对其取样来获得语音信号106。在另一配置中,电子装置A102从另一装置(例如,蓝牙头戴耳机、通用串行总线(USB)驱动器、安全数字(SD)卡、网络接口、无线麦克风等)接收语音信号106。可将语音信号106提供到成帧块/模块108。电子装置A102可使用成帧块/模块108将语音信号106分段成一个或一个以上帧110。举例来说,帧110可包括特定数目个语音信号106样本且/或包括某一时间量(例如,10到20毫秒)的语音信号106。当语音信号106被分段成多个帧110时,可根据其所含有的信号来对帧110进行分类。举例来说,帧110可为浊音帧、清音帧、静音帧或瞬时帧。本文中所揭示的系统和方法可用以估计帧110(例如,瞬时帧、浊音帧等)中的音调滞后。举例来说,瞬时帧可位于一个语音类别与另一语音类别之间的边界上。举例来说,语音信号106可从清音(例如,f、s、sh、th等)转变成池音(例如,a、e、1、O、u等)。一些瞬时类型包括上升瞬时(例如,当从语音信号106的清音部分转变到浊音部分时)、爆破音、浊音瞬时(例如,线性预测译码(LPC)改变和音调滞后变化)和下降瞬时(例如,当从语音信号106的浊音部分转变到清音或静音部分(例如,词结尾)时)。在两个语音类别之间的帧110可为瞬时帧。本文中所揭示的系统和方法可有益地应用于瞬时帧,因为传统的方法可能不会在瞬时帧中提供准确的音调滞后估计。然而,应注意,本文中所揭示的系统和方法可应用于其它种类的帧。编码器104可使用线性预测译码(LPC)分析块/模块122来对帧110执行线性预测分析(例如,LPC分析)。应注意,LPC分析块/模块122可另外或替代地使用来自其它帧110 (例如,来自先前帧110)的一个或一个以上样本。LPC分析块/模块122可产生一个或一个以上LPC系数120。可将LPC系数120提供到量化块/模块118,其可产生一个或一个以上经量化LPC系数116。可将所述经量化LPC系数116和来自一个或一个以上帧110的一个或一个以上样本提供到残余确定块/模块112,其可用以确定残余信号114。举例来说,残余信号114可包括已使共振峰或共振峰的效应从语音信号106移除的语音信号106的帧110。可将残余信号114提供到音调估计块/模块126。编码器104可包括音调估计块/模块126。在图1所说明的实例中,音调估计块/模块126包括峰值搜索块/模块128、置信测度块/模块134和音调滞后确定块/模块138。然而,峰值搜索块/模块128和/或置信测度块/模块134可为任选的,且可用确定一个或一个以上音调(例如,音调滞后)候选者132和/或置信测度136的一个或一个以上其它块/模块替代。如图1中所说明,音调滞后确定块/模块138可使用迭代修剪算法140。然而,迭代修剪算法140可为任选的,且可在本文中所揭示的系统和方法的一些配置中省略。换句话说,音调滞后确定块/模块138可在一些配置中在不使用迭代修剪算法140的情况下确定音调滞后,且举例来说,可使用某种其它方法或算法(例如平滑或平均算法)来确定首调滞后142。峰值搜索块/模块128可搜索残余信号114中的峰值。换句话说,编码器104可搜索残余信号114中的峰值(例如,高能量的区域)。可识别这些峰值以获得峰值列表或集合。举例来说,可依据样本编号和/或时间来指定峰值列表或集合中的峰值位置。下文给出关于获得峰值列表或集合的更多细节。峰值搜索块/模块128可包括候选者确定块/模块130。候选者确定块/模块130可使用所述峰值集合以便确定一个或一个以上候选者音调滞后132。“音调滞后”可为帧110中的两个连续音调尖峰之间的“距离”。举例来说,可以样本数目和/或时间量来指定音调滞后。在一个配置中,峰值搜索块/模块128可确定峰值之间的距离以便确定音调滞后候选者132。在非常稳定的话音或语音信号中,音调滞后可保持几乎恒定。用于估计音调滞后的一些传统方法使用自相关。在那些方法中,使LPC残余抵靠着其自身滑动以进行相关。在那些方法中可将具有最大自相关性值的任何相关性或音调滞后确定为帧的音调。那些方法可在语音帧非常稳定时起作用。然而,存在其中音调结构可能不非常稳定的其它帧,例如在瞬时帧中。即使当语音帧是稳定的时,传统方法也可能归因于系统中的噪声而不会提供非常准确的音调估计。噪声可减小残余的“有峰”程度。在此情况下,举例来说,传统方法可确定不是非常准确的音调估计。峰值搜索块/模块128可使用相关方法获得音调滞后候选者集合132。举例来说,可首先由候选者确定块/模块130确定候选音调滞后集合132。接着,可由置信测度块/模块134基于候选音调滞后集合132而确定对应于所述候选音调滞后集合的置信测度集合136。更具体来说,第一集合可为音调滞后候选者集合132,且第二集合可为用于音调滞后候选者132中的每一者的置信测度集合136。因此,举例来说,第一置信测度或值可对应于第一音调滞后候选者,等等。因此,可“构建”或确定音调滞后候选者集合132和置信测度集合136。置信测度集合136可用以改进所估计的音调滞后142的准确性。在一个配置中,置信测度集合136可为相关性集合,其中每一值可为(在基础方面中)对应于音调滞后候选者的音调滞后处的相关性。换句话说,用于每一特定音调滞后的相关性系数可构成用于音调滞后候选者132距离中的每一者的置信测度。可将音调滞后候选者集合132和/或置信测度集合136提供到音调滞后确定块/模块138。音调滞后确定块/模块138可基于一个或一个以上音调滞后候选者132确定音调滞后142。在一些配置中,音调滞后确定块/模块138可基于一个或一个以上置信测度136 (除所述一个或一个以上音调滞后候选者132之外)确定音调滞后142。举例来说,音调滞后确定块/模块可使用迭代修剪算法140来选择所述音调滞后值中的一者。下文给出关于迭代修剪算法140的更多细节。所选择的音调滞后142值可为“真实”音调滞后的估计。在其它配置中,音调滞后确定块/模块138可使用某种其它方法来确定音调滞后142。举例来说,代替迭代修剪算法140或除迭代修剪算法140之外,音调滞后确定块/模块138可使用平均或平滑算法。
可将由音调滞后确定块/模块138确定的音调滞后142提供到激励合成块/模块148和比例因子确定块/模块152。激励合成块/模块148可基于音调滞后142和由原型波形产生块/模块144提供的波形146产生或合成激励150。在一个配置中,原型波形产生块/模块144可基于音调滞后142产生波形146。可将激励150、音调滞后142和/或经量化LPC系数116提供到比例因子确定块/模块152,其可基于激励150、音调滞后142和/或经量化LPC系数116产生增益集合154。可将增益集合154提供到增益量化块/模块156,其量化增益集合154以产生经量化增益集合158。音调滞后142、经量化LPC系数116和/或经量化增益158可被称为经编码的语音信号。可解码所述经编码的语音信号以便产生经合成的语音信号。可将音调滞后142、经量化LPC系数116和/或经量化增益158 (例如,经编码的语音信号)发射到另一装置、将其存储且/或解码。在一个配置中,电子装置A102可包括发射(TX)和/或接收(RX)块/模块160。可将音调滞后142、经量化LPC系数116和/或经量化增益158提供到TX/RX块/模块160。TX/RX块/模块160可将音调滞后142、经量化LPC系数116和/或经量化增益158格式化为适合于发射的格式。举例来说,TX/RX块/模块160可将音调滞后142、经量化LPC系数116和/或经量化增益158编码、调节、按比例缩放(例如,放大)且/或以其它方式格式化为一个或一个以上消息166。TX/RX块/模块160可将所述一个或一个以上消息166发射到另一装置,例如电子装置B168。所述一个或一个以上消息166可使用无线和/或有线连接或链路来发射。在一些配置中,所述一个或一个以上消息166可通过卫星、基站、路由器、交换器和/或其它装置或媒体来中继传递到电子装置B168。电子装置B168可使用TX/RX块/模块170接收由电子装置A102发射的所述一个或一个以上消息166。所述TX/RX块/模块170可解码、解调且/或以其它方式解格式化所述一个或一个以上所接收的消息166以产生经编码的语音信号172。举例来说,所述经编码的语音信号172可包含音调滞后、经量化LPC系数和/或经量化增益。可将所述经编码的语音信号172提供到解码器174 (例如,LPC解码器),所述解码器可解码(例如,合成)所述经编码的语音信号172以便产生经合成的语音信号176。可使用换能器(例如,扬声器)将所述经合成的语音信号176转换为声学信号(例如,输出)。应注意,所述电子装置B168对于本文中所揭示的系统和方法的使用来说不是必要的,而是被说明为其中可使用本文中所揭示的系统和方法的一个可能配置的一部分。在另一配置中,可将音调滞后142、经量化LPC系数116和/或经量化增益158 (例如,经编码的语音信号)提供到解码器162 (在电子装置A102上)。解码器162可使用音调滞后142、经量化LPC系数116和/或经量化增益158来产生经合成的语音信号164。举例来说,可使用扬声器输出经合成的语音信号164。举例来说,电子装置A102可为数字话音记录器,其编码语音信号106并将之存储在存储器中,所述语音信号106可接着被解码以产生经合成的语音信号164。可使用换能器(例如,扬声器)将经合成的语音信号164转换为声学信号(例如,输出)。应注意,解码器162并不是根据本文中所揭示的系统和方法来估计音调滞后所必要的,而是被说明为其中可使用本文中所揭示的系统和方法的一个可能配置的一部分。电子装置A102上的解码器162与电子装置B168上的解码器174可执行相似功倉泛。
图2为说明用于估计音调滞后的方法200的一个配置的流程图。举例来说,电子装置102可执行图2中所说明的方法200以便估计语音信号106的帧110中的音调滞后。电子装置102可获得(202)当前帧110。在一个配置中,电子装置102可通过使用麦克风俘获声学语音信号来获得(202)电子语音信号106。另外或替代地,电子装置102可从另一装置接收语音信号106。电子装置102可接着将语音信号106分段成一个或一个以上帧110。举例来说,帧110可包括具有10到20毫秒的持续时间的若干个样本。电子装置102可使用当前帧110和在当前帧110之前的信号执行(204)线性预测分析以获得线性预测(例如,LPC)系数集合120。举例来说,电子装置102可使用先行缓冲器和含有语音信号106的在当前语音帧110之前的至少一个样本的缓冲器来获得LPC系数120。电子装置102可基于LPC系数集合120确定(206)经量化线性预测(例如,LPC)系数集合116。举例来说,电子装置102可量化LPC系数集合120以确定(206)经量化LPC系数集合116。电子装置102可基于当前帧110和经量化LPC系数116获得(208)残余信号114。举例来说,电子装置102可从帧110移除LPC系数116(例如,共振峰)的效应以获得(208)残余信号114。电子装置102可基于残余信号114确定(210)峰值位置集合。举例来说,电子装置可搜索LPC残余信号114以确定峰值位置集合。举例来说,可依据时间和/或样本编号来描述峰值位置。在一个配置中,电子装置102可如下确定(210)峰值位置集合。电子装置102可基于(LPC)残余信号114的样本的绝对值和预定窗口信号计算包络信号。电子装置102可接着基于包络信号与包络信号的时间移位版本之间的差而计算第一梯度信号。电子装置102可基于第一梯度信号与第一梯度信号的时间移位版本之间的差而计算第二梯度信号。电子装置102可接着选择第二梯度信号值降低到预定负阈值以下的第一位置索引集合。电子装置102还可通过消除包络值相对于包络中的最大值降低到预定阈值以下的位置索引来从第一位置索引集合确定第二位置索引集合。另外,电子装置102可通过消除相对于相邻位置索引不满足预定差阈值的位置索引来从第二位置索引集合确定第三位置索引集合。位置索引(例如,第一集合、第二集合和/或第三集合)可对应于所确定的峰值集合的位置。电子装置102可基于峰值位置集合获得(212)音调滞后候选者集合132。举例来说,电子装置102可按递增次序布置峰值位置集合以产生有序峰值位置集合。电子装置102可接着计算有序峰值位置集合中的连续峰值位置对之间的距离。所述连续峰值位置对之间的距离可为音调滞后候选者集合132。在一些配置中,电子装置102可将基于当前帧的(LPC)残余信号114计算的第一近似音调滞后值添加到音调滞后候选者集合132。在一个实例中,电子装置102可如下计算或估计所述第一近似音调滞后值。电子装置102可基于当前帧110的(LPC)残余信号114估计自相关性值。电子装置102可搜索预定位置范围内的自相关性值以查找最大值。电子装置102还可将所述第一近似音调滞后值设置或确定为出现最大值所在的位置。可将此第一近似音调滞后值添加到音调滞后候选者集合132。第一近似音调滞后值可为由典型的音调估计自相关技术确定的音调滞后值。可在题为“增强型可变速率编解码器,用于宽带展频数字系统的语音服务选项 3、68、70 和 73 (Enhanced Variable Rate Codec, Speech Service0ptions3, 68, 70, and73for Wideband Spread Spectrum Digital Systems) ”的 3GPP2 文献C.S0014D的章节4.6.3中找到一种实例估计技术。在一些配置中,电子装置102可进一步将基于先前帧的(LPC)残余信号114计算的第二近似音调滞后值添加到音调滞后候选者集合132。在一个实例中,电子装置102可如下计算或估计第二近似音调滞后值。电子装置102可基于先前帧110的(LPC)残余信号114估计自相关性值。电子装置102可搜索预定位置范围内的自相关性值以查找最大值。电子装置102还可将所述第二近似音调滞后值设置或确定为出现最大值所在的位置。电子装置102可将此第二近似音调滞后值添加到音调滞后候选者集合132。第二近似音调滞后值可为来自先前帧的音调滞后值。电子装置102可基于音调滞后候选者集合132估计(214)音调滞后142。在一个配置中,电子装置102可使用平滑或平均算法来估计(214)音调滞后142。举例来说,音调滞后确定块/模块138可计算所有音调滞后候选者132的平均值以产生所估计的音调滞后142。在另一配置中,电子装置102可使用迭代修剪算法140来估计(214)音调滞后142。下文给出关于迭代修剪算法140的更多细节。所估计的音调滞后142可用以产生经合成的激励150和/或增益因子154。另外或替代地,所估计的音调滞后142可被存储、发射且/或提供到解码器162、174。举例来说,解码器162、174可使用所估计的音调滞后142来产生经合成的语音信号164、176。图3为说明来自残余信号114的峰值378的一个实例的图。如上文所描述,电子装置102可使用残余信号114来确定峰值378a位置集合,可从所述峰值378a位置集合确定(峰值间)距离集合380 (例如,音调滞后候选者集合132)。举例来说,电子装置102可确定(210)峰值位置集合378a到378d,如上文结合图2所描述。电子装置102还可确定峰值间距离集合380a到380c (例如,音调滞后候选者132)。应注意,举例来说,可以时间单位或样本数目来指定峰值间距离380a到380c (例如,在连续峰值378之间)。在一个配置中,电子装置102可获得(212)音调滞后候选者集合132 (例如,峰值间距离380a到380c),如上文结合图2所描述。峰值间距离集合380a到380c或音调滞后候选者集合132可用以估计音调滞后。在图3中的一组轴上说明峰值间距离集合380a到380c,其中以毫秒时间来说明横轴,且纵轴描绘波形的振幅(例如,信号振幅)。举例来说,所说明的信号振幅可为电压、电流或压力变化。图4为说明用于估计音调滞后的方法400的另一配置的流程图。电子装置102可获得(402)语音信号106。举例来说,电子装置102可从另一装置接收语音信号106且/或使用麦克风俘获语音信号106。电子装置102可基于语音信号获得(404)音调滞后候选者集合。举例来说,电子装置102可根据此项技术中已知的任何方法来获得(404)音调滞后候选者集合。或者,电子装置102可根据本文中所揭示的系统和方法来获得(404)音调滞后候选者集合132,如上文结合图2所描述。电子装置102可确定(406)对应于音调滞后候选者集合132的置信测度集合136。在一个实例中,置信测度集合136可为相关性集合。举例来说,电子装置102可基于信号包络和有序峰值位置集合中的连续峰值位置对计算对应于音调滞后候选者集合132的相关性集合。在一个配置中,电子装置102可如下计算相关性集合。对于有序峰值位置集合中的每一对峰值位置,电子装置102可基于围绕所述对峰值位置中的第一峰值位置的预定范围选择第一信号缓冲器。电子装置102还可基于围绕所述对峰值位置中的第二峰值位置的预定范围选择第二信号缓冲器。接着,电子装置102可计算第一信号缓冲器与第二信号缓冲器之间的经正规化的交叉相关性。可将此经正规化的交叉相关性添加到置信测度集合136或相关性集合。可针对有序峰值位置集合中的每一对峰值位置进行此过程。在一些配置中,电子装置102可将基于当前帧110的(LPC)残余信号114计算的第一近似音调滞后值添加到音调滞后候选者集合132。电子装置102还可将对应于第一近似音调滞后值的第一音调增益添加到置信测度集合136或相关性集合。在一个实例中,电子装置102可如下计算或估计第一近似音调滞后值和对应的第一音调增益值。电子装置102可基于当前帧110的(LPC)残余信号114估计自相关性值。电子装置102可搜索预定位置范围内的自相关性值以查找最大值。电子装置102还可将第一近似音调滞后值设置或确定为出现最大值所在的位置,且/或将第一音调增益值设置或确定为所述音调滞后处的经正规化的自相关性。电子装置102可将基于先前帧110的(LPC)残余信号114计算的第二近似音调滞后值添加到音调滞后候选者集合132。电子装置102可进一步将对应于第二近似音调滞后值的第二音调增益添加到置信测度集合136或相关性集合。在一个配置中,电子装置102可如下计算或估计第二近似音调滞后值和对应的第二音调增益值。电子装置102可基于先前帧110的(LPC)残余信号114估计自相关性值。电子装置102可搜索预定位置范围内的自相关性值以查找最大值。电子装置102还可将第二近似音调滞后值设置或确定为出现最大值所在的位置,且/或将第二音调增益值设置或确定为所述音调滞后处的经正规化的自相关性。电子装置102可使用迭代修剪算法基于音调滞后候选者集合和置信测度集合136估计(408)音调滞后。在迭代修剪算法的一个实例中,电子装置102可基于音调滞后候选者集合132和置信测度集合136来计算经加权均值。电子装置102可确定音调滞后候选者集合132中的最远离经加权均值的音调滞后候选者。电子装置102可接着从音调滞后候选者集合132中移除最远离经加权均值的音调滞后候选者。可从置信测度集合136中移除对应于所移除的音调滞后候选者的置信测度。可重复此过程,直到所剩余的音调滞后候选者132的数目减小到指定数目为止。可接着基于所述一个或一个以上剩余的音调滞后候选者132来确定音调滞后142。举例来说,如果仅剩余一个音调滞后候选者,则可将所剩余的最后一个音调滞后候选者确定为音调滞后。举例来说,如果剩余一个以上音调滞后候选者,则电子装置102可将音调滞后142确定为所剩余的候选者的平均值。图5为说明用于估计音调滞后的方法500的较特定配置的流程图。电子装置102可获得(502)当前帧110。在一个配置中,电子装置102可通过使用麦克风俘获声学语音信号来获得(502)电子语音信号106。另外或替代地,电子装置102可从另一装置接收语音信号106。电子装置102可接着将所述语音信号106分段成一个或一个以上帧110。电子装置102可使用当前帧110和在当前帧110之前的信号执行(504)线性预测分析以获得线性预测(例如,LPC)系数集合120。举例来说,电子装置102可使用先行缓冲器和含有语音信号106的在当前语音帧110之前的至少一个样本的缓冲器来获得LPC系数120。电子装置102可基于LPC系数集合120确定(506)经量化LPC系数集合116。举例来说,电子装置102可量化LPC系数集合120以确定(506)经量化LPC系数集合116。电子装置102可基于当前帧110和经量化LPC系数116获得(508)残余信号114。举例来说,电子装置102可从帧110移除LPC系数116(例如,共振峰)的效应以获得(508)残余信号114。电子装置102可基于残余信号114确定(510)峰值位置集合。举例来说,电子装置可搜索LPC残余信号114以确定峰值位置集合。举例来说,可依据时间和/或样本编号来描述峰值位置。在一个配置中,电子装置102可如下确定(510)峰值位置集合。电子装置102可基于(LPC)残余信号114的样本的绝对值和预定窗口信号计算包络信号。电子装置102可接着基于包络信号与包络信号的时间移位版本之间的差而计算第一梯度信号。电子装置102可基于第一梯度信号与第一梯度信号的时间移位版本之间的差而计算第二梯度信号。电子装置102可接着选择第二梯度信号值降低到预定负阈值以下的第一位置索引集合。电子装置102还可通过消除包络值相对于包络中的最大值降低到预定阈值以下的位置索引来从第一位置索引集合确定第二位置索引集合。另外,电子装置102可通过消除相对于相邻位置索引不为预定差阈值的位置索引来从第二位置索引集合确定第三位置索引集合。位置索引(例如,第一集合、第二集合和/或第三集合)可对应于所确定的峰值集合的位置。电子装置102可基于峰值位置集合`获得(512)音调滞后候选者集合132。举例来说,电子装置102可按递增次序布置峰值位置集合以产生有序峰值位置集合。电子装置102可接着计算有序峰值位置集合中的连续峰值位置对之间的距离。所述连续峰值位置对之间的距离可为音调滞后候选者集合132。电子装置102可确定(514)对应于音调滞后候选者集合132的置信测度集合136。在一个实例中,置信测度集合136可为相关性集合。举例来说,电子装置102可基于信号包络和有序峰值位置集合中的连续峰值位置对计算对应于音调滞后候选者集合132的相关性集合。在一个配置中,电子装置102可如下计算相关性集合。对于有序峰值位置集合中的每一对峰值位置,电子装置102可基于围绕所述对峰值位置中的第一峰值位置的预定范围选择第一信号缓冲器。电子装置102还可基于围绕所述对峰值位置中的第二峰值位置的预定范围选择第二信号缓冲器。接着,电子装置102可计算第一信号缓冲器与第二信号缓冲器之间的经正规化的交叉相关性。可将此经正规化的交叉相关性添加到置信测度集合136或相关性集合。可针对有序峰值位置集合中的每一对峰值位置进行此过程。电子装置102可将基于当前帧110的(LPC)残余信号114计算的第一近似音调滞后值添加(516)到音调滞后候选者集合132。电子装置102还可将对应于第一近似音调滞后值的第一音调增益添加(518)到置信测度集合136或相关性集合。在一个实例中,电子装置102可如下计算或估计第一近似音调滞后值和对应的第一音调增益值。电子装置102可基于当前帧110的(LPC)残余信号114估计自相关性值。电子装置102可搜索预定位置范围内的自相关性值以查找最大值。电子装置102还可将第一近似音调滞后值设置或确定为出现最大值所在的位置,且/或将第一音调增益值设置或确定为所述音调滞后处的经正规化的自相关性。
电子装置102可将基于先前帧110的(LPC)残余信号114计算的第二近似音调滞后值添加(520)到音调滞后候选者集合132。电子装置102可进一步将对应于第二近似音调滞后值的第二音调增益添加(522)到置信测度集合136或相关性集合。在一个配置中,电子装置102可如下计算或估计第二近似音调滞后值和对应的第二音调增益值。电子装置102可基于先前帧110的(LPC)残余信号114估计自相关性值。电子装置102可搜索预定位置范围内的自相关性值以查找最大值。举例来说,所述预定位置范围可为20到140,其为在8千赫兹(kHz)取样速率下用于人类语音的典型的音调滞后范围。电子装置102还可将第二近似音调滞后值设置或确定为出现最大值所在的位置,且/或将第二音调增益值设置或确定为所述音调滞后处的经正规化的自相关性。电子装置102可使用迭代修剪算法140基于音调滞后候选者集合132和置信测度集合136估计(524)音调滞后。在迭代修剪算法140的一个实例中,电子装置102可基于音调滞后候选者集合132和置信测度集合136来计算经加权均值。电子装置102可确定音调滞后候选者集合132中的最远离经加权均值的音调滞后候选者。电子装置102可接着从音调滞后候选者集合132中移除最远离经加权均值的音调滞后候选者。可从置信测度集合136中移除对应于所移除的音调滞后候选者的置信测度。可重复此过程,直到所剩余的音调滞后候选者132的数目减小到指定数目为止。可接着基于所述一个或一个以上剩余的音调滞后候选者132来确定音调滞后142。举例来说,如果仅剩余一个音调滞后候选者,则可将所剩余的最后一个音调滞后候选者确定为音调滞后。举例来说,如果剩余一个以上音调滞后候选者,则电子装置102可将音调滞后142确定为所剩余的候选者的平均值。使用图5中所说明的方法500可为有益的,尤其是对于瞬时帧和其它种类的帧,其中传统的音调滞后估计可能不是非常准确的。然而,图5中所说明的方法500可应用于其它类别或种类的帧(例如,性质良好的话音或语音帧)。在一些配置中,图5中所说明的方法500可选择性地应用于某些种类的帧(例如,瞬时和/或有噪声帧,等)。图6为说明用于使用迭代修剪算法140估计音调滞后的方法600的一个配置的流程图。在一个配置中,可如下指定修`剪算法140。修剪算法140可使用音调滞后候选者集合132 (表示为{dj)和置信测度(例如,相关性)集合136 (表示为IcJ )。i=l,...,L,其中L为音调滞后候选者的数目,且L>N。N为可表示将在修剪之后剩余的音调滞后候选者的所要数目的指定数目。在一个配置中,N=I。电子装置102可基于音调滞后候选者集合132 {dj和置信测度(例如,相关性)集合136 IcJ计算(602)经加权均值(表示为1)。这可针对L个候选者来进行,如方程式
(I)中所说明。
EdiciM =—{^(U
i=l电子装置102可确定(604)音调滞后候选者集合132中的最远离经加权均值的音调滞后候选者(表示为dk)。举例来说,电子装置102可找到dk,使得dk的距均值的距离大于所有其它音调滞后候选者的距均值的距离。在方程式(2)中说明此过程的一个实例。
找到dk,使得对于所有 i (i 关 k),I Mw-dk I > I Mw-Cli I (2)电子装置102可从音调滞后候选者集合132 {dj中移除(606)(例如,“修剪”)最远离经加权均值的音调滞后候选者dk。电子装置可从置信测度(例如,相关性)集合136 {Ci}中移除(608)对应于最远离经加权均值的音调滞后候选者的置信测度(例如,相关性)ck。可将剩余音调滞后候选者数目(例如,L的值)减小I (举例来说,当从其集合132移除(606)音调滞后候选者时和/或当从其集合136移除置信测度时)。举例来说,L=L-1。电子装置102可确定(610)剩余音调滞后候选者数目(例如,L)是否等于指定数目(例如,N)。举例来说,电子装置102可确定是否存在等于指定数目的一个或一个以上剩余音调滞后候选者(例如,L=N=I)。如果存在超过指定数目的剩余音调滞后候选者,则电子装置102可返回到计算(602)经加权均值以便找到并移除最远离经加权均值的候选者。换句话说,可反复或重复进行所述方法600中的前四个步骤602、604、606、608,直到剩余音调滞后候选者数目被减小到指定数目为止。如果剩余候选者数目(例如,L)等于指定数目(例如,N),则电子装置102可基于所述一个或一个以上剩余音调滞后候选者(在音调滞后候选者集合132中)确定(612)音调滞后。举例来说,在指定数目(例如,N)为一的情况下,则可将最后一个剩余音调滞后候选者确定(612)为音调滞后142。在另一实例中,如果指定数目(例如,N)大于一,则电子装置102可将音调滞后142确定¢12)为剩余音调滞后候选者的平均值(例如,所述集合IdJ中的N个剩余音调滞后候选者的平均值)。图7为说明其中可实施用于估计音调滞后的系统和方法的编码器704的一个配置的框图。编码器704的一个实例为线性预测译码(LPC)编码器。编码器704可由电子装置用以编码语音信号706。举例来说,编码器704通过估计或产生参数集合来将语音信号706编码成“经压缩”格式。在一个配置中,这些参数可包括音调滞后742 (估计)、一个或一个以上经量化增益758和/或经量化LPC系数716。这些参数可用以合成所述语音信号706。编码器704可包括一个或一个以上块/模块,其可用以根据本文中所揭示的系统和方法来估计音调滞后。在一个`配置中,这些块/模块可被称为音调估计块/模块726。应注意,可以多种方式实施音调估计块/模块726。举例来说,音调估计块/模块726可包含峰值搜索块/模块728、置信测度块/模块734和/或音调滞后确定块/模块738。在其它配置中,音调估计块/模块726可省略这些块/模块728、734、738中的一者或一者以上或用其它块/模块替代这些块/模块728、734、738中的一者或一者以上。另外或替代地,音调估计块/模块726可被定义为包括其它块/模块,例如线性预测译码(LPC)分析块/模块 722。在图7所说明的实例中,编码器704包括峰值搜索块/模块728、置信测度块/模块734和音调滞后确定块/模块738。然而,峰值搜索块/模块728和/或置信测度块/模块734可为任选的,且可用确定一个或一个以上音调(例如,音调滞后)候选者732和/或置信测度736的一个或一个以上其它块/模块替代。如图7中所说明,音调滞后确定块/模块738可使用迭代修剪算法740。然而,迭代修剪算法740可为任选的,且可在本文中所揭示的系统和方法的一些配置中省略。换句话说,音调滞后确定块/模块738可在一些配置中在不使用迭代修剪算法740的情况下确定音调滞后,且举例来说,可使用某种其它方法或算法(例如平滑或平均算法)来确定音调滞后742。可(例如,由电子装置)获得语音信号706。可将语音信号706提供到成帧块/模块708。成帧块/模块708可将语音信号706分段成一个或一个以上帧710。举例来说,帧710可包括特定数目的语音信号706样本且/或包括某一时间量(例如,10到20毫秒)的语音信号706。当语音信号706被分段成多个帧710时,可根据其含有的信号来对帧710进行分类。举例来说,帧710可为浊音帧、清音帧、静音帧或瞬时帧。本文中所揭示的系统和方法可用以估计帧710 (例如,瞬时帧、浊音帧等)中的音调滞后。举例来说,瞬时帧可位于一个语音类别与另一语音类别之间的边界上。举例来说,语音信号706可从清音(例如,f、s、sh、th等)转变成池音(例如,a、e、1、O、u等)。一些瞬时类型包括上升瞬时(例如,当从语音信号706的清音部分转变到浊音部分时)、爆破音、浊音瞬时(例如,线性预测译码(LPC)改变和音调滞后变化)和下降瞬时(例如,当从语音信号706的浊音部分转变到清音或静音部分(例如,词结尾)时)。在两个语音类别之间的帧710可为瞬时帧。本文中所揭示的系统和方法可有益地应用于瞬时帧,因为传统方法可能不会提供瞬时帧中准确的音调滞后估计。然而,应注意,本文中所揭示的系统和方法可应用于其它种类的帧。编码器704可使用线性预测译码(LPC)分析块/模块722来对帧710执行线性预测分析(例如,LPC分析)。应注意,LPC分析块/模块722可另外或替代地使用来自其它帧710 (例如,来自先前帧710)的信号(例如,一个或一个以上样本)。LPC分析块/模块722可产生一个或一个以上LPC系数720。可将LPC系数720提供到量化块/模块718且/或提供到LPC合成块/模块798。量化块/模块718可产生一个或一个以上经量化LPC系数716。可将经量化LPC系数716提供到比例因子确定块/模块752,且/或可从编码器704输出经量化LPC系数716。可将经量化LPC系数716和来自一个或一个以上帧710的一个或一个以上样本提供到残余确定块/模块712,其可用以确定残余信号714。举例来说,残余信号714可包括已使共振峰(例如,经量化系数716)或共振峰的效应从语音信号706移除(由残余确定块/模块712)的语音信号706的帧710。可将残余信号714提供到规则化块/模块794。规则化块/模块794可使残余信号714规则化,从而产生经修改的(例如,经规则化的)残余信号796。规则化的一个实例在题为“增强型可变速率编解码器,用于宽带展频数字系统的语音服务选项 3、68、70 和 73 (Enhanced Variable Rate Codec, Speech Service0ptions3, 68, 70, and73for Wideband Spread Spectrum Digital Systems)” 的 3GPP2 文献C.S0014D的章节4.11.6中详细描述。基本上,规则化可使当前帧中的音调脉冲来回移动以将其与平滑演进的音调轮廓对齐。可将所述经修改的残余信号796提供到峰值搜索块/模块728且/或提供到LPC合成块/模块798。LPC合成块/模块798可产生(例如,合成)经修改的语音信号701,其可被提供到比例因子确定块/模块752。峰值搜索块/模块728可搜索以查找经修改的残余信号796中的峰值。换句话说,编码器704可搜索以查找经修改的残余信号796中的峰值(例如,高能量的区域)。可识别这些峰值以获得峰值位置集合707。举例来说,可依据样本编号和/或时间来指定峰值位置集合707中的峰值位置。在一些配置中,峰值搜索块/模块可将峰值位置集合707提供到一个或一个以上块/模块,例如比例因子确定块/模块752和/或峰值映射块/模块703。举例来说,峰值位置集合707可表示经修改的残余信号796中的“实际”峰值的位置。峰值搜索块/模块728可包括候选者确定块/模块730。候选者确定块/模块730可使用峰值集合以便确定一个或一个以上候选音调滞后732。“音调滞后”可为帧710中的两个连续音调尖峰之间的“距离”。举例来说,可以样本数目和/或时间量来指定音调滞后。在一个配置中,峰值搜索块/模块728可确定峰值之间的距离以便确定音调滞后候选者732。举例来说,这可通过采用两个峰值位置(例如,按时间和/或样本编号)的差来进行。用于估计音调滞后的一些传统方法使用自相关。在那些方法中,使LPC残余抵靠着其自身滑动以进行相关。可在那些方法中将具有最大自相关性值的任何相关性或音调滞后确定为帧的音调。那些方法可在语音帧非常稳定时起作用。然而,存在其中音调结构可能不非常稳定的其它帧,例如在瞬时帧中。即使当语音帧为稳定的时,传统方法也可能归因于系统中的噪声而不会提供非常准确的音调估计。噪声可减小残余的“有峰”程度。在此情况下,举例来说,传统方法可确定不是非常准确的音调估计。峰值搜索块/模块728可使用相关方法获得音调滞后候选者集合732。举例来说,可首先由候选者确定块/模块730确定候选音调滞后集合732。接着,可由置信测度块/模块734基于音调滞后候选者集合732确定对应于所述候选音调滞后集合的置信测度集合736。更具体来说,第一集合可为音调滞后候选者集合732,且第二集合可为用于音调滞后候选者732中的每一者的置信测度集合736。因此,举例来说,第一置信测度或值可对应于第一音调滞后候选者,等等。因此,可“构建”或确定音调滞后候选者集合732和置信测度集合736。置信测度集合736可用以改进所估计的音调滞后742的准确性。在一个配置中,置信测度集合736可为相关性集合,其中每一值可为(在基础方面中)对应于音调滞后候选者的音调滞后处的相关性。换句话说,用于每一特定音调滞后的相关性系数可构成用于音调滞后候选者732距离中的每一者的置信测度。在一些配置中,峰值搜索块/模块728可将基于当前帧710的经修改的残余信号796计算的第一近似音调滞后值添加到音调滞后候选者集合732。置信测度块/模块734还可将对应于第一近似音调滞后值的第一音调增益添加到置信测度集合736或相关性集合。在一个实例中,峰值搜索块/模块728可如下计算或估计第一近似音调滞后值。可基于当前帧710的经修改的残余信号796来估计自相关性值。峰值搜索块/模块728可搜索预定位置范围内的自相关性值以查找最大值。峰值搜索块/模块728还可将第一近似音调滞后值设置或确定为出现最大值所在的位置。第一近似滞后可基于自相关性函数中的最大值。第一近似音调滞后值可作为音调滞后候选者添加到音调滞后候选者集合732,且/或可作为峰值位置添加到峰值位置集合707。置信测度块/模块734可将第一音调增益值(例如,置信测度)设置或确定为所述音调滞后处的经正规化的自相关性。这可基于由峰值搜索块/模块728提供的第一近似音调滞后值来进行。可将第一音调增益值(例如,置信测度)添加到置信测度集合736。在一些配置中,峰值搜索块/模块728可将基于先前帧710的经修改的残余信号796计算的第二近似音调滞后值添加到音调滞后候选者集合732。置信测度块/模块734可进一步将对应于第二近似音调滞后值的第二音调增益添加到置信测度集合736或相关性集合。
在一个实例中,峰值搜索块/模块728可如下计算或估计第二近似音调滞后值。可基于先前帧710的经修改的残余信号796来估计自相关性值。峰值搜索块/模块728可搜索预定位置范围内的自相关性值以查找最大值。峰值搜索块/模块728还可将第二近似音调滞后值设置或确定为出现最大值所在的位置。第二近似音调滞后值可为来自先前帧的音调滞后值。第二近似音调滞后值可作为音调滞后候选者添加到音调滞后候选者集合732,且/或可作为峰值位置添加到峰值位置集合707。置信测度块/模块734可将第二音调增益值(例如,置信测度)设置或确定为所述音调滞后处的经正规化的自相关性。这可基于由峰值搜索块/模块728提供的第二近似音调滞后值来进行。可将第二音调增益值(例如,置信测度)添加到置信测度集合736。可将音调滞后候选者集合732和/或置信测度集合736提供到音调滞后确定块/模块738。音调滞后确定块/模块738可基于一个或一个以上音调滞后候选者732确定音调滞后742。在一些配置中,音调滞后确定块/模块738可基于一个或一个以上置信测度736 (除所述一个或一个以上音调滞后候选者732之外)确定音调滞后742。举例来说,音调滞后确定块/模块738可使用迭代修剪算法740来选择所述音调滞后值中的一者。上文给出关于迭代修剪算法740的更多细节。所选择的音调滞后742值可为“真实”音调滞后的估计。在其它配置中,音调滞后确定块/模块738可使用某种其它方法来确定音调滞后742。举例来说,代替迭代修剪算法740或除迭代修剪算法740之外,音调滞后确定块/模块738可使用平均或平滑算法。可将由音调滞后确定块/模块738确定的音调滞后742提供到激励合成块/模块748和比例因子确定块/模块752。可将来自先前帧710的经修改的残余信号796提供到激励合成块/模块748。另外或替代地,可由原型波形产生块/模块744将波形746提供到激励合成块/模块748。在一个配置中,原型波形产生块/模块744可基于音调滞后742产生波形746。激励合成块/模块748可基于音调滞后742、(先前帧)经修改的残余796和/或波形746产生或合成激励750。经合成的激励750可包括经合成的激励中的峰值的位置。``在一个配置中,原型波形产生块/模块744和/或激励合成块/模块748可根据方程式(3)到(5)来操作。举例来说,原型波形产生块/模块744可产生一个或一个以上具有长度PJ例如,音调滞后742的长度)的原型波形746。
权利要求
1.一种用于估计音调滞后的电子装置,其包含: 处理器; 与所述处理器电子通信的存储器; 存储在所述存储器中的指令,所述指令可执行以: 获得当前帧; 基于所述当前帧获得残余信号; 基于所述残余信号确定峰值位置集合; 基于所述峰值位置集合获得音调滞后候选者集合;以及 基于所述音调滞后候选者集合估计音调滞后。
2.根据权利要求 1所述的电子装置,其中确定峰值位置集合包含: 基于所述残余信号的样本的绝对值和窗口信号计算包络信号; 基于所述包络信号与所述包络信号的时间移位版本之间的差计算第一梯度信号;基于所述第一梯度信号与所述第一梯度信号的时间移位版本之间的差计算第二梯度信号; 选择其中第二梯度信号值降低到第一阈值以下的第一位置索引集合; 通过消除其中包络值相对于包络中的最大值降低到第二阈值以下的位置索引来从所述第一位置索引集合确定第二位置索引集合;以及 通过消除相对于相邻位置索引不满足差阈值的位置索引来从所述第二位置索引集合确定第三位置索引集合。
3.根据权利要求1所述的电子装置,其中获得所述音调滞后候选者集合包含: 以递增次序布置所述峰值位置集合以产生有序峰值位置集合;以及 计算所述有序峰值位置集合中的连续峰值位置对之间的距离。
4.根据权利要求1所述的电子装置,其中所述指令进一步可执行以: 使用所述当前帧和在所述当前帧之前的信号执行线性预测分析以获得线性预测系数集合;以及 基于所述线性预测系数集合确定经量化线性预测系数集合。
5.根据权利要求4所述的电子装置,其中获得所述残余信号进一步基于所述经量化线性预测系数集合。
6.根据权利要求1所述的电子装置,其中所述指令进一步可执行以计算对应于所述音调滞后候选者集合的置信测度集合。
7.根据权利要求6所述的电子装置,其中计算对应于所述音调滞后候选者集合的所述置信测度集合是基于信号包络和所述峰值位置的有序集合中的连续峰值位置对。
8.根据权利要求7所述的电子装置,其中计算所述置信测度集合包含对于所述峰值位置的所述有序集合中的每一对峰值位置: 基于围绕一对峰值位置中的第一峰值位置的范围选择第一信号缓冲器; 基于围绕所述对峰值位置中的第二峰值位置的范围选择第二信号缓冲器; 计算所述第一信号缓冲器与所述第二信号缓冲器之间的经正规化的交叉相关性;以及 将所述经正规化的交叉相关性添加到所述置信测度集合。
9.根据权利要求6所述的电子装置,其中所述音调滞后是使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合来估计的。
10.根据权利要求6所述的电子装置,其中所述指令进一步可执行以: 将基于所述当前帧的所述残余信号计算的第一近似音调滞后值添加到所述音调滞后候选者集合;以及 将对应于所述第一近似音调滞后值的第一音调增益添加到所述置信测度集合。
11.根据权利要求10所述的电子装置,其中所述第一近似音调滞后值是通过以下步骤来估计的且所述第一音调增益是通过以下步骤来估计的: 基于所述当前帧的所述残余信号估计自相关性值; 在某一位置范围内搜索所述自相关性值以查找最大值; 将所述第一近似音调滞后值设置为出现所述最大值所在的位置;以及 将所述第一音调增益值设置为所述第一近似音调滞后值处的经正规化的自相关性。
12.根据权利要求10所 述的电子装置,其中所述指令进一步可执行以: 将基于先前帧的残余信号计算的第二近似音调滞后值添加到所述音调滞后候选者集合;以及 将对应于所述第二近似音调滞后值的第二音调增益添加到所述置信测度集合。
13.根据权利要求12所述的电子装置,其中所述第二近似音调滞后值是通过以下步骤来估计的且所述第二音调增益是通过以下步骤来估计的: 基于所述先前帧的所述残余信号估计自相关性值; 在某一位置范围内搜索所述自相关性值以查找最大值; 将所述第二近似音调滞后值设置为出现所述最大值所在的位置;以及 将所述音调增益值设置为所述第二近似音调滞后值处的经正规化的自相关性。
14.根据权利要求9所述的电子装置,其中使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计所述音调滞后包含: 使用所述音调滞后候选者集合和所述置信测度集合计算经加权均值; 确定所述音调滞后候选者集合中的最远离所述经加权均值的音调滞后候选者; 从所述音调滞后候选者集合中移除最远离所述经加权均值的所述音调滞后候选者;从所述置信测度集合中移除对应于最远离所述经加权均值的所述音调滞后候选者的置信测度; 确定剩余音调滞后候选者数目是否等于指定数目;以及 在所述剩余音调滞后候选者数目等于所述指定数目的情况下,基于一个或一个以上剩余音调滞后候选者确定所述音调滞后。
15.根据权利要求14所述的电子装置,其中所述指令进一步可执行以在所述剩余音调滞后候选者数目不等于所述指定数目的情况下反复。
16.根据权利要求14所述的电子装置,其中计算所述经加权均值是根据方程式
17.根据权利要求14所述的电子装置,其中确定所述音调滞后候选者集合中的最远离所述经加权均值的音调滞后候选者是通过找到dk来实现的,使得对于所有i,|Mw-dk | > | Mw-di|,其中i≠k,其中dk为最远离所述经加权均值的所述音调滞后候选者,Mw为所述经加权均值,{di}为所述音调滞后候选者集合,且i为索引编号。
18.根据权利要求1所述的电子装置,其中所述指令进一步可执行以发射所述音调滞后。
19.根据权利要求1所述的电子装置,其中所述电子装置为无线通信装置。
20.一种用于估计音调滞后的电子装置,其包含: 处理器; 与所述处理器电子通信的存储器; 存储在所述存储器中的指令,所述指令可执行以: 获得语音信号; 基于所述语音信号获得音调滞后候选者集合; 确定对应于所述音调滞后候选者集合的置信测度集合;以及 使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计音调滞后。
21.根据权利要求20所述的电子装置,其中使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计所述音调滞后包含: 使用所述音调滞后候选者集合和所述置信测度集合计算经加权均值; 确定所述音调滞后候选者集合中的最远离经加权均值的音调滞后候选者; 从所述音调滞后候选者集合中移除最远离所述经加权均值的音调滞后候选者; 从所述置信测度集合中移除对应于最远离所述经加权均值的所述音调滞后候选者的置信测度; 确定剩余音调滞后候选者数目是否等于指定数目;以及 在所述剩余音调滞后候选者数目等于所述指定数目的情况下,基于一个或一个以上剩余音调滞后候选者确定所述音调滞后。
22.一种用于在电子装置上估计音调滞后的方法,其包含: 获得当前帧; 基于所述当前帧获得残余信号; 基于所述残余信号确定峰值位置集合; 基于所述峰值位置集合获得音调滞后候选者集合;以及 基于所述音调滞后候选者集合估计音调滞后。
23.根据权利要求22所述的方法,其中确定峰值位置集合包含: 基于所述残余信号的样本的绝对值和窗口信号计算包络信号; 基于所述包络信号与所述包络信号的时间移位版本之间的差计算第一梯度信号;基于所述第一梯度信号与所述第一梯度信号的时间移位版本之间的差计算第二梯度信号; 选择其中第二梯度信号值降低到第一阈值以下的第一位置索引集合; 通过消除其中包络值相对于包络中的最大值降低到第二阈值以下的位置索引来从所述第一位置索引集合确定第二位置索引集合;以及 通过消除相对于相邻位置索引不满足差阈值的位置索引来从所述第二位置索引集合确定第三位置索引集合。
24.根据权利要求22所述的方法,其中获得所述音调滞后候选者集合包含: 以递增次序布置所述峰值位置集合以产生有序峰值位置集合;以及 计算所述有序峰值位置集合中的连续峰值位置对之间的距离。
25.根据权利要求22所述的方法,其进一步包含: 使用所述当前帧和在所述当前帧之前的信号执行线性预测分析以获得线性预测系数集合;以及 基于所述线性预测系数集合确定经量化线性预测系数集合。
26.根据权利要求25所述的方法,其中获得所述残余信号进一步基于所述经量化线性预测系数集合。
27.根据权利要求2 2所述的方法,其进一步包含计算对应于所述音调滞后候选者集合的置信测度集合。
28.根据权利要求27所述的方法,其中计算对应于所述音调滞后候选者集合的所述置信测度集合是基于信号包络和所述峰值位置的有序集合中的连续峰值位置对。
29.根据权利要求28所述的方法,其中计算所述置信测度集合包含对于所述峰值位置的所述有序集合中的每一对峰值位置: 基于围绕一对峰值位置中的第一峰值位置的范围选择第一信号缓冲器; 基于围绕所述对峰值位置中的第二峰值位置的范围选择第二信号缓冲器; 计算所述第一信号缓冲器与所述第二信号缓冲器之间的经正规化的交叉相关性;以及 将所述经正规化的交叉相关性添加到所述置信测度集合。
30.根据权利要求27所述的方法,其中使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合来估计所述音调滞后。
31.根据权利要求27所述的方法,其进一步包含: 将基于所述当前帧的所述残余信号计算的第一近似音调滞后值添加到所述音调滞后候选者集合;以及 将对应于所述第一近似音调滞后值的第一音调增益添加到所述置信测度集合。
32.根据权利要求31所述的方法,其中通过以下步骤来估计所述第一近似音调滞后值且估计所述第一音调增益: 基于所述当前帧的所述残余信号估计自相关性值; 在某一位置范围内搜索所述自相关性值以查找最大值; 将所述第一近似音调滞后值设置为出现所述最大值所在的位置;以及 将所述第一音调增益值设置为所述第一近似音调滞后值处的经正规化的自相关性。
33.根据权利要求31所述的方法,其进一步包含: 将基于先前帧的残余信号计算的第二近似音调滞后值添加到所述音调滞后候选者集合;以及 将对应于所述第二近似音调滞后值的第二音调增益添加到所述置信测度集合。
34.根据权利要求33所述的方法,其中通过以下步骤来估计所述第二近似音调滞后值且估计所述第二音调增益: 基于所述先前帧的所述残余信号估计自相关性值; 在某一位置范围内搜索所述自相关性值以查找最大值; 将所述第二近似音调滞后值设置为出现所述最大值所在的位置;以及 将所述音调增益值设置为所述第二近似音调滞后值处的经正规化的自相关性。
35.根据权利要求30所述的方法,其中使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计所述音调滞后包含: 使用所述音调滞后候选者集合和所述置信测度集合计算经加权均值; 确定所述音调滞后候选者集合中的最远离所述经加权均值的音调滞后候选者; 从所述音调滞后候选者集合中移除最远离所述经加权均值的所述音调滞后候选者;从所述置信测度集合中移除对应于最远离所述经加权均值的所述音调滞后候选者的置信测度; 确定剩余音调滞后候选者数目是否等于指定数目;以及 在所述剩余音调滞后候选者数目等于所述指定数目的情况下,基于一个或一个以上剩余音调滞后候选者确定所述音调滞后。
36.根据权利要求35所述的方法,其进一步包含在所述剩余音调滞后候选者数目不等于所述指定数目的情况下反复。
37.根据权利要求35所述的方法,其中根据方程式^来实现计算所述经加
38.根据权利要求35所述的方法,其中通过找到dk来实现确定所述音调滞后候选者集合中的最远离所述经加权均值的音调滞后候选者,使得对于所有i,iM^dkblM^dil,其中i古k,其中dk为最远离所述经加权均值的所述音调滞后候选者,MW为所述经加权均值,{dj为所述音调滞后候选者集合,且i为索引编号。
39.根据权利要求22所述的方法,其进一步包含发射所述音调滞后。
40.根据权利要求22所述的方法,其中所述电子装置为无线通信装置。
41.一种用于在电子装置上估计音调滞后的方法,其包含: 获得语音信号; 基于所述语音信号获得音调滞后候选者集合; 确定对应于所述音调滞后候选者集合的置信测度集合;以及 使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计音调滞后。
42.根据权利要求41所述的方法,其中使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计所述音调滞后包含: 使用所述音调滞后候选者集合和所述置信测度集合计算经加权均值; 确定所述音调滞后候选者集合中的最远离经加权均值的音调滞后候选者; 从所述音调滞后候选者集合中移除最远离所述经加权均值的音调滞后候选者;从所述置信测度集合中移除对应于最远离所述经加权均值的所述音调滞后候选者的置信测度; 确定剩余音调滞后候选者数目是否等于指定数目;以及 在所述剩余音调滞后候选者数目等于所述指定数目的情况下,基于一个或一个以上剩余音调滞后候选者确定所述音调滞后。
43.一种用于估计音调滞后的计算机程序产品,其包含上面具有指令的非暂时性有形计算机可读媒体,所述指令包含: 用于致使电子装置获得当前帧的代码; 用于致使所述电子装置基于所述当前帧获得残余信号的代码; 用于致使所述电子装置基于所述残余信号确定峰值位置集合的代码; 用于致使所述电子装置基于所述峰值位置集合获得音调滞后候选者集合的代码;以及 用于致使所述电子装置基于所述音调滞后候选者集合估计音调滞后的代码。
44.根据权利要求43所述的计算机程序产品,其中所述用于致使所述电子装置确定峰值位置集合的代码包含: 用于致使所述电子装置基于所述残余信号的样本的绝对值和窗口信号计算包络信号的代码; 用于致使所述电子装置基于所述包络信号与所述包络信号的时间移位版本之间的差计算第一梯度信号的代码;` 用于致使所述电子装置基于所述第一梯度信号与所述第一梯度信号的时间移位版本之间的差计算第二梯度信号的代码; 用于致使所述电子装置选择其中第二梯度信号值降低到第一阈值以下的第一位置索引集合的代码; 用于致使所述电子装置通过消除其中包络值相对于包络中的最大值降低到第二阈值以下的位置索引来从所述第一位置索引集合确定第二位置索引集合的代码;以及 用于致使所述电子装置通过消除相对于相邻位置索引不满足差阈值的位置索引来从所述第二位置索引集合确定第三位置索引集合的代码。
45.一种用于估计音调滞后的计算机程序产品,其包含上面具有指令的非暂时性有形计算机可读媒体,所述指令包含: 用于致使电子装置获得语音信号的代码; 用于致使所述电子装置基于所述语音信号获得音调滞后候选者集合的代码; 用于致使所述电子装置确定对应于所述音调滞后候选者集合的置信测度集合的代码;以及 用于致使所述电子装置使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计音调滞后的代码。
46.根据权利要求45所述的计算机程序产品,其中所述用于致使所述电子装置使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计所述音调滞后的代码包含: 用于致使所述电子装置使用所述音调滞后候选者集合和所述置信测度集合计算经加权均值的代码;用于致使所述电子装置确定所述音调滞后候选者集合中的最远离经加权均值的音调滞后候选者的代码; 用于致使所述电子装置从所述音调滞后候选者集合中移除最远离所述经加权均值的音调滞后候选者的代码; 用于致使所述电子装置从所述置信测度集合中移除对应于最远离所述经加权均值的所述音调滞后候选者的置信测度的代码; 用于致使所述电子装置确定剩余音调滞后候选者数目是否等于指定数目的代码;以及用于致使所述电子装置在所述剩余音调滞后候选者数目等于所述指定数目的情况下基于一个或一个以上剩余音调滞后候选者确定所述音调滞后的代码。
47.一种用于估计音调滞后的设备,其包含: 用于获得当前帧的装置; 用于基于所述当前帧获得残余信号的装置; 用于基于所述残余信号确定峰值位置集合的装置; 用于基于所述峰值位 置集合获得音调滞后候选者集合的装置;以及 用于基于所述音调滞后候选者集合估计音调滞后的装置。
48.根据权利要求47所述的设备,其中所述用于确定峰值位置集合的装置包含: 用于基于所述残余信号的样本的绝对值和窗口信号计算包络信号的装置; 用于基于所述包络信号与所述包络信号的时间移位版本之间的差计算第一梯度信号的装置; 用于基于所述第一梯度信号与所述第一梯度信号的时间移位版本之间的差计算第二梯度信号的装置; 用于选择其中第二梯度信号值降低到第一阈值以下的第一位置索引集合的装置;用于通过消除其中包络值相对于包络中的最大值降低到第二阈值以下的位置索引来从所述第一位置索引集合确定第二位置索引集合的装置;以及 用于通过消除相对于相邻位置索引不满足差阈值的位置索引来从所述第二位置索引集合确定第三位置索引集合的装置。
49.一种用于估计音调滞后的设备,其包含: 用于获得语音信号的装置; 用于基于所述语音信号获得音调滞后候选者集合的装置; 用于确定对应于所述音调滞后候选者集合的置信测度集合的装置;以及用于使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计音调滞后的装置。
50.根据权利要求49所述的设备,其中所述用于使用迭代修剪算法基于所述音调滞后候选者集合和所述置信测度集合估计所述音调滞后的装置包含: 用于使用所述音调滞后候选者集合和所述置信测度集合计算经加权均值的装置; 用于确定所述音调滞后候选者集合中的最远离经加权均值的音调滞后候选者的装置; 用于从所述音调滞后候选者集合中移除最远离所述经加权均值的音调滞后候选者的装置;用于从所述置信测度集合中移除对应于最远离所述经加权均值的所述音调滞后候选者的置信测度的装置; 用于确定剩余音调滞后候选者数目是否等于指定数目的装置;以及用于在所述剩余音调滞后候选者数目等于所述指定数目的情况下基于一个或一个以上剩余音调滞后候选者确定所述音调`滞后的装置。
全文摘要
本发明描述一种用于估计音调滞后的电子装置。所述电子装置包括处理器和存储于与所述处理器电子通信的存储器中的可执行指令。所述电子装置获得当前帧。所述电子装置还基于所述当前帧获得残余信号。所述电子装置另外基于所述残余信号确定峰值位置集合。此外,所述电子装置基于所述峰值位置集合获得音调滞后候选者集合。所述电子装置还基于所述音调滞后候选者集合估计音调滞后。
文档编号G10L25/90GK103109321SQ201180044585
公开日2013年5月15日 申请日期2011年9月9日 优先权日2010年9月16日
发明者文卡特什·克里希南, 斯特凡那·皮埃尔·维莱特 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1