语音信号处理方法、装置和系统的利记博彩app

文档序号：9752214阅读：715来源：国知局

语音信号处理方法、装置和系统的利记博彩app
【技术领域】
[0001]本申请涉及语音识别处理技术领域，尤其涉及一种语音信号处理方法、装置和系统。
【背景技术】
[0002]随着语音识别技术的发展，语音识别系统的应用领域越来越广，例如:车载语音识别系统、远场语音识别系统，语音输入法系统以及智能家居系统。由于麦克风距离说话人可近可远，近距离时录到的语音能量足够大，随着距离的增加，语音能量的衰减会造成语音识别器的识别率急剧下降。
[0003]动态范围控制(DRC)是语音通信中一种必不可少的技术，即根据DRC曲线对输入信号进行增益处理。然而，目前的DRC曲线是一条固定曲线，限制了不同信号处理的差异性，影响后端语音识别系统的正常工作。

【发明内容】

[0004]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此，本申请的第一个目的在于提出一种语音信号处理方法，该方法实现了对语音信号幅度的动态差异性控制，提高了语音信号识别率，以及语音系统识别的稳健性。
[0006]本申请的第二个目的在于提出一种语音信号处理装置。
[0007]本申请的第三个目的在于提出一种语音信号处理系统。
[0008]为达上述目的，本申请第一方面实施例提出了一种语音信号处理方法，包括:根据预设的分割点将预设的信号调整区间分割为多段放大区间；以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。
[0009]本申请实施例的语音信号处理方法，根据预设的分割点将预设的信号调整区间分割为多段放大区间；以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。由此，实现了对语音信号幅度的动态差异性控制，提高了语音信号识别率，以及语音系统识别的稳健性。
[0010]为达上述目的，本申请第二方面实施例提出了一种语音信号处理装置，包括:分割模块，用于根据预设的分割点将预设的信号调整区间分割为多段放大区间;处理模块，用于以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。
[0011]本申请实施例的语音信号处理装置，通过分割模块根据预设的分割点将预设的信号调整区间分割为多段放大区间；通过处理模块以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。由此，实现了对语音信号幅度的动态差异性控制，提高了语音信号识别率，以及语音系统识别的稳健性。
[0012]为达上述目的，本申请第三方面实施例提出了一种语音信号处理系统，包括:语音信号识别装置，以及如上所述的语音信号处理装置。
[0013]本申请实施例的语音信号处理系统，根据预设的分割点将预设的信号调整区间分割为多段放大区间；以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。由此，实现了对语音信号幅度的动态差异性控制，提高了语音信号识别率，以及语音系统识别的稳健性。
【附图说明】
[0014]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解，其中:
[0015]图1是本申请一个实施例的语音信号处理方法的流程图；
[0016]图2为动态DRC曲线示意图；
[0017]图3为输入信号经DRC处理前后对比示意图；
[0018]图4是本申请另一个实施例的语音信号处理方法的流程图；
[0019]图5为通过噪音水平跟踪预估的噪音信号门限动态调整示意图；
[0020]图6为通过语音活动检测前后DRC处理效果的对比示意图；
[0021 ]图7为通过噪声抑制处理前后DRC处理效果的对比示意图；
[0022]图8是本申请另一个实施例的语音信号处理方法的流程图；
[0023]图9是本申请另一个实施例的语音信号处理方法的流程图；
[0024]图10为对输入信号的两遍级联DRC处理放大示意图；
[0025]图11是本申请一个实施例的语音信号处理装置的结构示意图；
[0026]图12是本申请另一个实施例的语音信号处理装置的结构示意图；
[0027]图13是本申请另一个实施例的语音信号处理装置的结构示意图；
[0028]图14是本申请另一个实施例的语音信号处理装置的结构示意图；
[0029]图15是本申请一个实施例的语音信号处理系统的结构示意图。
【具体实施方式】
[0030]下面详细描述本申请的实施例，所述实施例的示例在附图中示出，其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的，旨在用于解释本申请，而不能理解为对本申请的限制。
[0031]下面参考附图描述本申请实施例的语音信号处理方法、装置和系统。
[0032]图1是本申请一个实施例的语音信号处理方法的流程图。
[0033]如图1所示，该语音信号处理方法包括:
[0034]步骤101，根据预设的分割点将预设的信号调整区间分割为多段放大区间。
[0035]由于目前的DRC是一条曲线固定，造成了门限值和放大区间固定，无法对不同的语音信号进行差异性的增益处理，例如:针对信号幅度很小和信号幅度很大的录音，一条限定的DRC曲线不能同时实现对两批数据的放大作用。因此，本实施例生成新的动态范围控制曲线进行语音信号的动态范围控制。
[0036]首先，根据预设的分割点将预设的信号调整区间分割为多段放大区间。其中，预设的信号调整区间的两个端点分别为噪音信号门限和语音信号门限，其中，噪音信号门限小于语音信号门限。
[0037]需要注意的是，分割后的多段放大区间的数量可以根据具体应用场景进行设置，例如:
[0038]可以采用一个分割点将预设的信号调整区间分割为两段放大区间;或者，
[0039]可以采用两个分割点将预设的信号调整区间分割为三段放大区间。
[0040]步骤102，以控制坐标的对角线为参考坐标，在所述对角线上方区域，根据预设的目标增益生成与所述多段放大区间对应的单调递增的动态范围控制曲线。
[0041]预先设置有目标增益，本领域技术人员可以理解的是，目标增益的表现形式有很多，可以根据应用需要进行选择，例如:放大区间的斜率，或者，放大区间中的多个坐标点。
[0042]需要注意的是，由于预先分割的放大区间数量不同，因此，需要预先设置的放大区间的斜率数量，或者，放大区间中的多个坐标点也不同，以放大区间的斜率为例说明如下:
[0043]如果预先采用一个分割点将预设的信号调整区间分割为两段放大区间，则需要预先设置至少一个放大区间的斜率；
[0044]如果预先采用两个分割点将预设的信号调整区间分割为三段放大区间，则需要预先设置至少两个放大区间的斜率。
[0045]以控制坐标的对角线为参考坐标，在对角线上方区域，根据预设的目标增益生成与预先分割的多段放大区间对应的单调递增的动态范围控制曲线。
[0046]本领域技术人员可以理解的是，动态范围控制曲线的单调递增特性是指后一段放大区间对应的输出信号大于前一段放大区间对应的输出信号，其中处在后一段放

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：崔玮玮;魏建强;徐杨飞;
技术所有人：百度在线网络技术（北京）有限公司;
我是此专利的发明人

上一篇：一种谱曲作词的方法和装置的制造方法
上一篇：手机麦克风的语音增强系统和语音增强方法