基于盲信号提取算法的语音识别方法及系统的利记博彩app
【技术领域】
[0001] 本发明设及通信技术领域,尤其设及一种基于盲信号提取算法的语音识别方法及 系统。
【背景技术】
[0002] 如图1所示,现有技术中语音识别系统的语音识别处理过程的主要包括:
[0003] -、预处理;手机等通信终端采集到的语音输入(源信号)后进行预处理,一般包 括预滤波、采样和量化、分帖、加窗、预加重和/或端点检测等过程,不同通信终端会根据需 要选择其中至少一种预处理方法。
[0004] 二、特征提取;该一步是关键,目的是提取源信号中反映本质特征的信号特征(即 声学参数),提取期望信号特征的好坏将直接影响后续匹配成功的概率。现有技术对预处理 信号的处理主要是通过常见的时域和频域分析法,例如振动幅值、相关分析、频谱分析、包 络分析、倒频谱分析等。
[0005] S、训练;训练阶段将特征参数进行一定的处理后,为每个词条建立一个模型,保 存为模式库。
[0006] 四、模式匹配;根据一定规则(如某种距离测度)W及专家知识(如构词规则、语 法规则、语义规则等),计算步骤二中提取的信号特征与步骤=中形成的模式库之间的相似 度,判断出输入语音的语义信息。
[0007] W上结合原理图对现有技术进行了介绍,从中可看出智能语音识别实质是一个模 式识别问题,其核屯、是对输入源信号特征的提取。如果提取的信号特征是期望信号特征,在 接下来的模式匹配环节,匹配成功的概率就比较大,否则如果提取的信号夹杂着其他干扰 信号特征,甚至干扰信号特征淹没期望信号特征,该样就会造成误识别甚至不能识别的情 况,大大降低智能语音识别的用户体验。而现有技术的缺陷恰恰就体现在该方面,从图1可 看出通信终端采集到的输入混合源信号经过初步处理W后,直接用传统的信号处理方法, 如;时域分析技术、化urier(傅立叶)谱分析技术、包络分析技术、倒频谱技术等进行特征 提取。经过简单处理后,直接对输入混合源信号进行分析是现有信号处理技术的共性,它 们在本质上都属于单通道的数据采集和分析技术,其提取的信号特征仍然夹杂着大量无关 干扰信号特征,在有些情况下该些干扰信号特征甚至会淹没期望信号特征,大大降低语音 识别的灵敏度和准确度。
[0008] 综上可知,现有技术在实际使用上显然存在不便与缺陷,所W有必要加W改进。
【发明内容】
[0009] 针对上述的缺陷,本发明的目的在于提供一种基于盲信号提取算法的语音识别方 法及系统,其能够从输入混合源语音信号中准确地提取出期望信号特征,可大大提高模式 匹配成功率,从而提升了通信终端语音识别的灵敏度和准确度。
[0010] 为了实现上述目的,本发明提供基于盲信号提取算法的语音识别方法,包括有:
[0011] 通过盲信号提取算法处理输入的混合源语音信号,W分离出各个期望源语音信 号;
[0012] 从所述期望源语音信号中提取出期望信号特征;
[0013] 根据所述期望信号特征进行模式匹配得到对应的语义信息。
[0014] 根据本发明所述的语音识别方法,所述通过盲信号提取算法处理输入的混合源语 音信号的步骤之前还包括:
[0015] 对输入的所述混合源语音信号进行预处理,所述预处理包括对所述混合源语音信 号进行去均值处理和白化处理。
[0016] 根据本发明所述的语音识别方法,所述分离出各个期望源语音信号的步骤之后, W及从所述期望源语音信号中提取出期望信号特征的步骤之前还包括:
[0017] 计算各所述期望语音信号的振幅均值;
[0018] 判断所述期望源语音信号的所述振幅均值是否小于预定的振幅阔值;
[0019] 若所述期望源语音信号的所述振幅均值小于所述振幅阔值,则对所述期望源语音 信号进行信号增强处理;
[0020] 若所述期望源语音信号的所述振幅均值大于或等于所述振幅阔值,则对所述期望 源语音信号不进行信号增强处理。
[0021] 根据本发明所述的语音识别方法,所述通过盲信号提取算法处理输入的混合源语 音信号的步骤包括:
[0022] 在所述盲信号提取算法的紧缩过程中增加一个实时线性变换处理。
[0023] 根据本发明所述的语音识别方法,所述实时线性变换的计算公式为:
[0024]
第一公式
[00巧]其中,X是观察信号数据分量;y是输出信号的分量;W为分离向量;k = 1、2、…… k为分离向量W的行数,乃炸)=,心.的最优化估计是通过最小化第二公式中的能 量代价函数来实现;
[0026]
第二公式
[0027] 其中,P为观察信号向量X的列数,m观察信号向量X的行数,E{p(Xj+i)}为能量 代价函数,所述能量代价函数取得最小值时,表示从所述混合源语音信号中剔除了已提取 的期望源语音信号5V将所述能量代价函数最小化可导出简化的局部最小均方算法,即;
[002引
第;公式
[0029] 其中,是指求W的分量时用到的第j个系数,为所辨识的混合矩阵百的第j 列完j的估计值,=w>j.为第j个提取的期望源语音信号,向量Wj.通过第四公式和第五公 式来估计,即;
[0030]
第四公式
[0031]
[0032] 其中,巧的?)是在求w的分量时用到的另一个系数;
I能量函数的比值; P、q是输出向量y的行数和列数;
[0033] 该估计过程不断进行下去,直到提取所有期望源语音信号的估计为止,即直到某 个xw的振幅均值达到预设阔值。
[0034] 本发明还提供一种基于盲信号提取算法的语音识别系统,包括有:
[00巧]BSE处理模块,用于通过盲信号提取算法处理输入的混合源语音信号,W分离出各 个期望源语音信号;
[0036] 特征提取模块,用于从所述期望源语音信号中提取出期望信号特征;
[0037] 模式匹配模块,用于根据所述期望信号特征进行模式匹配得到对应的语义信息。 [003引根据本发明所述的语音识别系统,还包括:
[0039] 预处理模块,用于在通过盲信号提取算法处理所述混合源语音信号之前,对输入 的所述混合源语音信号进行预处理,所述预处理包括对所述混合源语音信号进行去均值处 理和白化处理。
[0040] 根据本发明所述的语音识别系统,还包括信号增强模块,所述信号增强模块进一 步包括:
[0041] 计算子模块,用于在分离出各个所述期望源语音信号之后,计算各所述期望语音 信号的振幅均值;
[0042] 判断子模块,用于判断所述期望源语音信号的所述振幅均值是否小于预定的振幅 阔值;
[0043] 增强子模块,用于若所述期望源语音信号的所述振幅均值小于所述振幅阔值时, 对所述期望源语音信号进行信号增强处理,再将增强处理后的所述期望源语音信号发送给 所述特征提取模块进行处理;若所述期望源语音信号的所述振幅均值大于或等于所述振幅 阔值,则对所述期望源语音信号不进行信号增强处理并直接送给所述特征提取模块进行处 理。
[0044] 根据本发明所述的语音识别系统,所述BSE处理模块还用于在所述盲信号提取算 法的紧缩过程中增加一个实时线性变换处理。
[0045] 根据本发明所述的语音识别系统,所述实时线性变换的计算公式为:
[0046]
第一公式
[0047] 其中,X是观察信号数据分量;y是输出信号的分量;W为分离向量;k= 1、2、…… k为分离向量W的行数,.V,?(幻=的最优化估计是通过最小化第二公式中的能 量代价函数来实现;
[0048]
第二公式
[004引其中,P为观察信号向量X的列数,m观察信号向量X的行数,E{p(Xj+i)}为能量 代价函数,所述能量代价函数取得最小值时,表示从所述混合源语音信号中剔除了已提取 的期望源语音信号5V将所述能量代价函数最小化可导出简化的局部最小均方算法,即;
[0050]<