一种基于指向目标人变声比例参数的语音变声方法及装置的制造方法
【技术领域】
[0001] 本发明设及语音信号处理技术领域,特别设及一种基于指向目标人变声比例参数 的语音变声方法及装置。
【背景技术】
[0002] 在语音信号处理领域中,语音变声是一个重要的分支,具有重要的学术研究价值 和应用价值。目前语音变声已有不少方法,传统的方法基本上是基于W下Ξ种思想:第一种 方法是在时域上处理语音信号,通过缩放时域长度来改变信号的频率,再通过插值法使新 信号长度与原信号保持一致(CN03137014.4);第二种方法是在频域上进行处理,即先对语 音信号进行插值或抽检,再对其作傅里叶变换,在频域上使其频谱整体搬移一段距离,最后 再将其变换回时域,从而达到改变语音信号频率的效果化肥00410062337.1)。第^种方法, 从发声系统角度出发设计,在系统域上,求出声道对应的极点,通过调节声道系统的极点的 幅值和相角等参数实现极点搬移,从而改变声道系统,来实现语音变声(CN102592590B)。
[0003] 由此可见,方法一和方法二都是将信号在频域或时域进行直接处理,使之频率改 变,从而达到变声的效果。但是运些方法都没从发音系统角度出发设计,使得变声后语音的 谐波关系保持的不佳,造成了语音的不自然。方法Ξ,针对方法一和二的缺点,从系统域的 角度去设计,确实是消除了变声后语音的不自然、有机器味的缺点,但是方法Ξ无法往特定 目标人语音变化,它只是通过盲目地调节变声参数,无方向地搬移极点,也即无方向地改变 声道系统,所W也就不能变化出特定目标人的语音,不能适应语音变声的实际应用需求。
[0004] 本发明在方法Ξ的基础上出发,同样是从声音的产生过程出发,在系统域上进行 处理,但是本方法,在极点的搬移上,引入特定目标人的语音,根据使用者语音和目标人语 音来共同确定变声比例参数,运样搬移后的极点对应的声道系统会具有"指向性",变化出 来的语音更像特定目标人发出来的语音,运一方法可W有效解决先前方法中的不足,不仅 实现了语音变声的自然变声,而且还可往特定目标人语音变化。
【发明内容】
[0005] 本发明的目的在于克服现有技术的缺点与不足,提供一种基于指向目标人变声比 例参数的语音变声方法及装置,克服现有变声方法存在的变声语音不自然、机器味重、W及 不能往特定目标人语音变化等缺点。
[0006] 本发明的目的通过如下技术方案实现:一种基于指向目标人变声比例参数的语音 变声方法,具体包括W下步骤:
[0007] S1、从发声原理出发建立声道模型,并求得发音系统的传递函数和极点;
[000引所述步骤S1具体为:由人声道发声原理可知,可使用如下郎介的声道模型:
[0009]
[0010] 其中G[n]是声带振动产生的一个激励,y[n]是G[n]通过声道后输出的信号,系数 ak即为声道模型的参数,可由杜宾算法等估计算法来提取,可知上式是一个郎介全极点的AR 模型,所W它的系统函数H(z),也即声道的系统函数为:
[0011]
[001^ 对于一帖短时语音(通常取5ms-20ms),求它的极点,也即令:
[0013]
[0014] 解该方程,可W得到一组复数根& =rAej'"%k=l,2,…,R即为系统函数H(z)的极 点。
[0015] S2、输入使用者和特定目标人的同一内容语音样本,求出使用者和特定目标人语 音之间的变声比例参数,包括极点变声比例参数和基音周期变声比例参数两种参数;
[0016] 所述步骤S2包括W下分步骤:
[0017] S21、取使用者语音样本,并分帖(每帖Xms,设共N帖),根据步骤一可求出每一帖的 极点,同时,利用经典的基音周期估计法(如基于求短时自相关函数(ACF)或者求短时平均 幅度差函数(AMD巧法)求得每一帖的基音周期,结果如下:
[001引记第i帖的第k阶极点为
i = l,2,'''N,k = l,2r''R,
[0019]记第i帖的基音周期为:Ti i = l,2,...,N。
[0020] S22、取特定目标人语音样本,并分帖(每帖Xms,设共Μ帖),与上一步同理,可求出 每一帖的极点和基音周期,结果如下:
[0021] 记第 i 帖的第 k 阶极点为
i = l,2,-'M,k = l,2r'-R,
[0022] 记第i帖的基音周期为:T'i i = l,2,…Μ。
[0023] S23、那么,求得极点变声比例参数如下:
[0024] 极点幅值比例参数:
[0028] S24、求得基音周期变声比例参数为:
[0029]
[0030] 运样,我们便获得了语音变声所需的变声比例参数Ak,Ak,P。
[0031] S3、输入使用者待变声语音,并求其语音系统极点,后进行极点搬移获得新的声道 系统,再修正激励基音周期后输入新的声道,获得变声语音。
[0032] 所述步骤S3包括如下分步骤:
[0033] S31、取得一帖使用者待变声语音(每帖Xms),求该帖语音的郎介极点和该帖语音的 基波频率(利用经典的基音周期估计法),结果如下:
[0034] 记求得的该帖的第k阶极点为:?二二1,2,…R,记求得的该帖的基波频率 为:ω 0;
[0035] S32、那么,可W按照下面的表达式去搬移极点,即该帖第k阶新的极点表达式为:
[0036]
[0037] 爲即为系统的新极点。运样,在移位的过程中就引进了特定目标人语音的特性,使 新的声道系统更具有"指向性",而不是盲目随意地变声;
[0038] S33、再利用移位后的新极点4恢复出新的4,%为该帖语音新的声道系统参数, 运样,新的声道模型得W建立,
[0039] 对于该帖语音,由公式3可得下式:
[0040]
[0041] 由上式求得新的%,从而可W得到新声道的系统函数
[0042]
[0043] S34、最后,修正待变声语音激励G[n]的基音周期,并输入新声道中,便可得到变声 后的语音信号:
[0044] 由
可W得到该帖语音的的激励的表达式为:
[0045]
[0046] 对G[n]进行P倍的插值得到沒树。现将()叫输入新的声道系统中,便可得到该帖变 声后的语音信号:
[0047]
[0048] 最后,再将该帖变声后的语音输出即可;
[0049] 循环S31、S32、S33、S34四个步骤,直至待变声语音处理完毕为止。
[0050] 通过上述Ξ大步骤,本发明通过引进使用者和特定目标人的同一段语音样本构造 出来的变声比例参数,有"指向伴'地搬移极点,同时修正激励基音周期,克服了现有方法的 缺点。
[0051] 本发明的另一目的通过如下技术方案实现:一种基于指向目标人变声比例参数的 语音变声装置,包括电源模块,输入模块,输出模块,控制模块与处理模块,其中:
[0052] 控制模块与处理模块、输入模块、输出模块和显示模块相连接,主要用于发出指令 对各个模块进行控制;
[0053] 输入模块与处理模块、控制模块相连接,其主要根据控制模块的指令向处理模块 输入特定目标人和使用者语音,同时也包括输入前将模拟信号转变为数字信号;
[0054] 输出模块与处理模块、控制模块相连接,其主要根据控制模块的指令输出变声后 的语音,同时也包括输出前将数字信号转变为模拟信号;
[0055] 处理模块与控制模块、输入模块和输出模块相连,根据控制模块的指令进行数字 语音信号处理,运用相关算法完成语音变声;
[0056] 显示模块,与控制模块相连,提供人机交互界面,根据控制模块的指令指引用户输 入语音样本和待变声语音。
[0057] 本发明与现有技术相比,具有如下优点和有益效果:
[0058] 1、本发明变声自然,无机器味。由于本发明是从系统域的角度去设计,消除了插值 或者抽值等变声方法带来的语音的不自然、有机器味的缺点,使变声后的语音具有很自然 的声音效果。
[0059] 2、本发明可往特定目标人的语音变化。本发明引入特定目标人的语音,根据使用 者语音和目标人语音来共同确定变声参数,新的声道系统和激励会具有"指向性",变化出 来的语音更像特定目标人发出来的语音。
[0060] 3、本发明装置可行性强、安装简单且设备成本低廉,可适用于多种语音变声应用 场景。
【附图说明】
[0061 ]图1为本发明所述的基于指向目标人变声比例参数的语音变声装置的总体结构示 意框图。
[0062] 图2为图1所述装置的硬件结构框图。
[0063] 图3为本发明装置工作流程图。
[0064] 图4为本发明所述的基于指向目标人变声比例参数的语音变声方法的总体流程 图。
[0065] 图5为图4所述方法中求解语音变声比例参数算法流程图。
[0066] 图6为图4所述方法中待变声语音变声处理算法流程图。
【具体实施方式】
[0067] 下面结合实施例及附图对本发明作进一步详细的描述,但本发明的