语音信号识别处理方法及装置的制造方法
【技术领域】
[0001]本申请涉及语音信号识别处理技术领域,尤其涉及一种语音信号识别处理方法及
目.0
【背景技术】
[0002]在互联网应用中,语音识别的输入形式越来越多地被使用在各个场景中,输入法、搜索、导航和各种助手类工具交互中。目前绝大多数语音识别还处在有语义的语言识别,即将输入的语音识别为某一种语言文字,机器再根据语言文字来转化为具体的需求指令来执行。
[0003]然而,有些用户不具有或者丧失了语言表达的能力,以婴儿为例进行说明:新手爸妈听到宝宝哭泣时总是手足无措,除了哭泣以外,稍大的婴儿也会有笑声、不知名的发音。
[0004]由此可见,目前的语音识别技术无法识别没有语义的语音信号的目标需求,因此,亟需一种针对上述情况的语音识别处理方法。
【发明内容】
[0005]本申请旨在至少在一定程度上解决相关技术中的技术问题之一。
[0006]为此,本申请的第一个目的在于提出一种语音信号识别处理方法,该方法实现了能够识别无语义语音信号的需求意图,提高了语音信号处理的全面性和适用性。
[0007]本申请的第二个目的在于提出一种语音信号识别处理装置。
[0008]为达上述目的,本申请第一方面实施例提出了一种语音信号识别处理方法,包括:接收待识别的语音信号;提取所述语音信号的特征信息;根据特征库中语音信号的需求类型与特征样本的对应关系,识别与所述特征信息对应的需求类型。
[0009]本申请实施例的语音信号识别处理方法,首先接收待识别的语音信号;然后提取所述语音信号的特征信息;最后根据特征库中语音信号的需求类型与特征样本的对应关系,识别与所述特征信息对应的需求类型。由此,实现了能够识别无语义语音信号的需求意图,提高了语音信号处理的全面性和适用性。
[0010]为达上述目的,本申请第二方面实施例提出了一种语音信号识别处理装置,包括:接收模块,用于接收待识别的语音信号;提取模块,用于提取所述语音信号的特征信息;识别模块,用于根据特征库中语音信号的需求类型与特征样本的对应关系,识别与所述特征信息对应的需求类型。
[0011]本申请实施例的语音信号识别处理装置,通过接收模块接收待识别的语音信号;通过提取模块提取所述语音信号的特征信息;通过识别模块根据特征库中语音信号的需求类型与特征样本的对应关系,识别与所述特征信息对应的需求类型。由此,实现了能够识别无语义语音信号的需求意图,提高了语音信号处理的全面性和适用性。
【附图说明】
[0012]本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
[0013]图1是本申请一个实施例的语音信号识别处理方法的流程图;
[0014]图2为建立用于语音识别的特征库的预处理示意图;
[0015]图3是本申请另一个实施例的语音信号识别处理方法的流程图;
[0016]图4是本申请另一个实施例的语音信号识别处理方法的流程图;
[0017]图5是本申请另一个实施例的语音信号识别处理方法的流程图;
[0018]图6为采用特征库进行语音识别的处理示意图;
[0019]图7是本申请一个实施例的语音信号识别处理装置的结构示意图;
[0020]图8是本申请另一个实施例的语音信号识别处理装置的结构示意图;
[0021]图9是本申请另一个实施例的语音信号识别处理装置的结构示意图;
[0022]图10是本申请另一个实施例的语音信号识别处理装置的结构示意图。
【具体实施方式】
[0023]下面详细描述本申请的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,旨在用于解释本申请,而不能理解为对本申请的限制。
[0024]下面参考附图描述本申请实施例的语音信号识别处理方法及装置。
[0025]图1是本申请一个实施例的语音信号识别处理方法的流程图。
[0026]如图1所示,该语音信号识别处理方法包括:
[0027]步骤101,接收待识别的语音信号。
[0028]接收其他终端设备采集并上传的待识别的语音信号。其中,其他终端设备可以通过设备上的麦克风或者录音设备采集待识别的语音信号,采集方式很多,根据实际应用需要进行选择,例如可以包括:自动采集和人工采集,以婴儿发出的语音信号为例具体说明如下:
[0029]场景一:人工采集方式,
[0030]当有婴儿发出的语音信号需要识别时,通过用户主动设置的方式,打开声音采集设备比如录音设备,采集一定长度的语音信号并上传。
[0031]场景二:自动采集,
[0032]当根据声音传感器监测到有婴儿发出的语音信号时,即自动打开声音采集设备,采集一定长度的语音信号并上传。
[0033]步骤102,提取所述语音信号的特征信息。
[0034]提取待识别的语音信号的特征信息,其中,可以根据实际应用需要选择提取语音信号不同的特征信息。举例说明:该语音信号的特征信息可以为频谱、基因周期、线谱对、线形预测倒谱和美尔频标倒谱系数等,可以根据应用需要采用不同的信号处理手段对语音信号进行处理,提取相应的特征信息。
[0035]步骤103,根据特征库中语音信号的需求类型与特征样本的对应关系,识别与所述特征信息对应的需求类型。
[0036]根据特征库中语音信号的需求类型与特征样本的对应关系,识别与获取的特征信息对应的需求类型,其中,特征库中语音信号的需求类型与特征样本的对应关系是预先对大量的数据进行采集、清洗、挖掘、学习生成的,图2为建立用于语音识别的特征库的预处理示意图,参见图2,具体实施过程可以包括如下步骤:
[0037]步骤一,采集携带需求类型的语音信号的基础数据;
[0038]步骤二,对所述基础数据进行数据清洗和数据挖掘,训练语音信号的特征样本与需求类型的对应关系;
[0039]步骤三,建立包含所述对应关系的特征库。
[0040]具体地,首先,采集携带需求类型的语音信号的基础数据,其中,采集方式和来源有很多,例如:可以在相关领域获取携带需求类型的语音信号,其中的语音信号已经由相关人员标记需求类型;较为灵活的是,实时从各种网络应用中获取相关用户发送的携带需求类型的语音信号。以婴儿哭声作为无语义的语音信号为例说明如下:
[0041]通常来说,婴儿的哭声对应的需求类型包括:1、生理性啼哭;2、需求性啼哭,包括:a)饥饿性啼哭;b) 口渴性啼哭;c)尿湿了啼哭;d)身体冷啼哭;e)身体热啼哭;f)困倦新啼哭;g)要妈咪抱啼哭;h)疼痛引起的啼哭;3、疾病性啼哭,包括:a)营养性疾病引起的惊哭山)肠痉挛性啼哭;c)阵发性剧哭;d)突发尖叫啼哭;e)啼哭伴抓耳挠腮;f)疝气嵌顿性啼哭等,其中,每种类型的哭声具有一定的特征,以生理性啼哭为例:啼哭的声音响亮而不刺耳,富有节奏感;常常哭而无泪,吃奶、睡眠、玩耍都很好,每次哭得时间也很短,其他不再赘述。
[0042]基础数据的采集方式主要通过两种方式:方式一:在专业场所(如医院、月子会所等)录入婴儿的哭声,并在医生、专家的指导下对哭声的需求类型进行标注;方式二:通过软件系统(网页、移动APP等应用)引导用户对婴儿哭声进行录音并上传,并对语音信号的需求类型进行标注。
[0043]然后