一种交互系统的语音识别方法和装置的制造方法

文档序号:8944180阅读:544来源:国知局
一种交互系统的语音识别方法和装置的制造方法
【技术领域】
[0001]本发明涉及语音识别技术领域,具体涉及一种交互系统的语音识别方法和装置。
【背景技术】
[0002]随着多媒体技术的发展,各种交互式系统都采用了语音交互的方式,以提高与用户的互动效率和提高趣味性。例如问答系统,先通过语音或图像显示的方式向用户抛出问题,然后用户语音回答。再例如一些展示系统,需要用户发出语音指令来选择展示哪些目录中的内容。在这些场景下都需要对用户的语音进行准确识别,才能在问答系统下判断用户给出的语音答案是否正确,以及在展示系统下判断用户到底选择了哪些目录,以便展示相应目录中的内容。
[0003]因此在交互系统中对用户的语音进行准确和快速的识别是亟需解决的问题。

【发明内容】

[0004]鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种交互系统的语音识别方法和装置。
[0005]依据本发明的一个方面,提供了一种交互系统的语音识别方法,其中,该方法包括:
[0006]依据互动状态及所述互动状态对应的一个或多个预期答案,预先在语音识别样本库中选择预期样本以组成预期语音识别样本库;
[0007]采集所述互动状态下的用户的语音信号;
[0008]将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。
[0009]可选地,一个所述预期答案对应至少一个预期样本。
[0010]可选地,该方法进一步包括:
[0011]如果所述语音信号与所述预期语音识别样本库中的一个预期样本的匹配度达到预设值,则确定所述用户给出了所述预期样本对应的该预期答案。
[0012]可选地,所述预期样本包含所述语音识别样本库中与所述一个或多个预期答案相对应的每一个样本,以及所述方法进一步包括:
[0013]如果所述语音信号与所述预期语音识别样本库中的任何一个预期样本的匹配度都达不到预设值,则确定所述用户未给出任何预期答案。
[0014]可选地,该方法进一步包括:
[0015]如果所述语音信号与所述预期语音识别样本库中的任一个预期样本的匹配度都达不到所述预设值,则将所述语音信号与所述语音识别样本库中除所述预期样本以外的与所述预期答案对应的样本进行匹配。
[0016]可选地,一个所述预期答案对应所述语音识别样本库中除所述预期样本以外的至少一个样本。
[0017]可选地,如果所述语音信号与所述语音识别样本库中除所述预期样本以外的一个与所述预期答案对应的样本的匹配度达到预设值,则确定所述用户给出了所述样本对应的该预期答案。
[0018]可选地,如果所述语音信号与所述语音识别样本库中除所述预期样本以外的任何一个与所述预期答案对应的样本的匹配度都达不到预设值,则确定所述用户未给出任何预期答案。
[0019]可选地,该方法进一步包括:
[0020]对于所述互动状态,根据所采集的该互动状态下的历史语音信号,相应扩充所述预期语音识别样本库中的预期样本,或者,相应扩充所述语音识别样本库中的样本。
[0021]可选地,所述语音识别样本库位于云端服务器,以及所述方法在组成所述预期语音识别样本库之后进一步包括:
[0022]将所述预期语音识别样本库下载到本地以进行语音识别。
[0023]可选地,在采集所述互动状态下的用户的语音信号之前,该方法进一步包括:
[0024]通过结合语音、图像和视频中任一种或多种的形式,展现互动状态。
[0025]依据本发明的另一个方面,提供了一种交互系统的语音识别装置,其中,该装置包括:
[0026]预期样本库生成单元,适于依据互动状态及所述互动状态对应的一个或多个预期答案,预先在语音识别样本库中选择预期样本以组成预期语音识别样本库;
[0027]存储单元,适于保存预期语音识别样本库;
[0028]采集单元,适于采集所述互动状态下的用户的语音信号;
[0029]匹配处理单元,适于将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。
[0030]可选地,一个所述预期答案对应至少一个预期样本。
[0031]可选地,所述匹配处理单元,进一步适于当所述语音信号与所述预期语音识别样本库中的一个预期样本的匹配度达到预设值时,确定所述用户给出了所述预期样本对应的该预期答案。
[0032]可选地,所述预期样本库生成单元选择的所述预期样本包含所述语音识别样本库中与所述一个或多个预期答案相对应的每一个样本;
[0033]所述匹配处理单元,进一步适于当所述语音信号与所述预期语音识别样本库中的任何一个预期样本的匹配度都达不到预设值时,确定所述用户未给出任何预期答案。
[0034]可选地,所述匹配处理单元,适于当所述语音信号与所述预期语音识别样本库中的任一个预期样本的匹配度都达不到所述预设值时,将所述语音信号与所述语音识别样本库中除所述预期样本以外的与所述预期答案对应的样本进行匹配。
[0035]可选地,一个所述预期答案对应所述语音识别样本库中除所述预期样本以外的至少一个样本。
[0036]可选地,所述匹配处理单元,适于当所述语音信号与所述语音识别样本库中除所述预期样本以外的一个与所述预期答案对应的样本的匹配度达到预设值时,确定所述用户给出了所述样本对应的该预期答案。
[0037]可选地,所述匹配处理单元,适于当所述语音信号与所述语音识别样本库中除所述预期样本以外的任何一个与所述预期答案对应的样本的匹配度都达不到预设值时,确定所述用户未给出任何预期答案。
[0038]可选地,该装置进一步包括:
[0039]扩充单元,适于对于所述互动状态,根据所采集的该互动状态下的历史语音信号,相应扩充所述预期语音识别样本库中的预期样本,或者,相应扩充所述语音识别样本库中的样本。
[0040]可选地,所述语音识别样本库位于云端服务器,该装置进一步包括:
[0041]下载单元,适于将所述预期语音识别样本库下载到本地以进行语音识别。
[0042]可选地,该装置进一步包括:
[0043]展现单元,适于通过结合语音、图像和视频中任一种或多种的形式,展现互动状
??τ O
[0044]根据本发明的这种依据互动状态及所述互动状态对应的一个或多个预期答案,预先在语音识别样本库中选择预期样本以组成预期语音识别样本库,采集所述互动状态下的用户的语音信号,将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配的技术方案,由于将预期答案对应的预期样本预先保存到预期语音识别样本库,将用户的语音信号直接与预期语音识别样本库中的预期样本进行匹配,因此使得匹配的范围缩小到一个可预期的小范围,不仅提高了交互系统的语音识别的速度,而且提高了语音识别的准确性。
【附图说明】
[0045]通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
[0046]图1示出了根据本发明一个实施例的一种交互系统的语音识别方法的流程图;
[0047]图2示出了根据本发明一个实施例的一种交互系统的语音识别装置的结构图;以及
[0048]图3示出了根据本发明又一个实施例的一种交互系统的语音识别装置的结构图。
【具体实施方式】
[0049]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0050]图1示出了根据本发明一个实施例的一种交互系统的语音识别方法的流程图。如图1所示,该方法包括:
[0051]步骤S110,依据互动状态及所述互动状态对应的一个或多个预期答案,预先在语音识别样本库中选择预期样本以组成预期语音识别样本库。
[0052]在发明的本实施例中,一个互动状态是指某个特定的互动场景,例如问答系统中的某个特定的问答题场景,或者展示系统中的展示某个特定内容的场景。
[0053]以问答系统中的某个特定问答题场景为例,系统提问:“芹菜叶是否可以食用? ”。对应的预期答案为“是”。根据该预期答案,用户回答“是”、“可以”和“能”都是在正确的,因此从语音识别样本库中选择“是”、“可以”和“能”这三个预期样本组成该问答场景的预期语音识别样本库。
[0054]步骤S120,采集所述互动状态下的用户的语音信号。
[0055]例如,当问答系统输出问题后采集用户针对该问题的语音信号。一般采用麦克风进行语音信号的采集。
[0056]步骤S130,将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1