一种交互系统的语音识别方法和装置的制造方法

文档序号：8944180阅读：544来源：国知局

一种交互系统的语音识别方法和装置的制造方法
【技术领域】
[0001]本发明涉及语音识别技术领域，具体涉及一种交互系统的语音识别方法和装置。
【背景技术】
[0002]随着多媒体技术的发展，各种交互式系统都采用了语音交互的方式，以提高与用户的互动效率和提高趣味性。例如问答系统，先通过语音或图像显示的方式向用户抛出问题，然后用户语音回答。再例如一些展示系统，需要用户发出语音指令来选择展示哪些目录中的内容。在这些场景下都需要对用户的语音进行准确识别，才能在问答系统下判断用户给出的语音答案是否正确，以及在展示系统下判断用户到底选择了哪些目录，以便展示相应目录中的内容。
[0003]因此在交互系统中对用户的语音进行准确和快速的识别是亟需解决的问题。

【发明内容】

[0004]鉴于上述问题，提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种交互系统的语音识别方法和装置。
[0005]依据本发明的一个方面，提供了一种交互系统的语音识别方法，其中，该方法包括:
[0006]依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库；
[0007]采集所述互动状态下的用户的语音信号；
[0008]将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。
[0009]可选地，一个所述预期答案对应至少一个预期样本。
[0010]可选地，该方法进一步包括:
[0011]如果所述语音信号与所述预期语音识别样本库中的一个预期样本的匹配度达到预设值，则确定所述用户给出了所述预期样本对应的该预期答案。
[0012]可选地，所述预期样本包含所述语音识别样本库中与所述一个或多个预期答案相对应的每一个样本，以及所述方法进一步包括:
[0013]如果所述语音信号与所述预期语音识别样本库中的任何一个预期样本的匹配度都达不到预设值，则确定所述用户未给出任何预期答案。
[0014]可选地，该方法进一步包括:
[0015]如果所述语音信号与所述预期语音识别样本库中的任一个预期样本的匹配度都达不到所述预设值，则将所述语音信号与所述语音识别样本库中除所述预期样本以外的与所述预期答案对应的样本进行匹配。
[0016]可选地，一个所述预期答案对应所述语音识别样本库中除所述预期样本以外的至少一个样本。
[0017]可选地，如果所述语音信号与所述语音识别样本库中除所述预期样本以外的一个与所述预期答案对应的样本的匹配度达到预设值，则确定所述用户给出了所述样本对应的该预期答案。
[0018]可选地，如果所述语音信号与所述语音识别样本库中除所述预期样本以外的任何一个与所述预期答案对应的样本的匹配度都达不到预设值，则确定所述用户未给出任何预期答案。
[0019]可选地，该方法进一步包括:
[0020]对于所述互动状态，根据所采集的该互动状态下的历史语音信号，相应扩充所述预期语音识别样本库中的预期样本，或者，相应扩充所述语音识别样本库中的样本。
[0021]可选地，所述语音识别样本库位于云端服务器，以及所述方法在组成所述预期语音识别样本库之后进一步包括:
[0022]将所述预期语音识别样本库下载到本地以进行语音识别。
[0023]可选地，在采集所述互动状态下的用户的语音信号之前，该方法进一步包括:
[0024]通过结合语音、图像和视频中任一种或多种的形式，展现互动状态。
[0025]依据本发明的另一个方面，提供了一种交互系统的语音识别装置，其中，该装置包括:
[0026]预期样本库生成单元，适于依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库；
[0027]存储单元，适于保存预期语音识别样本库；
[0028]采集单元，适于采集所述互动状态下的用户的语音信号；
[0029]匹配处理单元，适于将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。
[0030]可选地，一个所述预期答案对应至少一个预期样本。
[0031]可选地，所述匹配处理单元，进一步适于当所述语音信号与所述预期语音识别样本库中的一个预期样本的匹配度达到预设值时，确定所述用户给出了所述预期样本对应的该预期答案。
[0032]可选地，所述预期样本库生成单元选择的所述预期样本包含所述语音识别样本库中与所述一个或多个预期答案相对应的每一个样本；
[0033]所述匹配处理单元，进一步适于当所述语音信号与所述预期语音识别样本库中的任何一个预期样本的匹配度都达不到预设值时，确定所述用户未给出任何预期答案。
[0034]可选地，所述匹配处理单元，适于当所述语音信号与所述预期语音识别样本库中的任一个预期样本的匹配度都达不到所述预设值时，将所述语音信号与所述语音识别样本库中除所述预期样本以外的与所述预期答案对应的样本进行匹配。
[0035]可选地，一个所述预期答案对应所述语音识别样本库中除所述预期样本以外的至少一个样本。
[0036]可选地，所述匹配处理单元，适于当所述语音信号与所述语音识别样本库中除所述预期样本以外的一个与所述预期答案对应的样本的匹配度达到预设值时，确定所述用户给出了所述样本对应的该预期答案。
[0037]可选地，所述匹配处理单元，适于当所述语音信号与所述语音识别样本库中除所述预期样本以外的任何一个与所述预期答案对应的样本的匹配度都达不到预设值时，确定所述用户未给出任何预期答案。
[0038]可选地，该装置进一步包括:
[0039]扩充单元，适于对于所述互动状态，根据所采集的该互动状态下的历史语音信号，相应扩充所述预期语音识别样本库中的预期样本，或者，相应扩充所述语音识别样本库中的样本。
[0040]可选地，所述语音识别样本库位于云端服务器，该装置进一步包括:
[0041]下载单元，适于将所述预期语音识别样本库下载到本地以进行语音识别。
[0042]可选地，该装置进一步包括:
[0043]展现单元，适于通过结合语音、图像和视频中任一种或多种的形式，展现互动状
??τ O
[0044]根据本发明的这种依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库，采集所述互动状态下的用户的语音信号，将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配的技术方案，由于将预期答案对应的预期样本预先保存到预期语音识别样本库，将用户的语音信号直接与预期语音识别样本库中的预期样本进行匹配，因此使得匹配的范围缩小到一个可预期的小范围，不仅提高了交互系统的语音识别的速度，而且提高了语音识别的准确性。
【附图说明】
[0045]通过阅读下文优选实施方式的详细描述，各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的，而并不认为是对本发明的限制。而且在整个附图中，用相同的参考符号表示相同的部件。在附图中:
[0046]图1示出了根据本发明一个实施例的一种交互系统的语音识别方法的流程图；
[0047]图2示出了根据本发明一个实施例的一种交互系统的语音识别装置的结构图；以及
[0048]图3示出了根据本发明又一个实施例的一种交互系统的语音识别装置的结构图。
【具体实施方式】
[0049]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例，然而应当理解，可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反，提供这些实施例是为了能够更透彻地理解本公开，并且能够将本公开的范围完整的传达给本领域的技术人员。
[0050]图1示出了根据本发明一个实施例的一种交互系统的语音识别方法的流程图。如图1所示，该方法包括:
[0051]步骤S110，依据互动状态及所述互动状态对应的一个或多个预期答案，预先在语音识别样本库中选择预期样本以组成预期语音识别样本库。
[0052]在发明的本实施例中，一个互动状态是指某个特定的互动场景，例如问答系统中的某个特定的问答题场景，或者展示系统中的展示某个特定内容的场景。
[0053]以问答系统中的某个特定问答题场景为例，系统提问:“芹菜叶是否可以食用？ ”。对应的预期答案为“是”。根据该预期答案，用户回答“是”、“可以”和“能”都是在正确的，因此从语音识别样本库中选择“是”、“可以”和“能”这三个预期样本组成该问答场景的预期语音识别样本库。
[0054]步骤S120，采集所述互动状态下的用户的语音信号。
[0055]例如，当问答系统输出问题后采集用户针对该问题的语音信号。一般采用麦克风进行语音信号的采集。
[0056]步骤S130，将所述语音信号与所述预期语音识别样本库中的预期样本进行匹配。

完整全部详细技术资料下载

当前第1页1 2 3 4

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：齐路;韩笑;苑一时;
技术所有人：北京奇虎科技有限公司;奇智软件（北京）有限公司;
我是此专利的发明人

上一篇：智能终端的语音控制方法、装置及电视机系统的利记博彩app
上一篇：一种语音处理方法及装置的制造方法

相关技术

一种语音处理方法及装置的制造...
非特定人外语语音现场控制汽车...
非特定人外语语音现场控制驾驶...
非特定人外语语音现场自动导航...
控制方法及电子设备的制造方法
一种语音控制的遥控装置及其实...
一种交互系统的语音识别方法和...
语音交互方法及装置的制造方法
基于垃圾模型的语音识别处理方...
语音识别语法树的构图方法及装...

网友询问留言已有0条留言

还没有人留言评论。精彩留言会获得点赞！

1

精彩留言，会给你点赞！

ibm语音识别输入系统相关技术
一种语音通信明密识别方法及系统的利记博彩app
基于语音识别的导航系统和工作方法、导航汽车的利记博彩app
基于语音识别的自动外呼方法及系统的利记博彩app
语音识别系统及其语音识别方法
重入网识别方法和系统的利记博彩app
语音识别方法、设备及系统的利记博彩app
语音识别的方法及系统的利记博彩app
一种基于智能化语音识别技术的助听器系统的利记博彩app
一种语音识别的方法及系统的利记博彩app
一种语音识别方法及系统的利记博彩app
语音识别系统相关技术
基于车载语音识别的回音消除系统的制造方法与工艺
基于人工智能的语音识别方法、装置和系统与流程
基于匹配模型二次识别的语音识别方法及系统与流程
开发人员语音动作系统的制造方法与工艺
一种信息搜索方法及其设备与流程
一种基于面部与语音识别的游戏控制系统及方法与流程
一种用于实时语音识别的智能手环及系统的制造方法与工艺
一种基于语音识别的银行卡消费智能防护系统的制造方法与工艺
一种基于声纹识别的智能锁及其语音识别方法和系统与流程
用于语音识别的模数转换器的设计方法、装置及系统与流程
智能语音识别系统相关技术
一种语音识别系统的制造方法与工艺
语音识别系统以及方法与制造工艺
一种智能卧室语音识别柜的制造方法与工艺
一种智能识别式充电桩系统的利记博彩app
可穿戴语音识别内窥镜控制系统及可穿戴设备的制造方法
人体智能识别系统的利记博彩app
一种具有智能识别的云智能语音设备的制造方法
头戴智能设备的动作识别系统及头戴智能设备的制造方法
一种基于语音识别的智能家居系统的利记博彩app
一种语音及身份识别的智能巡检管理系统的利记博彩app
ibm语音识别系统相关技术
基于语音识别的导航系统和工作方法、导航汽车的利记博彩app
语音识别系统及其语音识别方法
语音识别方法、设备及系统的利记博彩app
语音识别的方法及系统的利记博彩app
一种基于智能化语音识别技术的助听器系统的利记博彩app
预测自动语音识别系统中的短语识别质量的利记博彩app
一种语音识别的方法及系统的利记博彩app
一种语音识别方法及系统的利记博彩app
语音识别方法及其系统的利记博彩app
一种基于语音识别技术的短信生成系统的利记博彩app
法院智能语音识别系统相关技术
一种具有智能识别的云智能语音设备的制造方法
一种基于语音识别的智能家居系统的利记博彩app
一种语音及身份识别的智能巡检管理系统的利记博彩app
一种智能识别蓄电池组的通信电源系统的利记博彩app
一种基于语音识别的智能照明控制系统的利记博彩app
一种基于语音识别的摄像机自动定位系统的利记博彩app
头戴智能设备的语音识别系统及头戴智能设备的制造方法
本地处理与无线网络结合的智能语音识别控制系统及方法
一种具有语音识别功能的智能插座的利记博彩app
基于头戴设备的智能语音识别系统的利记博彩app
庭审智能语音识别系统相关技术
头戴智能设备的语音识别系统及头戴智能设备的制造方法
本地处理与无线网络结合的智能语音识别控制系统及方法
一种具有语音识别功能的智能插座的利记博彩app
基于头戴设备的智能语音识别系统的利记博彩app
一种智能语音识别系统及方法
预测自动语音识别系统中的短语识别质量的利记博彩app
一种语音识别装置及其方法、一种智能电视及其控制方法
一种语音识别方法及系统的利记博彩app
一种基于语音识别的智能家居控制方法以及系统的利记博彩app
一种智能语音识别温度控制器的制造方法
庭审语音识别系统相关技术
语音识别结果评价方法及系统的利记博彩app
简单语音识别系统的利记博彩app
用于使用上下文信息的语音识别修复的方法和系统的利记博彩app
用于识别语音的系统和方法
用于管理多语音系统环境中的语音识别的方法和系统的利记博彩app
用于语音识别的n元文法模型构造方法及语音识别系统的利记博彩app
一种语音识别系统及方法
语音识别后处理方法及系统的利记博彩app
分布式语音识别系统的利记博彩app
一种语音识别的后处理方法及装置和语音识别系统的利记博彩app
win7系统没有语音识别相关技术
一种基于语音识别的图标迁移实现方法及实现系统的利记博彩app
一种具有语音识别功能的网络教学方法及系统的利记博彩app
具有同时文本编辑的语音识别方法和系统的利记博彩app
语音识别系统和语音识别方法
一种基于语音识别的心理检测方法及系统的利记博彩app
具有多个同时语音识别器的系统的利记博彩app
一种交互系统的语音识别方法和装置的制造方法
一种交互系统的语音识别方法和装置的制造方法
一种高清语音识别系统的利记博彩app
第三方应用的语音识别实现方法和系统的利记博彩app