专利名称:汉语语音输入系统及方法
技术领域:
本发明涉及语音识别技术,特别涉及一种汉语语音输入系统及方法。
背景技术:
随着电子技术的发展,目前个人手持式设备不断向功能丰富与体积小巧的方向发 展,小巧的机身中往往集成了众多的办公、娱乐及互联网应用。丰富的功能往往需要更加丰 富、便捷的交互方式,而受体积、便携式电源等物理条件的限制,设备上无法预留足够的资 源为交互所需的物理设备所用,这样就对人机交互的方式提出了更高的要求——如何在有 限的硬件设备资源的前提下,尽可能为用户提供方便、快捷以及功能丰富的交互方式,就成 了决定一个手持式产品生命力的重要特征。目前手持式设备上的输入方式,多是通过键盘(Keypad)或触摸屏(Touch screen)。为了给用户提供交互方式,往往需要通过为某种操作预留特定的输入键的方式来 进行用户与设备之间的交互。对于一些复杂的操作,在设备上无法预留过多的输入键,只 能通过复用某些操作键以及组合一些操作键的方式来实现,或者通过复杂的菜单分级的策 略,用户往往要进行多次菜单操作才能实现所需的功能。这些输入方式,一来容易引起误操 作,二则实现的功能依然有限,无法满足用户的实际需求。另外,对于某些特殊设备,如目前市场上刚刚出现的电子墨水屏幕,尽管其对用户 的眼睛提供了最佳防护,但是受目前技术水平的限制,刷新率较低,对用户的输入反馈很慢 (延迟约1秒)。例如当用户需要通过键盘输入一个“黄”字时,需要进行5次操作“huang”, 累计延时将在6秒以上,这样的速度显然是无法满足用户实际需求的。与传统的通过键盘以及触摸屏输入方式不同,语音输入作为一种最自然的交互方 式,无需占用额外的硬件及尺寸方面的资源,只通过一个简单的麦克风,即可实现动态扩展 的虚拟界面,完成多达上万种输入操作。这样,对于一款手持式设备上的所有操作,都可以 通过语音输入来实现,无需对某种功能指定特殊的键,因而在不增加设备外观尺寸的前提 下,能最大程度的丰富手持式设备的交互乐趣。而且这种交互直接在后台进行,避免了由于 图形界面的延迟对用户体验方面造成的不利影响。语音识别技术就是让机器通过识别和理解过程把语音信号转变为相应的文本或 命令的技术。语音识别是一门交叉学科,所涉及的领域包括信号处理、模式识别、概率论和 信息论、发声机理和听觉机理、人工智能等等。近二十年来,语音识别技术取得显著进步,开 始从实验室走向市场,已经进入工业、家电、通信、汽车电子、医疗、家庭服务、消费电子产品 等诸多领域。语音输入系统,包括语音采集及输入电路、模式库、声学模式匹配规则、语音识别 控制器,语音识别控制器根据声学模式匹配规则(如某种距离测度、专家知识(如构词规 则、语法规则、语义规则等),计算输入语音信号特征与模式库中的模式之间的相似度,判断 出输入语音的语意信息。常规的汉语语音输入系统,是使用完全的语音识别,是以带调拼音为单位,直接根据汉字的发音识别出具体汉字或汉语语句,即将输入的语音直接同模式库中的模式进行匹 配,匹配通过后直接将模式库中的该模式对应的汉字及汉语语句作为输入语音的汉语语意 信息输出,由于以带调拼音为单位可供利用的自然语言信息较少,汉语识别准确率比较低, 只能实现一些特定口令的识别。
发明内容
本发明要解决的技术问题是提供一种汉语语音输入系统及方法,汉语文字识别的 准确率高。为解决上述技术问题,本发明的汉语语音输入系统,包括语音采集及输入电路、声 母韵母识别模块、拼音识别模块、语音识别控制器、显示器;所述语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、 显示器分别相连;所述声母韵母识别模块用于声母韵母识别,所述语音识别控制器根据语音采集及 输入电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;所述拼音识别模块用于汉字拼音识别,所述语音识别控制器根据拼音识别模块, 以及所述得到的一个声母韵母序列,输出M个候选汉字序列到显示器,M为正整数,然后根 据用户输入的选择信息输出其中的一个候选汉字序列。所述声母韵母识别模块,可以包括汉语拼音声母韵母模式库、声学模式匹配单元, 所述汉语拼音声母韵母模式库用于设置各声母韵母的模式,所述声学模式匹配单元用于将 语音信号同各声母韵母的模式进行声学匹配配置信度打分,所述语音识别控制器根据所述 声学模式匹配单元对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式 库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各 声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及 韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,所述语音识别控制器根据拼 音识别模块,以及所述声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一 个声母韵母序列,输出M个候选汉字序列到显示器。所述声母韵母识别模块,可以包括汉语拼音声母韵母模式库、声学模式匹配单元、 汉字拼音声母韵母组合单元,所述汉语拼音声母韵母模式库用于设置各声母韵母的模式, 所述声学模式匹配单元用于将语音信号同各声母韵母的模式进行声学匹配配置信度打分, 所述汉字拼音声母韵母组合单元用于对声母韵母序列中的声母韵母进行声母韵母组合打 分,所述语音识别控制器根据所述声学模式匹配单元对所述语音采集及输入电路输入的语 音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语 音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度 得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的N个声母韵母 序列,N为正整数;然后所述语音识别控制器根据所述汉字拼音声母韵母组合单元对所述N 个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵 母声学匹配置信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得 分,得到声学声韵得分最高的一个声母韵母序列,然后所述语音识别控制器根据拼音识别 模块,以及所述声学声韵得分最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
所述声母韵母识别模块,还可以包括韵母识别置信度修正单元,所述韵母识别置 信度修正单元用于将声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除,所述 语音识别控制器根据所述韵母识别置信度修正单元,将所述声学声韵得分最高的一个声母 韵母序列中的声学匹配置信度得分低于设定值的韵母去除,得到经过韵母识别置信度修正 的一个声母韵母序列,然后所述语音识别控制器根据所述拼音识别模块及所述经过韵母识 别置信度修正的一个声母韵母序列,输出M个候选汉字序列到显示器。所述拼音识别模块,可以包括汉语字词库、汉字拼音单元,所述汉语字词库用于设 置各汉语字词,所述汉字拼音单元用于将声母韵母序列识别为汉语字词库中的汉语字词序 列,所述语音识别控制器根据所述汉字拼音单元及汉语字词库将所述得到的一个声母韵母 序列识别为M个候选汉字序列输出到显示器。所述拼音识别模块,可以包括汉语字词库、汉字拼音单元、汉语文法单元,所述汉 语字词库用于设置各汉语字词,所述汉字拼音单元用于将声母韵母序列识别为汉语字词库 中的汉语字词序列,所述汉语文法单元用于对汉字序列进行汉语文法选择,所述语音识别 控制器根据所述汉字拼音单元及汉语字词库将所述得到的一个声母韵母序列识别为L个 候选汉字序列,然后所述语音识别控制器根据所述汉语文法单元对所述L个汉字序列进行 汉语文法选择,输出M个候选汉字序列到显示器,L为大于等于M的正整数。为解决上述技术问题,本发明的汉语语音输入方法,包括以下步骤一 .利用语音采集及输入电路采集并输入语音信号到语音识别控制器;二 .语音识别控制器根据语音信号及声母韵母识别规则得到一个声母韵母序列;三.语音识别控制器根据所述得到的一个声母韵母序列及汉字拼音识别规则,输 出M个候选汉子序列到显示器,M为正整数;四.用户输入选择信息;五.语音识别控制器根据用户输入选择信息输出一个候选汉字序列。所述声母韵母识别规则,可以包括汉语拼音声母韵母模式库、声学模式匹配规则, 所述语音识别控制器根据所述声学模式匹配规则对所述语音采集及输入电路输入的语音 信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音 信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得 分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序 列,所述语音识别控制器根据拼音识别模块设置的汉字拼音识别规则,以及所述声母声学 匹配置信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,输出M个候选 汉字序列到显示器。所述声母韵母识别规则,可以包括汉语拼音声母韵母模式库、声学模式匹配规则、 汉字拼音声母韵母组合规则,所述语音识别控制器根据所述声学模式匹配规则对所述语音 采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的 模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和 各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分 排序最高的N个声母韵母序列,N为正整数;然后所述语音识别控制器根据所述汉字拼音声 母韵母组合规则对所述N个声母韵母序列中的各声母韵母进行声母韵母组合打分,并根据 声母声学匹配置信度及韵母声学匹配置信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得分,得到声学声韵得分最高的一个声母韵母序列,然后所述语音 识别控制器根据拼音识别模块设置的汉字拼音识别规则,以及所述声学声韵得分最高的一 个声母韵母序列,输出M个候选汉字序列到显示器。所述声母韵母识别规则,还可以包括韵母识别置信度修正规则,所述语音识别控 制器根据所述韵母识别置信度修正规则,将所述声学声韵得分最高的一个声母韵母序列中 的声学匹配置信度得分低于设定值的韵母去除,得到经过韵母识别置信度修正的一个声母 韵母序列,然后所述语音识别控制器根据所述拼音识别模块中的汉字拼音规则将所述经过 韵母识别置信度修正的一个声母韵母序列,输出M个候选汉字序列到显示器。本发明的汉语语音输入系统及方法,不是使用完全的语音识别直接进行汉字识 别,而是设计了声韵识别,语音声学识别进行到声、韵母这个层次,由于声母、韵母是较带调 拼音更小的汉语声学元素,包含有更多的可供利用的自然语言信息,可用于对识别结果进 行修正,所以能得到更高的汉语语音识别率。
下面结合附图和具体实施方式
对本发明作进一步的详细说明。图1是本发明的汉语语音输入系统一实施方式示意图;图2是本发明的汉语语音输入方法一实施方式示意图。
具体实施例方式本发明的汉语语音输入系统一实施方式如图1所示,包括语音采集及输入电路、 声母韵母识别模块、拼音识别模块、语音识别控制器、显示器;所述语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、 显示器分别相连。所述声母韵母识别模块设置有声母韵母识别规则,用于声母韵母识别,所述语音 识别控制器根据语音采集及输入电路输入的语音信号以及声母韵母识别模块设置的声母 韵母识别规则,得到一个声母韵母序列;所述声母韵母识别模块,包括汉语拼音声母韵母模式库、声学模式匹配单元、汉字 拼音声母韵母组合单元、韵母识别置信度修正单元,所述汉语拼音声母韵母模式库用于设 置各声母(b, p, m, f, d, t, η, 1, g, h, j, q, χ, zh, ch, sh, r, ζ, c, s, y, w)韵母(a, ο, e, i, u, ν, ai, ei, ao, ou, an, en, ang, eng, ong, ia, ie, iao, iou, ian, i η, iang, ing, iong, ua, uo, uai, uei, uan, uen, uang, ueng, ve, van, vn) Wl^^ fW 号同所述汉语拼音声母韵母模式进行声学匹配的声学模式匹配规则,用于将语音信号同各 声母韵母的模式进行声学匹配配置信度打分,所述汉字拼音声母韵母组合单元设置汉字拼 音声母韵母组合规则,用于对声母韵母序列中的声母韵母进行声母韵母组合打分,所述韵 母识别置信度修正单元设置根据韵母的声学匹配置信度对汉字拼音的声母韵母组合进行 修正的韵母识别置信度修正规则,用于将声母韵母序列中的声学匹配置信度得分低于设定 值的韵母去除;所述语音识别控制器根据所述声学模式匹配单元声学模式匹配规则对所述 语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵 母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合 得分排序最高的N个声母韵母序列,N为正整数;然后所述语音识别控制器根据所述汉字拼 音声母韵母组合单元汉字拼音声母韵母组合规则对所述N个声母韵母序列中的各声母韵 母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置信度综合得分、 声母韵母组合得分得到所述N个声母韵母序列的声学声韵得分,得到声学声韵得分最高的 一个声母韵母序列;然后语音识别控制器根据所述韵母识别置信度修正单元韵母识别置信 度修正规则,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于 设定值的韵母去除,得到经过韵母识别置信度修正的一个声母韵母序列。所述拼音识别模块设置有汉字拼音识别规则,用于汉字拼音识别,所述语音识别 控制器根据拼音识别模块设置的汉字拼音识别规则,以及所述得到的一个声母韵母序列, 输出M个候选汉字序列到显示器,M为正整数,然后根据用户输入的选择信息输出其中的一 个候选汉字序列;所述拼音识别模块,包括汉语字词库、汉字拼音单元、汉语文法单元,所述汉语字 词库用于设置各汉语字词,所述汉字拼音单元设置建立声母韵母序列同汉语字词库中的 字词的对应关系的汉字拼音规则,用于将声母韵母序列识别为汉语字词库中的汉语字词序 列,所述汉语文法单元设置汉语文法规则,用于对汉字序列进行汉语文法选择,,所述语音 识别控制器根据汉字拼音单元汉字拼音规则、汉语字词库及所述得到的一个声母韵母序列 识别为L个候选汉字序列,然后所述语音识别控制器根据汉语文法单元汉语文法规则对所 述L个汉字序列进行汉语文法选择,输出M个候选汉字序列到显示器,L为大于等于M的正 整数。本发明的汉语语音输入方法一实施方式如图2所示,包括以下步骤一 .利用语音采集及输入电路采集并输入语音信号到语音识别控制器;二 .语音识别控制器根据语音信号及声母韵母识别规则得到一个声母韵母序列;三.语音识别控制器根据所述一个声母韵母序列及汉字拼音识别规则,输出M个 候选汉子序列到显示器,M为正整数;四.用户输入选择信息;五.语音识别控制器根据用户输入选择信息输出一个候选汉字序列。一实施例如下。用户对麦克风说“我爱北京天安门”,语音采集及输入电路输出语音信号到语音识 别控制器,语音识别控制器根据声学模式匹配规则对所述语音采集及输入电路输入的语音 信号和汉语拼音声母韵母模式库中的汉语拼音声母韵母模式进行匹配,分别给出语音信号 对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得 到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高的三个声母韵母序列,依 声母声学匹配置信度及韵母声学匹配置信度综合得分排序依次是1. “u e ai b ei j ing t ian an m eng,,,各声母韵母对应的声学匹配置信度得分为9,7,9,9,7,8,7,7,9,8,8,7,声母声学匹配置信度及韵母声学匹配置信度综合得分为95分;2. “w e ai b ei j ing t ian an m eng”,
各声母韵母对应的声学匹配置信度得分为9,7,9,9,7,8,7,7,9,8,8,7,声母声学匹配置信度及韵母声学匹配置信度综合得分为95分;3. “w e ai b ei j ing t ian ang m eng,,;各声母韵母对应的声学匹配置信度得分为9,7,9,9,7,8,7,7,9,7,8,7,声母声学匹配置信度及韵母声学匹配置信度综合得分为94分;然后所述语音识别控制器根据所述汉字拼音声母韵母组合规则对所述三个声母 韵母序列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学 匹配置信度综合得分、声母韵母组合得分得到所述三个声母韵母序列的声学声韵得分,取 出声学声韵得分最高的一个声母韵母序列,所述三个声母韵母序列依声学声韵得分排序依 次是
1.“W e ai b ei j ing t ian an m eng,,,
各声母韵母对应的声学匹配置信度得分为
9,7,9,9,7,8,7,7,9,8,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为95分;
声母韵母组合得分为
10,10,9,10,10,10,10,10,9,9,10,10,
声母韵母序列的声学声韵得分为212分;
2.“w e ai b ei j ing t ian ang m eng,,;
各声母韵母对应的声学匹配置信度得分为
9,7,9,9,7,8,7,7,9,7,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为94分;
声母韵母组合得分为
10,10,9,10,10,10,10,10,9,9,10,10,
声母韵母序列的声学声韵得分为211分;
3."u e ai b ei j ing t ian an m eng,,,
各声母韵母对应的声学匹配置信度得分为
9,7,9,9,7,8,7,7,9,8,8,7,
声母声学匹配置信度及韵母声学匹配置信度综合得分为95分;
声母韵母组合得分为
0,9,9,10,10,10,10,10,9,9,10,10,
声母韵母序列的声学声韵得分为201分;
然后所述语音识别控制器根据所述韵母识别置信度修正规则,将所述声学声韵得
分最高的一个声母韵母序列中的声学匹配置信度得分低于设定值的韵母去除;
1. “w e ai b ei j ing t ian an m eng”,
各声母韵母对应的声学匹配置信度得分为
9,7,9,9,7,8,7,7,9,8,8,7,
将声学匹配置信度得分低于8的韵母去除,得到一个经过韵母识别置信度修正的声母韵母序列“W ai b j t ian an m”,然后,所述语音识别控制器根据所述拼音识别模块中的汉字拼音规则将所述经过 韵母识别置信度修正的声母韵母序列“《 ai b j t ianan m”识别为多个汉字序列“我爱 北京天安门”、“我矮背景天安门”、“沃哀倍经田按们”、“外北京天安门”、……;然后所述语 音识别控制器根据所述汉语文法规则对所述多个汉字序列进行汉语文法选择,输出多个候 选汉字序列到显示器1. “我爱北京天安门”,2. “外北京天安门”,3. “我矮背景天安门”; 根据用户输入的选择信息选择1,所述语音识别控制器根据用户输入的选择信息输出汉字 序列“我爱北京天安门”。本发明的汉语语音输入系统及方法,不是使用完全的语音识别直接进行汉字识 别,而是设计了声韵识别,语音声学识别进行到声、韵母这个层次,由于声母、韵母是较带调 拼音更小的汉语声学元素,包含有更多的可供利用的自然语言信息,可用于对识别结果进 行修正,所以能得到更高的汉语语音识别率。可以利用汉字拼音的声母韵母组合规则对经 声母、韵母识别得到的声母韵母序列进行修正,得到最符合声学和汉字拼音的声母韵母组 合则的一个声母韵母序列,并可进一步根据韵母识别置信度修正规则对声母韵母序列进行 修正,将声母韵母序列中声学匹配置信度低的韵母去除得到韵母识别置信度修正的一个声 母韵母序列,利用该修正后的一个声母韵母序列进行汉语语音识别能更加准确。本发明的汉语语音输入系统及方法,可以应用于手持式设备上,实现了在外形尺 寸受限的手持式设备上的语音输入法,完善并丰富在手持式设备上的交互方式,改变目前 在手持式设备上传统的交互方式。
权利要求
1.一种汉语语音输入系统,其特征在于,包括语音采集及输入电路、声母韵母识别模 块、拼音识别模块、语音识别控制器、显示器;所述语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、显示 器分别相连;所述声母韵母识别模块用于声母韵母识别,所述语音识别控制器根据语音采集及输入 电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;所述拼音识别模块用于汉字拼音识别,所述语音识别控制器根据拼音识别模块,以及 所述得到的一个声母韵母序列,输出M个候选汉字序列到显示器,M为正整数,然后根据用 户输入的选择信息输出其中的一个候选汉字序列。
2.根据权利要求1所述的汉语语音输入系统,其特征在于,所述声母韵母识别模块,包 括汉语拼音声母韵母模式库、声学模式匹配单元,所述汉语拼音声母韵母模式库用于设置 各声母韵母的模式,所述声学模式匹配单元用于将语音信号同各声母韵母的模式进行声学 匹配配置信度打分,所述语音识别控制器根据所述声学模式匹配单元对所述语音采集及输 入电路输入的语音信号和汉语拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行 匹配,分别给出语音信号对应的声母韵母序列中各声母的声学匹配置信度得分和各韵母的 声学匹配置信度得分,得到声母声学匹配置信度及韵母声学匹配置信度综合得分排序最高 的一个声母韵母序列,所述语音识别控制器根据拼音识别模块,以及所述声母声学匹配置 信度及韵母声学匹配置信度综合得分排序最高的一个声母韵母序列,输出M个候选汉字序 列到显示器。
3.根据权利要求1所述的汉语语音输入系统,其特征在于,所述声母韵母识别模块,包 括汉语拼音声母韵母模式库、声学模式匹配单元、汉字拼音声母韵母组合单元,所述汉语拼 音声母韵母模式库用于设置各声母韵母的模式,所述声学模式匹配单元用于将语音信号同 各声母韵母的模式进行声学匹配配置信度打分,所述汉字拼音声母韵母组合单元用于对声 母韵母序列中的声母韵母进行声母韵母组合打分,所述语音识别控制器根据所述声学模式 匹配单元对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉 语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声 学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学 匹配置信度综合得分排序最高的N个声母韵母序列,N为正整数;然后所述语音识别控制器 根据所述汉字拼音声母韵母组合单元对所述N个声母韵母序列中的各声母韵母进行声母 韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置信度综合得分、声母韵母组 合得分得到所述N个声母韵母序列的声学声韵得分,得到声学声韵得分最高的一个声母韵 母序列,然后所述语音识别控制器根据拼音识别模块,以及所述声学声韵得分最高的一个 声母韵母序列,输出M个候选汉字序列到显示器。
4.根据权利要求3所述的汉语语音输入系统,其特征在于,所述声母韵母识别模块,还 包括韵母识别置信度修正单元,所述韵母识别置信度修正单元用于将声母韵母序列中的声 学匹配置信度得分低于设定值的韵母去除,所述语音识别控制器根据所述韵母识别置信度 修正单元,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于设 定值的韵母去除,得到经过韵母识别置信度修正的一个声母韵母序列,然后所述语音识别 控制器根据所述拼音识别模块及所述经过韵母识别置信度修正的一个声母韵母序列,输出M个候选汉字序列到显示器。
5.根据权利要求1至4任一项所述的汉语语音输入系统,其特征在于,所述拼音识别模 块,包括汉语字词库、汉字拼音单元,所述汉语字词库用于设置各汉语字词,所述汉字拼音 单元用于将声母韵母序列识别为汉语字词库中的汉语字词序列,所述语音识别控制器根据 所述汉字拼音单元及汉语字词库将所述得到的一个声母韵母序列识别为M个候选汉字序 列输出到显示器。
6.根据权利要求1至4任一项所述的汉语语音输入系统,其特征在于,所述拼音识别模 块,包括汉语字词库、汉字拼音单元、汉语文法单元,所述汉语字词库用于设置各汉语字词, 所述汉字拼音单元用于将声母韵母序列识别为汉语字词库中的汉语字词序列,所述汉语文 法单元用于对汉字序列进行汉语文法选择,所述语音识别控制器根据所述汉字拼音单元及 汉语字词库将所述得到的一个声母韵母序列识别为L个候选汉字序列,然后所述语音识别 控制器根据所述汉语文法单元对所述L个汉字序列进行汉语文法选择,输出M个候选汉字 序列到显示器,L为大于等于M的正整数。
7.一种汉语语音输入方法,其特征在于,包括以下步骤一.利用语音采集及输入电路采集并输入语音信号到语音识别控制器;二.语音识别控制器根据语音信号及声母韵母识别规则得到一个声母韵母序列;三.语音识别控制器根据所述得到的一个声母韵母序列及汉字拼音识别规则,输出M 个候选汉子序列到显示器,M为正整数;四.用户输入选择信息;五.语音识别控制器根据用户输入选择信息输出一个候选汉字序列。
8.根据权利要求7所述的汉语语音输入方法,其特征在于,所述声母韵母识别规则,包 括汉语拼音声母韵母模式库、声学模式匹配规则,所述语音识别控制器根据所述声学模式 匹配规则对所述语音采集及输入电路输入的语音信号和汉语拼音声母韵母模式库中的汉 语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的声母韵母序列中各声母的声 学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母声学匹配置信度及韵母声学 匹配置信度综合得分排序最高的一个声母韵母序列,所述语音识别控制器根据拼音识别模 块设置的汉字拼音识别规则,以及所述声母声学匹配置信度及韵母声学匹配置信度综合得 分排序最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
9.根据权利要求7所述的汉语语音输入方法,其特征在于,所述声母韵母识别规则,包 括汉语拼音声母韵母模式库、声学模式匹配规则、汉字拼音声母韵母组合规则,所述语音识 别控制器根据所述声学模式匹配规则对所述语音采集及输入电路输入的语音信号和汉语 拼音声母韵母模式库中的汉语拼音声母及韵母的模式进行匹配,分别给出语音信号对应的 声母韵母序列中各声母的声学匹配置信度得分和各韵母的声学匹配置信度得分,得到声母 声学匹配置信度及韵母声学匹配置信度综合得分排序最高的N个声母韵母序列,N为正整 数;然后所述语音识别控制器根据所述汉字拼音声母韵母组合规则对所述N个声母韵母序 列中的各声母韵母进行声母韵母组合打分,并根据声母声学匹配置信度及韵母声学匹配置 信度综合得分、声母韵母组合得分得到所述N个声母韵母序列的声学声韵得分,得到声学 声韵得分最高的一个声母韵母序列,然后所述语音识别控制器根据拼音识别模块设置的汉 字拼音识别规则,以及所述声学声韵得分最高的一个声母韵母序列,输出M个候选汉字序列到显示器。
10.根据权利要求9所述的汉语语音输入方法,其特征在于,所述声母韵母识别规则, 还包括韵母识别置信度修正规则,所述语音识别控制器根据所述韵母识别置信度修正规 则,将所述声学声韵得分最高的一个声母韵母序列中的声学匹配置信度得分低于设定值的 韵母去除,得到经过韵母识别置信度修正的一个声母韵母序列,然后所述语音识别控制器 根据所述拼音识别模块中的汉字拼音规则将所述经过韵母识别置信度修正的一个声母韵 母序列,输出M个候选汉字序列到显示器。
全文摘要
本发明公开了一种汉语语音输入系统,语音识别控制器同语音采集及输入电路、声母韵母识别模块、拼音识别模块、显示器分别相连;语音识别控制器根据语音采集及输入电路输入的语音信号以及声母韵母识别模块,得到一个声母韵母序列;语音识别控制器根据拼音识别模块,以及所述得到的一个声母韵母序列,输出一个或多个候选汉字序列到显示器,然后根据用户输入的选择信息输出其中的一个候选汉字序列。本发明还公开了一种汉语语音输入方法。本发明的汉语语音输入系统及方法识别率高。
文档编号G06F3/16GK102063282SQ20091020181
公开日2011年5月18日 申请日期2009年11月18日 优先权日2009年11月18日
发明者黄伟 申请人:盛大计算机(上海)有限公司