用于发送短信的语音输入方法

文档序号：7613241阅读：652来源：国知局

专利名称：用于发送短信的语音输入方法
技术领域：
本发明涉及本一种语音输入方法，特别涉及一种用于发送短信的语音输入方法。
背景技术：
随着行动通讯装置的普遍使用，应用在行动通讯装置上的输入方法也越来越重要。由于行动通讯装置上一般均不会设置太多按键，在有限的按键上键入信息往往耗时费力，通常需不断的在屏幕选单中上下搜寻才能取得想要输入的信息。且行动通讯装置的按键大小通常都比较小，不符合人体工学上的设计需求，使用者按键久了会有手指痛等症状，因此语音输入方法在行动通讯装置上应用成为必然的趋势。另外，行动通讯装置均设置有发送短信的功能，发送短信是时尚年轻人喜爱的联络方式之一，但是已有技术中的发送短信均需通过按键来完成，会造成上述不便。
如图1所示，图1为已有技术的一种语音输入方法示意图，其中至少包含语音接收模块11、语音辨识模块12以及语音数据库13。语音接收模块11接收外界语音信号14，该语音信号14一般为使用者的语音信号。接着语音辨识模块12对语音信号14进行分析，由于语音信号14通常为连续发音的文字，需要将连续发音的文字进行辨识，语音辨识模块12还可包含音节辨识器121。音节辨识器121用以将连续发音的语音信号14拆解成连续的单音信号。以中文普通话为例，单音信号大约为一千三百多种，包含平仄四声等发音方式以及音调等等，但是对应的中文文字却有数十万字，即使以常用中文字也有五万余字。一个单音信号对应多个中文文字，所以无法仅凭单独的单音信号转换成对应的中文文字，但是有些惯用的规则，例如特定几个单音信号的顺序排列即代表某个特定的文字语词等，利用纪录上述惯用规则的语音数据库13，可以取得单音信号组合对应的句子15。最后将转换得到的句子15连续输出即完成语音输入的方法。该方法可以将接收的语音信号14转换为对应的句子15后输出。
如图2所示，图2为依据图1所示的一种语音输入方法流程图，首先语音接收模块接收语音信号S21，其次音节辨识器辨析语音信号成单音信号S22，再次语音辨识模块以及语音数据库辨析单音信号组合得到句子S23，最后输出句子到对应的接收装置S24。
上述的语音输入方法具有免动手输入的方便性，且使用者只需会说话发声即可使用该语音输入方法。但是由于各地方使用者口音不尽相同，往往使得语音辨识模块在辨识语音信号时造成误判，反而让使用者在修改误判时花费更多精力，造成极度不便。又由于单音信号组合对应文字词语的数据量非常庞大，且实时处理前述的对应关系需要使用高速处理单元进行处理，因此已有技术中的该语音输入方法大多局限于计算机等具有庞大储存媒体以及脉冲较高、信号较强的中央处理器的工具可以使用，而一般行动通讯装置由于内部储存媒体较少，且中央处理单元执行效率也较慢，这些因素使得较难实施上述语音输入方法。尤其在行动通讯装置发送短信这项功能上，如果要以上述的语音输入方法进行短信发送，则势必要建立庞大的语音数据库，这样会减慢行动通讯装置的执行效率，以及增加开机时间等等，反而无法达到预期的效果。
笔划输入法为目前一般行动通讯装置都具有的一种输入方法，其实施方式是将一个字拆解成多个笔划单元的排列，而笔划单元的总数一般为六个，可由行动通讯装置上的按键键入该笔划单元，而取得对应的文字。以中文文字为例，其中多个笔划单元可为“横”、“竖”、“撇”、“捺”、“折”及“勾”，所对应的文字结构单元为“一”、“丨”、“丿”、“乀”、“乛”及“亅”，可以由该些笔划单元的顺序组合而得对应的文字。以文字“王”为例，其拆解的文字结构单元顺序组合为“一一丨一”，当使用者依序输入“横”、“横”、“竖”、“横”的笔划单元组合时，即可输入文字“王”的信息。
如图3所示，图3为已有技术的一种笔划输入法的示意图，其中至少包含输入模块31、处理单元32以及数据库33。输入模块31可为键盘或为按键，用以接收使用者键入的输入信号34并将该输入信号转换成对应的笔划单元后，传送至处理单元32。当处理单元32接收到多个笔划单元后，通过数据库33比较该多个笔划单元顺序组合对应的文字35，若有符合的文字35，则输出该文字35。其中数据库33含有该多个笔划单元对应该文字的对照表。以中文文字为例，中文常用字有数万字，当使用者键入的笔划单元个数不足以顺序组合出对应的特定文字时，此笔划输入法可提供多个候选字供使用者选择，其中该多个候选字对应的笔划单元顺序组合均可满足使用者输入的笔划单元。
如图4所示，图4为图3的一种用于发送短信的笔划输入法的流程图。首先使用者利用输入装置键入笔划单元S41，接着利用数据库根据使用者输入笔划单元顺序组合筛选可能的候选字S42，其中候选字对应的笔划单元顺序组合均可满足使用者输入的笔划单元，由于显示屏幕可能放不下所有的候选字，使用者可以卷动窗口寻找正确的候选字，以决定候选字是否正确S43？若是，则确认文字S44即为该候选字，并输出，若否，则使用者继续键入笔划单元S41，以缩小筛选可能的候选字S42的范围让使用者确认。接着，系统会询问是否输入完毕S45？若否，则使用者则继续键入笔划单元S41，以继续输入文字作为短信的组合，若是，则可进行设定收件人S46，接着发送短信S47。
上述已有技术用于发送短信的笔划输入法的特点在于其数据库很小，不需要很大的储存媒体即可实施此笔划输入法，又由于中文文字结构的特殊性，将中文文字拆解成笔划单元的顺序组合非常容易让使用者使用，该种笔划输入法特别适用于中文文字的输入，但不仅限于中文文字的输入。另外，由于此笔划输入法在输入每一个文字时，均需要使用者确认，如此可以大幅降低误判等错误情事的发生。尽管笔划输入法具有上述的种种特点，但是仍需要使用键盘或按键键入相关信息，造成非常不便，尤其对于行动通讯装置而言，其设置的按键大小通常都比较小，不符合人体工学上的设计需求，使用者按键久了甚至会有手指痛等症状。另外，有些年老的使用者视力并不是很好，要看清楚较小的按键是件吃力的事情，使上述用于发送短信的笔划输入法无用武之地。

发明内容
本发明所要解决的技术问题是提供一种用于发送短信的语音输入方法，该方法可以不需要庞大的储存媒体，误判率较低，辨识速度较快。
为解决上述技术问题，本发明一种用于发送短信的语音输入方法，首先，语音接收模块接收预设语音信号，其中该预设语音信号可为使用端预先设定的语音信号，使用端可为使用者。其次，语音辨识模块辨识上述预设语音信号并取得该预设语音信号对应的多个笔划单元，其中该笔划单元可对应于文字结构单元，藉由多个笔划单元的顺序组合可对应特定文字。第三步，在纪录前述对应关系的数据库中取得该多个笔划单元对应的文字作为短信的组合。最后，发送短信。
本发明提供的一种于行动通讯装置中发送短信的语音输入方法，使用者无需按键即可发送短信，可以让使用者发送短信更加方便；且由于该预设语音信号为使用者预先输入，可配合使用者口音而使辨识率提高；本发明不需要庞大的储存媒体存放语音数据库，非常适合在行动通讯装置上使用。

下面结合附图和实施例对本发明作进一步描述图1为已有技术的一种语音输入方法的功能模块示意图；图2为对应于图1的一种语音输入方法流程图；图3为已有技术的一种笔划输入法的功能模块示意图；图4为对应于图3的一种用于发送短信的笔划输入法的流程图；
图5为本发明用于发送短信的语音输入方法功能模块示意图；图6为本发明用于发送短信的语音输入方法流程图；图7为本发明中预先设定预设语音信号的流程图；图8为依据本发明的用于发送短信的语音输入方法的操作流程示意图；图9为延续图8的用于发送短信的语音输入方法的操作流程示意图。
其中11为语音接收模块；12为语音辨识模块；121为音节辨识器；13为语音数据库；14为语音信号；15为句子；31为输入模块；32为处理单元；33为数据库；34为输入信号；35为文字；51为语音接收模块；52为语音辨识模块；53为预设语音信号；54为文字；S21-S24、S41-S47、S61-S69、S71-S74为流程步骤；S81-S89为屏幕画面。
具体实施例方式
本发明提出一种用于发送短信的语音输入方法，适用于在行动通讯装置中发送短信，先将使用者输入的预设语音信号转换为对应的笔划单元，利用数据库搜寻出该笔划单元顺序组合对应的文字作为该短信的组合，在发送短信。
如图5所示，图5为本发明用于发送短信的语音输入方法功能模块示意图。其中至少包含语音接收模块51、语音辨识模块52、处理单元32以及数据库33。首先，语音接收模块51接收预设语音信号53，该预设语音信号53可为使用端预先设定的语音信号，其中使用端可为使用者。其次，语音辨识模块52对预设语音信号53进行分析。由于预设语音信号53为使用者预先输入，所以可以依据先前纪录使用者的口音语调而能迅速准确地将预设语音信号53转换为对应的多个笔划单元。其中该笔划单元可对应于文字结构单元，由多个笔划单元的顺序组合可对应于特定文字。以中文文字为实施例，其中多个笔划单元可为“横”、“竖”、“撇”、“捺”、“折”及“勾”，其所对应的文字结构单元为“一”、“丨”、“丿”、“乀”、“乛”及“亅”，可以由该些笔划单元的顺序组合而得对应的文字。以文字“王”为例，其拆解的文字结构单元顺序组合为“一一丨一”，当依序输入“横”、“横”、“竖”、“横”的笔划单元组合时，即可输入文字“王”的信息。由于笔划单元的数量不多，对应的预设语音信号也就不多，也因此不需要很庞大的储存媒体存放预设语音信号转换笔划单元的语音数据库。再次，处理单元32接收到多个笔划单元，通过数据库比较该多个笔划单元顺序组合对应的文字54，若有符合的文字54，则输出该文字54。在此实施例中，该数据库33含该多个笔划单元对应该文字的对照表。最后，将该文字作为短信的组合，并发送该短信。又以中文文字为例，其常用字有数万字，当使用者键入的笔划单元个数不足以顺序组合出对应的特定文字时，笔划输入法可提供多个候选字供使用者选择，其中该多个候选字对应的笔划单元顺序组合均可满足使用者输入的笔划单元。
如图6所示，图6为本发明用于发送短信的语音输入方法流程图。首先，启动短信功能S61；第二步，语音接收模块接收预设语音信号S62。其中该预设语音信号为使用者发出；第三步，语音辨识模块分析该预设语音信号并取得对应的笔划单元S63；第四步，通过数据库依据笔划单元顺序组合可能的候选字S64；第五步，使用者可以在屏幕显示表中寻找正确的候选字，以决定候选字是否正确S65？若是，则进行第六步确认文字S66；即为该候选字并输出，若否，则回到第二步语音接收模块接收预设语音信号S62；语音辨识模块分析该预设语音信号并取得对应的笔划单元S63；缩小筛选可能的候选字范围S64，决定候选字是否正确S65，直到第六步使用者确认文字S66；第七步，系统会询问是否输入完毕S67；若否，则回到第二步使用者输入预设语音信号使语音接收模块继续接收预设语音信号S62，以继续输入文字作为短信的组合；若是，则进行第八步继续利用语音输入设定收件人S68；第九步，发送短信S69。
如图7所示，图7为本发明中预先设定预设语音信号的流程图。第一步，使用者输入预设语音信号S71；其中预设语音信号对应笔划单元。以笔划单元“横”为例，预设语音信号为使用者说出“横”的读音，第二步，使用者确认预设语音信号对应的笔划单元S72；第三步，储存设定S73；由于可设定不止一个预设语音信号，因此，第四步，行动通讯装置接着会询问使用者是否设定完成S74。若否，则回到第一步，使用者再次输入预设语音信号S71；若是，则完成预先设定笔划单元对应的预设语音信号。
如图8所示，图8为依据本发明的用于发送短信的语音输入方法的操作流程示意图，针对行动通讯装置屏幕的画面说明本发明的语音输入方法的操作流程。首先如S81所示，进入语音输入功能选单，系统会显示要求使用者输入内容。以使用者欲输入文字“王”为例，使用者发出语音信号，该语音信号为“横”的读音，用以表示“横”的笔划单元，即为“一”的文字结构单元。当使用者输入后，如S82所示，系统屏幕会显示“一”的文字结构单元，并根据该对应的笔划单元顺序组合搜寻出可能的候选字，并显示在屏幕上。由于屏幕容量有限无法显示所有的候选字，所以系统会自动挑出较常用的显示在屏幕上，如“一二三大天木”，由于文字“王”并不在屏幕显示上，使用者必须要继续输入语音信号。接着，使用者又输入“横”的读音的语音信号，如S83所示，系统屏幕会显示“一一”的文字结构单元，并根据该对应的笔划单元顺序组合搜寻出可能的候选字，并显示在屏幕上，由于S83与S82的笔划单元顺序组合不同，故对应的候选字也会不同，如“二三天青表次”。继续如S84所示，使用者继续输入“竖”以及“横”的语音信号，而系统屏幕显示对应“一一丨一”的文字结构单元，并根据该对应的笔划单元顺序组合搜寻出可能的候选字，并显示在屏幕上，由于文字“王”已经显示在屏幕的候选字中，使用者可用语音输入确认，系统自动弹出数字标号，如S85所示。最后如S86所示，由于文字“王”对应于1的数字标号，所以使用者可直接语音输入『1』的读音，以选取该对应的文字。
如图9所示，图9为延续图8的用于发送短信的语音输入方法的操作流程示意图。当使用者输入完短信文字后，可以语音输入“发送短信”的读音，系统跳出设定收件者的画面，在本实施例中，则为输入收件者电话号码，如S87所示，接着如S88所示，使用者可直接语音输入“0937123456”的读音以输入电话号码，最后确认发送短信，则如S89所示，屏幕显示发送短信中的相关内容。
本发明提供的一种用于发送短信的语音输入方法，先将使用者输入的预设语音信号转换为对应的笔划单元，利用数据库搜寻出该笔划单元顺序组合对应的文字作为该短信的组合，不需要庞大的储存媒体以存放语音数据库，使得非常适合于行动通讯装置上使用。
权利要求
1.一种用于发送短信的语音输入方法，其特征在于，包含以下步骤第一步，语音接收模块接收预设语音信号；第二步，语音辨识模块辨识上述预设语音信号并获取该语音信号对应的多个笔划单元；第三步，数据库中调用上述多个笔划单元对应的文字作为该短信的组合。
2.如权利要求1所述的一种用于发送短信的语音输入方法，其特征在于，所述的预设语音信号为外部语音信号。
3.如权利要求1所述的一种用于发送短信的语音输入方法，其特征在于，所述的多个笔划单元包括“横”、“竖”、“撇”、“捺”、“折”及“勾”。
4.如权利要求1所述的一种用于发送短信的语音输入方法，其特征在于，所述的数据库含有所述的多个笔画单元及对应文字的对照表。
5.如权利要求1所述的一种用于发送短信的语音输入方法，其特征在于，数据库中包含利用所述的多个笔划单元的各种排列方式排列所对应的文字。
6.如权利要求1所述的一种用于发送短信的语音输入方法，其特征在于，所述的文字为中文文字。
全文摘要
本发明公开了一种用于发送短信的语音输入方法。首先利用语音接收模块接收预设语音信号，其中该预设语音信号可为使用端预先设定的语音信号。接着利用语音辨识模块取得该预设语音信号对应的多个笔划单元，其中多个笔划单元的顺序组合可对应特定文字。最后利用记录前述对应关系的数据库取得该多个笔划单元对应的文字作为短信的组合，并发送该短信。本发明采用语音笔画输入方式，不占用大的存储空间，适合移动通讯各种设备。
文档编号H04M1/27GK1873776SQ200510026359
公开日2006年12月6日申请日期2005年6月1日优先权日2005年6月1日
发明者朱元博, 蔡世光, 何代水申请人:英华达(上海)电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：朱元博;蔡世光;何代水
技术所有人：英华达（上海）电子有限公司
我是此专利的发明人

上一篇：能显示电视信号强弱的电视机及其制造方法
上一篇：手机安全保护系统的利记博彩app

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。