一种语音处理方法及装置的制造方法
【技术领域】
[0001]本发明涉及信息处理技术领域,尤其涉及一种语音处理方法及装置。
【背景技术】
[0002]目前,随着电子科技的发展,语音输入越来越被人们推崇,语音输入是通过语音识别将人说话的内容转换为文本的一种输入方式。很多应用中的语音输入还局限在语音输入语音输出,还不能很好的将语音输入转化为文字。由于在实际应用中,语音识别面对的环境十分复杂,需要处理各种不同领域的说话内容,识别性能很难达到百分之百,尤其是对于一些特殊领域,例如医疗领域、金融领域、通信领域等,存在很多专业术语在语音输入中出现的几率较低,电子设备将说话的内容转换为文本时也很难准确地将语音转换为专业术语。
【发明内容】
[0003]本发明实施例提供一种语音处理方法及装置。所述技术方案如下:
[0004]一种语音处理方法,包括以下步骤:
[0005]录制语音;
[0006]确定对所述语音进行转化的语言数据库;
[0007]通过所述语言数据库将所述语音转化为文字;
[0008]将所述文字填写到与所述语音相匹配的表格中。
[0009]本发明实施例的一些有益效果可以包括:
[0010]上述技术方案,通过与录制的语音对应的语言数据库将语音转化为文字,并将文字填写到与语音相匹配的表格中,实现了准确地将语音转化为文字的目的,避免了语音内容因存在专业术语而无法准确转化的情况,同时能够自动将文字内容填写到表格中,使用户无需再手动填写,为用户带来极大的方便。
[0011]在一个实施例中,所述确定对所述语音进行转化的语言数据库,包括:
[0012]获取录制预设时间段的语音;
[0013]判断所述预设时间段的语音是否包含预设关键词;
[0014]当所述预设时间段的语音包含所述预设关键词时,根据预设关键词和语言数据库之间的对应关系,确定与所述预设关键词相对应的语言数据库,作为对所述语音进行转化的语言数据库。
[0015]该实施例中,通过录制预设时间段的语音中所包含的预设关键词,来确定对语音进行转化的语言数据库,使得对语音进行转化时更加具有针对性和个性化,从而更加准确地将语音转化为文字。
[0016]在一个实施例中,所述确定对所述语音进行转化的语言数据库,包括:
[0017]识别所述语音的语音特征;
[0018]根据所述语音特征,确定所述语音的发音来源;
[0019]根据发音来源和语言数据库之间的对应关系,确定与所述语音的发音来源相对应的语言数据库,作为对所述语音进行转换的语言数据库。
[0020]该实施例中,通过确定语音的发音来源,来确定对语音进行转化的语言数据库,使得对语音进行转化时更加具有针对性和个性化,从而更加准确地将语音转化为文字。
[0021]在一个实施例中,所述通过所述语言数据库将所述语音转化为文字,包括:
[0022]确定所述语音的声音信息;
[0023]从所述语言数据库中匹配出与所述声音信息对应的文字;
[0024]将所述语音转化为与所述声音信息对应的文字。
[0025]该实施例中,通过匹配语音的声音信息对应的文字,进而将语音转化为声音信息对应的文字,使得录制的语音能够通过声学数据库和语言数据库进行准确匹配,从而准确地将语音转化为文字。
[0026]在一个实施例中,所述方法还包括:
[0027]根据每个发音来源的语音特征,建立所述每个发音来源的声音数据库。
[0028]该实施例中,通过建立每个发音来源的声音数据库,使得终端能够根据声音数据库确定出对语音进行转化的语言数据库,从而使语音转化为文字更加准确和个性化。
[0029]在一个实施例中,所述确定所述语音的声音信息,包括:
[0030]确定所述语音的发音来源;
[0031]根据所述每个发音来源的声音数据库,为所述语音匹配声音数据库;
[0032]根据所述匹配的声音数据库确定所述语音的声音信息。
[0033]该实施例中,通过匹配出语音的声音数据库来确定语音的声音信息,进而使终端能够从语言数据库中匹配出声音信息对应的文字,最终实现将语音转化为文字的目的。
[0034]在一个实施例中,所述对所述语音进行转换的语言数据库中包括以下至少一种:
[0035]所述预设关键词所属领域的特定术语;
[0036]所述预设关键词所属领域的文章;
[0037]语义关联关系。
[0038]在一个实施例中,所述从所述语言数据库中匹配出与所述声音信息对应的文字,包括:
[0039]从所述语言数据库中查找与所述声音信息相对应的文字;
[0040]当与所述声音信息相对应的文字为单一的字时,根据所述特定术语和/或所述语义关联关系,为所述单一的字匹配词语和/或句子;
[0041]将与所述单一的字相匹配的词语和/或句子确定为与所述声音信息对应的文字。
[0042]该实施例中,当与所述声音信息相对应的文字为单一的字时,能够根据语言数据中的特定术语或语义关联关系来为单一的字匹配完整的词语或句子,使语音转化成文字时能够有针对性地将特定术语准确转化,从而使得语音的转化更加准确和有针对性。
[0043]在一个实施例中,所述方法还包括:
[0044]按照预设比例,提高所述特定术语以及与所述特定术语之间符合所述语义关联关系的元素在所述语言数据库中的权重,所述元素包括字、词和/或文章;
[0045]所述从所述语言数据库中匹配出与所述声音信息对应的文字,包括:
[0046]按照所述语言数据库中各元素的权重,从所述语言数据库中匹配出与所述声音信息对应的文字。
[0047]该实施例中,将特定术语及与特定术语之间符合语义关联关系的元素在语言数据库中的权重提高,使得语音转化为文字时能够根据各个元素的权重进行转化,从而能够准确地匹配出特定术语,语音转化更加准确和个性化。
[0048]在一个实施例中,所述录制语音之前,所述方法还包括:
[0049]将所述预设关键词所属领域的特定术语添加到通用语言数据库中,获得与所述预设关键词相对应的语言数据库;
[0050]建立所述预设关键词和所述语言数据库之间的对应关系。
[0051]该实施例中,通过建立预设关键词和语言数据库之间的对应关系,使得终端能够根据语音中包含的预设关键词准确地匹配出对语音进行转化的语言数据库,从而使语音转化更加准确和个性化。
[0052]在一个实施例中,所述将所述文字填写到与所述语音相匹配的表格中,包括:
[0053]根据预设关键词和表格之间的对应关系,确定与所述预设关键词相对应的表格;将所述文字填写到与所述预设关键词相对应的表格中;
[0054]或,
[0055]根据发音来源和表格之间的对应关系,确定与所述发音来源相对应的表格;将所述文字填写到与所述发音来源相对应的表格中。
[0056]该实施例中,终端在将语音转化为文字后,能够自动将文字填写到对应的表格中,使用户无需再手动填写,为用户带来极大的方便。
[0057]在一个实施例中,所述表格中包括至少一个栏目;所述每个栏目与至少一个关键词对应;所述将所述文字填写到与所述语音相匹配的表格中,包括:
[0058]根据所述栏目对应的关键词,确定所述文字中与所述栏目对应的文字内容;
[0059]将与所述栏目对应的文字内容填写到所述栏目中。
[0060]该实施例中,终端在将语音转化为文字后,能够将转化后的文字内容填写到对应的表格的栏目中,从而使终端自动填写表格更加准确、有针对性,无需用户手动填写,为用户带来极大的方便。
[0061]—种语音处理装置,包括:
[0062]录制模块,用于录制语音;
[0063]确定模块,用于确定对所述语音进行转化的语言数据库;
[0064]转化模块,用于通过所述语言数据库将所述语音转化为文字;
[0065]填写模块,用于将所述文字填写到与所述语音相匹配的表格中。
[0066]在一个实施例中,所述确定模块包括:
[0067]获取子模块,用于获取录制预设时间段的语音;
[0068]判断子模块,用于判断所述预设时间段的语音是否包含预设关键词;
[0069]第一确定子模块,用于当所述预设时间段的语音包含所述预设关键词时,根据预设关键词和语言数据库之间的对应关系,确定与所述预设关键词相对应的语言数据库,作为对所述语音进行转化的语言数据库。
[0070]在一个实施例中,所述确定模块包括:
[0071]识别子模块,用于识别所述语