一种语音处理方法及装置的制造方法_4

文档序号:8944179阅读:来源:国知局
表格中包括多个栏目,每个栏目与至少一个关键词对应,因此,步骤S14可以实施为以下步骤:根据栏目对应的关键词,确定文字中与栏目对应的文字内容;将与栏目对应的文字内容填写到栏目中。例如,对于医学中病例表格,包括症状、过往病史、用药、过敏史等栏目,终端可根据每个栏目的关键词来确定出与每个栏目对应的文字内容,进而将文字内容填写至相应的栏目中。
[0180]本发明实施例提供的上述方法可用于不同的领域或行业中,例如医学领域、金融领域、通信领域等。以下从医学领域出发举例说明本发明实施例提供的一种语音处理方法。如图9所示,包括以下步骤S91-S99:
[0181]步骤S91,将不同科室的特定术语作为预设关键词,添加到通用语言数据库中。该步骤中,还可以将与特定术语相关的文章添加到通用语言数据库中。
[0182]步骤S92,建立不同科室所对应的语言数据库。
[0183]步骤S93,录制医生说话时的语音。
[0184]步骤S94,获取录制的预设时间段的语音。
[0185]步骤S95,从预设时间段的语音中获取具有代表性的预设关键词。
[0186]步骤S96,确定预设关键词所属科室,并确定与该科室相对应的语言数据库。
[0187]步骤S97,根据与该科室相对应的语言数据库将录制的语音转化为文字。
[0188]步骤S98,确定并获取该科室对应的表格。例如,如果是内科,则获取内科病例表格;如果是呼吸科,则获取呼吸科病例表格。
[0189]步骤S99,将转化成的文字填写到该科室对应的表格中。
[0190]此外,还可以为每一个医生配置一个声音数据库,声音数据库中包括医生的发音特征,这样,终端可以根据医生的发音特征确定出医生的声音数据库,进而根据声音数据库确定出该医生对应的语言数据库。其中,由于同一个科室中可能有多个医生,因此,多个声音数据库可对应同一个语言数据库。还可以在终端中安装的客户端上预先分好类别,每一个类别都对应有各自的语言数据库,以及对应有各自的表格。用户先手动选择进入某一类另IJ,再在该类别下进行录制语音,并采用该类别下的语言数据库对语音进行转化,最后将转化后的文字内容填写到该类别对应的表格中。由该实施例可见,医生在对病人问诊时,无需再手动填写病例表格,终端会通过录音以及采用特定的语言数据库将语音转化成文字,从而自动填写病例表格,为医生节省了大量时间。
[0191]对应于上述的一种语音处理方法,本发明实施例还提供一种语音处理装置,如图10所示,包括:
[0192]录制模块101,用于录制语音;
[0193]确定模块102,用于确定对语音进行转化的语言数据库;
[0194]转化模块103,用于通过语言数据库将语音转化为文字;
[0195]填写模块104,用于将文字填写到与语音相匹配的表格中。
[0196]在一个实施例中,如图11所示,确定模块102包括:
[0197]获取子模块1021,用于获取录制预设时间段的语音;
[0198]判断子模块1022,用于判断预设时间段的语音是否包含预设关键词;
[0199]第一确定子模块1023,用于当预设时间段的语音包含预设关键词时,根据预设关键词和语言数据库之间的对应关系,确定与预设关键词相对应的语言数据库,作为对语音进行转化的语言数据库。
[0200]在一个实施例中,如图12所示,确定模块102包括:
[0201]识别子模块1024,用于识别语音的语音特征;
[0202]第二确定子模块1025,用于根据语音特征,确定语音的发音来源;
[0203]第三确定子模块1026,用于根据发音来源和语言数据库之间的对应关系,确定与语音的发音来源相对应的语言数据库,作为对语音进行转换的语言数据库。
[0204]在一个实施例中,如图13所示,转化模块103包括:
[0205]第四确定子模块1031,用于确定语音的声音信息;
[0206]第一匹配子模块1032,用于从语言数据库中匹配出与声音信息对应的文字;
[0207]转化子模块1033,用于将语音转化为与声音信息对应的文字。
[0208]在一个实施例中,上述装置还包括:第一建立模块,用于根据每个发音来源的语音特征,建立每个发音来源的声音数据库。
[0209]在一个实施例中,如图14所示,确定模块102包括:
[0210]第五确定子模块1027,用于确定语音的发音来源;
[0211]第二匹配子模块1028,用于根据每个发音来源的声音数据库,为语音匹配声音数据库;
[0212]第六确定子模块1029,用于根据匹配的声音数据库确定语音的声音信息。
[0213]在一个实施例中,如图15所不,第一匹配子模块1032包括:
[0214]查找单元10321,用于从语言数据库中查找与声音信息相对应的文字;
[0215]第一匹配单元10322,用于当与声音信息相对应的文字为单一的字时,根据语言数据库中的特定术语和/或语义关联关系,为单一的字匹配词语和/或句子;
[0216]确定单元10323,用于将与单一的字相匹配的词语和/或句子确定为与声音信息对应的文字。
[0217]在一个实施例中,上述装置还包括:提高模块,用于按照预设比例,提高特定术语以及与特定术语之间符合语义关联关系的元素在语言数据库中的权重,元素包括字、词和/或文章;
[0218]第一匹配子模块1032包括:第二匹配单元,用于按照语言数据库中各元素的权重,从语言数据库中匹配出与声音信息对应的文字。
[0219]在一个实施例中,如图16所示,上述装置还包括:
[0220]添加模块105,用于录制语音之前,将预设关键词所属领域的特定术语添加到通用语言数据库中,获得与预设关键词相对应的语言数据库;
[0221]第二建立模块106,用于建立预设关键词和语言数据库之间的对应关系。
[0222]在一个实施例中,如图17所示,填写模块104包括:
[0223]第七确定子模块1041,用于根据预设关键词和表格之间的对应关系,确定与预设关键词相对应的表格;
[0224]第一填写子模块1042,用于将文字填写到与预设关键词相对应的表格中.
[0225]在一个实施例中,如图18所示,填写模块104包括:
[0226]第八确定子模块1043,用于根据发音来源和表格之间的对应关系,确定与发音来源相对应的表格;
[0227]第二填写子模块1044,用于将文字填写到与发音来源相对应的表格中。
[0228]在一个实施例中,如图19所示,填写模块104包括:
[0229]第九确定子模块1045,用于根据表格中的栏目对应的关键词,确定文字中与栏目对应的文字内容,表格中包括至少一个栏目,每个栏目与至少一个关键词对应;
[0230]第三填写子模块1046,用于将与栏目对应的文字内容填写到栏目中。
[0231]采用本发明实施例提供的装置,通过与录制的语音对应的语言数据库将语音转化为文字,并将文字填写到与语音相匹配的表格中,实现了准确地将语音转化为文字的目的,避免了语音内容因存在专业术语而无法准确转化的情况,同时能够自动将文字内容填写到表格中,使用户无需再手动填写,为用户带来极大的方便。
[0232]本领域内的技术人员应明白,本发明的实施例可提供为方法、系统、或计算机程序产品。因此,本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0233]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0234]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0235]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系
当前第4页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1