唇形识别发声器的利记博彩app

文档序号:6421270阅读:429来源:国知局
专利名称:唇形识别发声器的利记博彩app
技术领域
本发明涉及一种发声器,特别涉及一种唇形识别发声器。
背景技术
临床上,许多病人因为喉或者声带病变进行了喉或者声带切除手术,术后不能发声从而阻碍了他们与正常人进行交流。聋哑人一般和正常人进行交流是通过读正常人的唇语来确定对方说话内容的。聋哑人却很难让别人明白自己的意思。利用唇形图像识别和语音合成发声仪器,它可以帮助不能发声的人发出声音,去除他们和正常人交流障碍。但是目前尚未有一种仪器和技术方案可以帮助上述病人和聋哑人发出声音,方便他们和正常人交流。

发明内容
本发明的目的,在于提供一种发声仪器可以帮助上述病人和聋哑人发声,方便和正常人进行交流。本发明是通过辨识说话者的唇形,通过模式识别确定其说话内容,然后通过语音合成技术发出声音。语言的绝大多数音,在说话时都有确定的唇形。本发明能够把说话者的唇形和想发声的“音”一一对应,采用语音合成技术通过扬声器发出声音。
本发明是通过下述技术方案加以实现的1.通过摄像头和图像采集单元采集说话者唇形图像。
2.对唇形图像进行图像处理,实时、动态提取唇形特征,然后用唇形模式识别算法确定说话内容。
3.根据模式识别结果,语音合成单元从语音存储单元提取语音,合成说话内容并通过发声单元送出。
本发明如图1所示微型摄像头1与图像采集单元2相连接,图像采集单元2的输出接唇型图像模式识别单元3,唇型图像模式识别单元3的信号输出到语音合成单元4,语音合成单元4与语音存储单元5相连接,语音合成单元4从语音存储单元5提取语音合成要素合成声音信号,输出到发声单元6,而后通过扬声器7发出与唇型及其变化顺序相对应的声音。
可以将唇形图像处理和模式识别单元,语音合成单元,语音存储单元用处理器8来实现,处理器可以是数字信号处理器(DSP)或其他微处理器(如ARM)等。
而微型摄像头1与图像采集单元可以是集成在一起的具有数字信号输出的摄像头,如CCD摄像头和其他图象传感器。
发声单元6可以采用数字/模拟转换器和放大器组成,也可以采用多媒体数字信号编解码器。
本发明通过识别说话者的唇形,确定说话内容,语音合成说话内容,实时通过扬声器发出声音。本发明可以帮助因为喉或者声带切除不能发声的人或者会唇语的聋哑人发出声音,方便了他们和正常人交流。


图1为本发明的系统连接框图。
图2本发明的一种唇形识别发声器。
具体实施例方式
下面结合附图对本发明作详细说明
如图1所示的连接方法,微型摄像头1与图像采集单元2相连接,图像采集单元2的输出接唇型图像模式识别单元3,唇型图像模式识别单元3的信号输出到语音合成单元4,语音合成单元4与语音存储单元5相连接,语音合成单元4从语音存储单元5提取语音合成要素合成声音信号,输出到发声单元6,而后通过扬声器7发出与唇型及其变化顺序相对应的声音。
采用微型摄像头1,减小体积,微型摄像头放于唇前,只摄取唇形图像,不摄取面部其它图像,它的输出接图像采集单元。图像采集单元2采用视频采集芯片,输入接微型摄像头的输出,输出和图像处理和模式识别单元3连接。图像处理和模式识别单元是仪器的核心,采用数字信号处理器(DSP)或其他微处理器(如ARM),主要进行唇形图像的预处理、特征提取和模式识别。语音合成单元4根据唇形模式识别的结果合成语音。它也由数字信号处理器完成。语音存储单元5为一个数据库,存储所有基本音素,采用大容量存储器存储。发声单元6由数模转换器和放大器组成。数模转换器把数字音频信号转换成模拟音频信号,经放大器放大后驱动扬声器7。发声单元也可以采用多媒体数字信号编解码器。扬声器送出声音。
本实施例的微型摄像头和图像采集单元可以采用集成一体化图象传感器。
本实施例的唇形图像处理和模式识别单元,语音合成单元,语音存储单元采用的处理器8可以是数字信号微处理器或数字信号微处理器系统,也可以采用微处理器或微处理器系统,或者采用采用ARM微处理器或ARM微处理器系统。
本实施例的发声单元包括数模转换器和放大器组成。
为方便适用,本发明外观为耳机形状。微型摄像头放于普通耳机放麦克风的位置,扬声器通过连线接出,仪器其它功能单元电路放置耳朵部位。如附图2所示。
使用者像带耳机一样带上本装置,将微型摄像头拉下,对准自己的唇部,打开开关,开始说话。尽管使用者发不出声音,只要唇部像正常说话时的动作一样,本装置就可以发出正确声音。对于有些使用者说话时唇形不标准,需经过一定训练。经过训练的使用者,本仪器可以满足日常交流。
权利要求
1.一种唇形识别发声器,它由六部分构成微型摄像头,图像采集单元,唇形图像处理和模式识别单元,语音合成单元,语音存储单元和发声单元;其特征是微型摄像头(1)与图像采集单元(2)相连接,图像采集单元(2)的输出接唇型图像模式识别单元(3),唇型图像模式识别单元(3)的信号输出到语音合成单元(4),语音合成单元(4)与语音存储单元(5)相连接,语音合成单元(4)从语音存储单元(5)提取语音合成要素合成声音信号,输出到发声单元(6),而后通过扬声器(7)发出与唇型及其变化顺序相对应的声音。
2.按权利要求1所说的唇形识别发声器,其特征在于微型摄像头和图像采集单元采用集成一体化图像传感器。
3.按权利要求1所说的唇形识别发声器,其特征在于唇形图像处理和模式识别单元,语音合成单元,语音存储单元采用数字信号微处理器或数字信号微处理器系统。
4.按权利要求1所说的唇形识别发声器,其特征在于唇形图像处理和模式识别单元,语音合成单元,语音存储单元采用微处理器或微处理器系统。
5.按权利要求1所说的唇形识别发声器,其特征在于唇形图像处理和模式识别单元,语音合成单元,语音存储单元采用ARM微处理器或ARM微处理器系统。
6.按权利要求1所说的唇形识别发声器,其特征在于发声单元包括数模转换器和放大器组成。
7.按权利要求1所说的唇形识别发声器,其特征在于发声单元采用多媒体数字信号编解码器。
8.按权利要求1所说的唇形识别发声器,其特征在于微型摄像头设置在嘴唇前方。
全文摘要
本发明公开一种唇形识别发声器,它的连接方式是微型摄像头1与图像采集单元2相连接,图像采集单元2的输出接唇型图像模式识别单元3,唇型图像模式识别单元3的信号输出到语音合成单元4,语音合成单元4与语音存储单元5相连接,语音合成单元4从语音存储单元5提取语音合成要素合成声音信号,输出到发声单元6,而后通过扬声器7发出与唇型及其变化顺序相对应的声音。本发明通过识别说话者的唇形,确定说话内容,语音合成说话内容,实时通过扬声器发出声音。本发明可以帮助因为喉或者声带切除不能发声的人或者会唇语的聋哑人发出声音,方便了他们和正常人交流。
文档编号G06K9/78GK1556496SQ20031012202
公开日2004年12月22日 申请日期2003年12月31日 优先权日2003年12月31日
发明者李刚, 解国明, 林凌, 任惠茹, 李 刚 申请人:天津大学
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1