一种基于即时通信的多人协同录音系统及识别方法

文档序号：9670664阅读：648来源：国知局

一种基于即时通信的多人协同录音系统及识别方法
【技术领域】
[0001] 本发明设及一种基于即时通信的多人协同录音系统及识别方法，属于智能语音识别技术领域。
【背景技术】
[0002] 在公司会议、小组讨论等场景中，都需要专人对发言内容进行记录，随着人们对及时语音记录的迫切需要，手机记录软件应运而生。传统的手机录音软件分为两大类:手机自带的录音软件和W科大讯飞录音宝为代表的智能录音软件。两类软件都能支持基本的录音功能，录音宝更是加入了语音识别功能，但是对于多人协同录音及其语音识别方面，上述两类软件都没有体现，更不能支持多语言协同录音和快速语音识别，运就限制了因地域问题所造成的会议或讨论的进行，间接制约了团体或公司的决策与发展。
[0003] 如何能够实现快速、高效、即时的多人协同录音并能将语音识别为会议记录，必将给公司或团体带来管理和运营上的便利。目前市场上还没有一款同时支持上述功能的手机软件，多人语音W聊天为目的语音识别内容松散，不支持将语音识别为文本记录的功能，限制了多人协同会议的录音形成会议文本记录，直接制约了公司等团体的实时决策制定。

【发明内容】

[0004] 发明目的：针对现有技术中存在的问题，本发明提供一种基于即时通信的多人协同录音系统及识别方法，支持多人跨地域协同录音并快速、高效、实时地将录音识别成会议 T^Elt5?O
[000引本发明的思路是:利用即时通信技术实现不同手机客户端之间的语音通信，采用同步上传方法将语音并行上传到语音识别服务器和系统服务器，分别用于语音识别与存储，W讯飞语音识别引擎作为语音识别器，支持中英两种语言的识别，将语音通过异步识别方法快速、高效地识别为文本，并由系统服务器整理成会议记录，调用手机邮件发送功能，自动查找用户信息库获取会议成员邮箱发送邮件分享会议记录。
[0006] 技术方案:一种基于即时通信的多人协同录音系统，包括如下模块:注册登录与文件管理模块，用于新用户注册并登录系统，W及登陆后管理个人录音文件;好友管理模块，用于好友添加和解除好友关系;协同录音模块，用于进行多人协同录音、将录音识别为文本 W及实现文本的邮件分享;消息处理模块，用于用户处理系统产生的请求和提示消息。
[0007] 所述注册登录与文件管理模块，包括用户注册单元、用户登录单元和文件管理单元;其中用户注册单元，用于用户通过邮箱注册该系统，并将注册信息存入用户信息库；用户登录单元，用于用户通过邮箱和注册密码登录系统;文件管理单元，通过语音文件库对产生的所有协同录音文件进行管理；
[0008] 所述好友管理模块，基于好友关系库，对好友信息进行操作，包括好友添加单元和解除好友关系单元;其中好友添加单元，用于查找好友信息并添加好友，对方收到请求并同意完成加友;解除好友关系单元，用于解除双方的好友关系；
[0009] 所述多人协同录音模块，包括创建房间单元、开启会话单元、同步语音上传单元、多语言异步识别单元和邮件分享单元;其中创建房间单元，用于创建协同录音的房间，并添加在线好友作为房间成员；开启会话单元，用于管理员开启一次协同录音并邀请其他成员加入；同步语音上传单元，用于将每位用户的语音并行进行语音识别与语音存储，语音文件存储在语音文件库中；所述多语言异步识别单元，用于根据语言引擎将语音交由不同的识别引擎识别，并分时上传一次会话的多条语音;所述邮件分享单元，用于通过邮件分享协同录音的文本；
[0010] 所述消息处理模块，用于对系统和用户之间请求消息的处理，用户存在一个消息列表，其中包括=类消息:好友添加请求、加入房间提示和进入会话邀请。其中好友添加请求在添加好友时由系统生成并采用即时通讯服务进行实时推送;加入房间提示在管理员创建房间时由系统产生，推送给房间其他成员;进入会话邀请在管理员开启一次会话时产生，推送给其他会话成员。
[0011] -种基于即时通信的多人协同录音识别方法，包含如下步骤：
[0012]S-I:仓幡房间（房间是协同录音的场所，房间的创建者作为房间管理员，可添加成员），并选择在线好友加入房间；
[0013]S-2:开启一次会话，会话成员等待录音令牌(用户点击录音按钮，系统根据抢占时间先后分发录音令牌，同一时间只允许一个用户占据令牌录音），会话成员获取录音令牌后进行录音，一人在录音时其他人无法录音，具体包括如下步骤：
[0014] 步骤S-2-1:房间管理员发起一次会话；
[0015] 步骤S-2-2:即时通信服务器查询房间信息库，获取房间成员并向所有成员发送即时会话邀请；
[0016] 步骤S-2-3:房间成员收到会话邀请，选择"接受"，则转向步骤S-4-4,选择"拒绝"，则该成员拒绝加入本次会话，无法进入协同录音；
[0017] 步骤S-2-4:成员加入会话，同时可选择语音识别引擎；
[0018] 步骤S-2-5:判断是否有成员在录音，若有，等待其他用户交出令牌，否则，转向步骤S-2-6;
[0019] 步骤S-2-6:调用手机的麦克风设备，采集当前用户语音并记录用户名等信息，采集完成交出令牌。
[0020]S-3:采用同步语音上传方法，将语音同步并行上传至语音识别服务器和语音文本库，分别用于语音识别与存储，具体包括如下步骤：
[0021] 步骤S-3-1:判断会话是否终止，若未终止，将录制语音同时上传到语音识别服务器和语音文件库，否则，会话结束；
[0022] 步骤S-3-2:判断当前用户选择的语音识别引擎，若为中文，则转向步骤S-3-3,若为英文，转向步骤S-3-4;
[0023] 步骤S-3-3:将语音提交至讯飞中文识别引擎，并将中文识别结果返回至系统服务器，转向步骤S-3-5;
[0024] 步骤S-3-4:将语音提交至讯飞英文识别引擎，并将英文识别结果返回至系统服务器，转向步骤S-3-5;
[0025] 步骤S-3-5:获取当前用户名称，W及语音识别结果作为一条发言记录，并将记录存储至系统服务器，转向步骤S-3-1。
[0026]S-4:采用多语言异步识别方法，当一条语音被提交后，立刻交由服务器端进行语音识别，不同语音分时识别，具体包括如下步骤：
[0027]步骤S-4-1:收到结束本次会话命令，系统清退该房间中非管理员成员，结束非管理员成员的会话；
[0028]步骤S-4-2:系统服务器整理文本记录，并根据语音上传顺序将记录组织成会议文本；
[0029]步骤S-4-3:获取系统日期和房间管理人名称，分别作为会议时间和会议主持人；
[0030]步骤S-4-4:编辑修改会议文本，形成最终会议记录。
[0031] S-5:系统服务器将语音识别结果组织成会议记录返回给房间管理员；
[0032] S-6:调用手机邮件发送接口，管理员通过邮件发送给共同录制声音的其他成员。
[0033]本发明采用上述技术方案，具有W下有益效果:基于即时通信实现一次协同录音中实时通信，采用同步上传方法实现音频的语音识别与存储的并行执行，通过异步识别方法减少了语音识别等待时间。通过上述

完整全部详细技术资料下载

当前第1页1 2 3

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：冯钧;张立霞;王冲;孔胜球;王臻;张进;徐维纲;陆佳民;刘艺;袁艳纯;徐欢;朱跃龙;李士进;万定生;
技术所有人：河海大学;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。