一种基于即时通信的多人协同录音系统及识别方法

文档序号:9670664阅读:648来源:国知局
一种基于即时通信的多人协同录音系统及识别方法
【技术领域】
[0001] 本发明设及一种基于即时通信的多人协同录音系统及识别方法,属于智能语音识 别技术领域。
【背景技术】
[0002] 在公司会议、小组讨论等场景中,都需要专人对发言内容进行记录,随着人们对及 时语音记录的迫切需要,手机记录软件应运而生。传统的手机录音软件分为两大类:手机自 带的录音软件和W科大讯飞录音宝为代表的智能录音软件。两类软件都能支持基本的录音 功能,录音宝更是加入了语音识别功能,但是对于多人协同录音及其语音识别方面,上述两 类软件都没有体现,更不能支持多语言协同录音和快速语音识别,运就限制了因地域问题 所造成的会议或讨论的进行,间接制约了团体或公司的决策与发展。
[0003] 如何能够实现快速、高效、即时的多人协同录音并能将语音识别为会议记录,必将 给公司或团体带来管理和运营上的便利。目前市场上还没有一款同时支持上述功能的手机 软件,多人语音W聊天为目的语音识别内容松散,不支持将语音识别为文本记录的功能,限 制了多人协同会议的录音形成会议文本记录,直接制约了公司等团体的实时决策制定。

【发明内容】

[0004] 发明目的:针对现有技术中存在的问题,本发明提供一种基于即时通信的多人协 同录音系统及识别方法,支持多人跨地域协同录音并快速、高效、实时地将录音识别成会议 T^Elt5?O
[000引本发明的思路是:利用即时通信技术实现不同手机客户端之间的语音通信,采用 同步上传方法将语音并行上传到语音识别服务器和系统服务器,分别用于语音识别与存 储,W讯飞语音识别引擎作为语音识别器,支持中英两种语言的识别,将语音通过异步识别 方法快速、高效地识别为文本,并由系统服务器整理成会议记录,调用手机邮件发送功能, 自动查找用户信息库获取会议成员邮箱发送邮件分享会议记录。
[0006] 技术方案:一种基于即时通信的多人协同录音系统,包括如下模块:注册登录与文 件管理模块,用于新用户注册并登录系统,W及登陆后管理个人录音文件;好友管理模块, 用于好友添加和解除好友关系;协同录音模块,用于进行多人协同录音、将录音识别为文本 W及实现文本的邮件分享;消息处理模块,用于用户处理系统产生的请求和提示消息。
[0007] 所述注册登录与文件管理模块,包括用户注册单元、用户登录单元和文件管理单 元;其中用户注册单元,用于用户通过邮箱注册该系统,并将注册信息存入用户信息库;用 户登录单元,用于用户通过邮箱和注册密码登录系统;文件管理单元,通过语音文件库对产 生的所有协同录音文件进行管理;
[0008] 所述好友管理模块,基于好友关系库,对好友信息进行操作,包括好友添加单元和 解除好友关系单元;其中好友添加单元,用于查找好友信息并添加好友,对方收到请求并同 意完成加友;解除好友关系单元,用于解除双方的好友关系;
[0009] 所述多人协同录音模块,包括创建房间单元、开启会话单元、同步语音上传单元、 多语言异步识别单元和邮件分享单元;其中创建房间单元,用于创建协同录音的房间,并添 加在线好友作为房间成员;开启会话单元,用于管理员开启一次协同录音并邀请其他成员 加入;同步语音上传单元,用于将每位用户的语音并行进行语音识别与语音存储,语音文件 存储在语音文件库中;所述多语言异步识别单元,用于根据语言引擎将语音交由不同的识 别引擎识别,并分时上传一次会话的多条语音;所述邮件分享单元,用于通过邮件分享协同 录音的文本;
[0010] 所述消息处理模块,用于对系统和用户之间请求消息的处理,用户存在一个消息 列表,其中包括=类消息:好友添加请求、加入房间提示和进入会话邀请。其中好友添加请 求在添加好友时由系统生成并采用即时通讯服务进行实时推送;加入房间提示在管理员创 建房间时由系统产生,推送给房间其他成员;进入会话邀请在管理员开启一次会话时产生, 推送给其他会话成员。
[0011] -种基于即时通信的多人协同录音识别方法,包含如下步骤:
[0012]S-I:仓幡房间(房间是协同录音的场所,房间的创建者作为房间管理员,可添加成 员),并选择在线好友加入房间;
[0013]S-2:开启一次会话,会话成员等待录音令牌(用户点击录音按钮,系统根据抢占时 间先后分发录音令牌,同一时间只允许一个用户占据令牌录音),会话成员获取录音令牌后 进行录音,一人在录音时其他人无法录音,具体包括如下步骤:
[0014] 步骤S-2-1:房间管理员发起一次会话;
[0015] 步骤S-2-2:即时通信服务器查询房间信息库,获取房间成员并向所有成员发送即 时会话邀请;
[0016] 步骤S-2-3:房间成员收到会话邀请,选择"接受",则转向步骤S-4-4,选择"拒绝", 则该成员拒绝加入本次会话,无法进入协同录音;
[0017] 步骤S-2-4:成员加入会话,同时可选择语音识别引擎;
[0018] 步骤S-2-5:判断是否有成员在录音,若有,等待其他用户交出令牌,否则,转向步 骤S-2-6;
[0019] 步骤S-2-6:调用手机的麦克风设备,采集当前用户语音并记录用户名等信息,采 集完成交出令牌。
[0020]S-3:采用同步语音上传方法,将语音同步并行上传至语音识别服务器和语音文本 库,分别用于语音识别与存储,具体包括如下步骤:
[0021] 步骤S-3-1:判断会话是否终止,若未终止,将录制语音同时上传到语音识别服务 器和语音文件库,否则,会话结束;
[0022] 步骤S-3-2:判断当前用户选择的语音识别引擎,若为中文,则转向步骤S-3-3,若 为英文,转向步骤S-3-4;
[0023] 步骤S-3-3:将语音提交至讯飞中文识别引擎,并将中文识别结果返回至系统服务 器,转向步骤S-3-5;
[0024] 步骤S-3-4:将语音提交至讯飞英文识别引擎,并将英文识别结果返回至系统服务 器,转向步骤S-3-5;
[0025] 步骤S-3-5:获取当前用户名称,W及语音识别结果作为一条发言记录,并将记录 存储至系统服务器,转向步骤S-3-1。
[0026]S-4:采用多语言异步识别方法,当一条语音被提交后,立刻交由服务器端进行语 音识别,不同语音分时识别,具体包括如下步骤:
[0027]步骤S-4-1:收到结束本次会话命令,系统清退该房间中非管理员成员,结束非管 理员成员的会话;
[0028]步骤S-4-2:系统服务器整理文本记录,并根据语音上传顺序将记录组织成会议文 本;
[0029]步骤S-4-3:获取系统日期和房间管理人名称,分别作为会议时间和会议主持人;
[0030]步骤S-4-4:编辑修改会议文本,形成最终会议记录。
[0031] S-5:系统服务器将语音识别结果组织成会议记录返回给房间管理员;
[0032] S-6:调用手机邮件发送接口,管理员通过邮件发送给共同录制声音的其他成员。
[0033]本发明采用上述技术方案,具有W下有益效果:基于即时通信实现一次协同录音 中实时通信,采用同步上传方法实现音频的语音识别与存储的并行执行,通过异步识别方 法减少了语音识别等待时间。通过上述
当前第1页1 2 3 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1