专利名称:一种在移动终端上实现录音合成的方法和系统的利记博彩app
技术领域:
本发明涉及移动终端录音合成技术,更具体地说,涉及一种用来在移动 终端上录取语音或音乐添加到原有音乐、动画或视频中去,用以实现配音或 配乐功能的方法和系统。
背景技术:
在当前移动终端(手机)中,能够实现的多媒体功能很多,能够播放音乐、动画和视频录像等;同时移动终端也可以实现录音等功能。如果能够将 录音合成到已有的多媒体文件中,如给一段动画配音,或者给一^:音乐配唱, 则可以用来制作个性铃声或当作彩信发送给亲友,将为移动终端的用户提供 更加新颖有趣的体验。发明内容本发明所解决的技术问题在于提供一种在移动终端上实现录音合成的 方法和系统,以实现用户利用移动终端上提供的录音合成功能,可以自己录 音为已有的多媒体素材配音的问题。为了实现上述问题,本发明提供了一种在移动终端上实现录音合成的方 法,应用于支持多媒体数据的移动终端中,其特征在于,包括以下步骤选择所述移动终端上要为其配音的多媒体文件,对所述多^ 某体文件进行 音频和视频的拆分,对拆分后生成的音频数据和视频数据进行解码,生成解 码后的视频数据和线性脉码调制录音格式的音频数据,并对该解码后的音频 数据进行备份,如果录音合成前后的视频格式相同,则将视频解码前的数据 直接用作视频备份,否则将视频解码后的视频数据,再进行相应的编码后再 用作备份;在所述移动终端上开始录音,生成线性脉码调制录音格式的音频数据, 将该录制的音频数据和所述解码后的线性脉码调制录音格式的音频数据合 成在一起并进行编码,对所述备份后的视频数据与所述合成编码后的音频数 据进行合并编码,并输出。本发明所述的方法,其中,所述该录制的音频数据和所述解码后的线性 脉码调制录音格式的音频数据合成在一起,进一步为运用脉码调制录音格式 的音频叠加算法,将该录制的音频数据和所述解码后的线性脉码调制录音格 式的音频数据合成在一起。进一步地,所述对拆分后生成的音频数据和视频数据进行解码,进一步为对拆分后生成的音频^:据和^L频^t据进行解码并^T出。进一步地,所述多媒体文件,包括所述移动终端上支持的各种格式的音乐、动画以及^L频^豆片。所述方法的步骤之前,还包括判断所述移动终端上是否插入耳机,如没 有插入耳机则提示用户插入耳才几并定时,如^见定时间内不插入耳才几则结束该 方法的步骤并退出;如有插入耳机或规定时间内插入耳机,则继续4丸行下面 步骤。为了实现上述问题,本发明还提供了一种在移动终端上实现录音合成的 系统,应用于支持多媒体数据的移动终端中,其特征在于,包括多媒体编解 码模块、音频编解码模块,视频编解码模块、音频备份模块、视频备份模块、 音频输入模块、音频输出模块、视频输出模块、音频叠加模块,其中所述多媒体编解码模块,用于对选择所述移动终端上要为其配音的多媒 体文件中的音频数据和视频数据进行拆分和合并;所述音频编解码模块,用于对所述多媒体编解码才莫块拆分后生成的音频 数据进行解码,对所述音频叠加模块叠加后输出的音频数据进行编码;所述视频编解码模块,用于对所述多媒体编解码模块拆分后生成的视频 数据进行解码,如果录音合成前后的视频格式相同,则将视频解码前的数据 直接发给所述视频备份模块,否则将视频解码后的视频数据,再进行相应的 编码后再发给所述视频备份模块;所述音频备份模块,用于对所述音频编解码模块输出的音频数据进行备份;所述视频备份模块,用于对所述多媒体编解码模块对多媒体数据拆分后输出的视频数据或所述视频编解码模块编码后的视频数据进行备份;所述音频输入模块,用于接收录音数据,生成线性脉码调制录音格式的 音频数据;所述音频叠加模块,用于将所述音频输入模块生成的音频数据和所述音 频编解码模块解码后的线性脉码调制录音格式的音频数据进行合成。本发明所述的系统,其中,所述音频叠加模块,进一步用于运用脉码调 制录音格式的音频叠加算法,将所述音频输入模块生成的音频数据和所述音 频编解码模块解码后的线性脉码调制录音格式的音频数据进行合成。所述的系统进一步包:fe:音频输出模块,用于输出所述音频编解码模块解码后的音频数据;视频输出模块,用于输出所述视频编解码模块解码后的视频数据。进一步地,所述多媒体文件,包括所述移动终端上支持的各种格式的音 乐、动画以及^L频短片。进一步包括一判断模块和定时器,其中,所述判断模块,用于判断所述 移动终端上是否插入耳机,如没有插入耳机则提示用户插入耳才几并启动所述 定时器定时,如所述定时器的规定时间内不插入耳机则结束退出系统;如有 插入耳机或所述定时器的规定时间内插入耳机,则指示所述多J 某体编解码模 块工作。与现有技术相比较,本发明可以将用户需要的音效添加到原有多媒体素 材中,这样一来移动终端(手机)不再只单纯的播放音乐等多媒体文件,还 可以用来录制合成多媒体,产生个性化的铃声和多媒体短片。
图1是本发明所述的在移动终端上实现录音合成的方法流程图; 图2是本发明所述的在移动终端上实现录音合成的系统结构图。
具体实施方式
本发明在这里提供了 一种在移动终端上实现录音合成的方法和系统,以 实现用户利用移动终端(手机)上提供的录音合成功能,可以自己录音为已 有的多媒体素材配音的问题。以下对具体实施方式
进行详细描述,但不作为 对本发明的限定。实现本发明所述方法的整个功能的具体工作流程,如图1所示,具体步骤如下第一步,在手机菜单中提供录音合成的功能项,或者提供相应的快捷键; 第二步,进入录音合成功能时,如果手机上没有插入耳机,提示需要耳 机。如果插入耳机,则打开一个文件管理器,从中可以选择想要为其配音的多媒体文件;第三步,选中移动终端上要为其配音的多媒体文件后,对多媒体文件中 的音频数据和视频数据进行拆分,对拆分后生成的音频数据和^L频^t据进行 解码,生成解码后的视频数据和线性PCM ( Pulse Code Modulation,脉码调 制录音)格式的音频数据并输出,开始播放该多媒体文件;第四步,播放多媒体文件时,将解码后的视频数据和线性脉码调制录音 格式的音频数据在手机的内存中做备份(这里如果录音合成前后的视频格式 相同,则将视频解码前的数据直接用作视频备份,否则将视频解码后的视频 数据,再进行相应的编码后再用作备份);同时开始录音,录音是从音频输 入才莫块输入PCM才各式的音频数据;第五步,用PCM音频叠加算法将输入(录制)的音频数据和输出的解 码后的线性PCM格式的数字音频数据合成在一起并进行编码,然后与相应 的图片、视频数据等信息一起重新编码,并存放到一个临时文件中;第六步,当多媒体文件播放完后,用户按保存键,弹出编辑框等待用户 输入文件名,当用户输入文件名后,将临时文件改名为输入的文件名。若用 户选择不保存,则将临时文件删除。主芯片,也需要一定的时间(假设为t2)。所以在输入音频和输出的音频或 视频叠加时,不能将当前刚解码的音频或视频数据和正输入的音频数据叠 力口,否则会造成最终合成的多媒体文件中录音错位的问题。应当将当前输入的音频数据和(tl+t2)时间之前解码的输出音频或视频叠加。上述步骤中,对输入和输出的PCM (Pulse Code Modulation,脉码调制 录音)格式的音频数据进行叠加合成时,输入输出的比例因子可以都为0.5。 更进一步的改进是由MMI (人机接口 )为用户提供接口,由手机用户选择配置。这里可以用来为其配音的多媒体文件可以是手机支持的各种格式的音 乐,如midi, mp3等;也可以是动画,如gif, swf等格式;或者是视频短片, 如3gpp、 mp4等格式。但前提条件是手机必须支持该类型的多媒体数据的 解码播放。配音后的多媒体文件的格式为手机默认的格式,可以是mp3, mp4, 3gpp, avi等手机能支持对其进行编解码的格式。因为在配音时,需要一面播放, 一面录音,而作为素材的多媒体文件可 能本身就是音频数据或者带有声音的动画和视频。这里为防止播放的声音被 重新录音与原有声音叠加而造成回音杂音,在所述方法步骤之前,也就是在 本发明所述录音合成方法开始之前还要求必须使用耳机,所以如果在没有插 入耳机的情况下,开启录音合成功能,须弹出提示对话框并启动定时器,要 求用户插入耳机方可使用,否则规定时间内不插入耳机则结束该方法的步骤 并退出。如图2所示,为本发明所述的实现录音合成的系统结构图。 本发明所述的系统中还需要手机设置录音合成菜单项或者快捷键和相 关MMI (人机接口 ),菜单项或者快捷键,用以提供给手机用户,作为录 音合成功能入口; MMI用来进行人机交互;这里还需要设置判断模块,用 于判断移动终端上是否插入耳机,如没有插入耳机则提示用户插入耳机并启 动定时器定时,如定时器的规定时间内不插入耳机则结束退出系统;如有插 入耳机或所述定时器的规定时间内插入耳机,则指示多媒体编解码模块201 工作;多媒体编解码模块201 ,用来对手机上选中的要为其配音的多媒体文件编解码,合并和拆分音频数据和视频数据;音频编解码模块202,用来对多媒体文件拆分后生成的音频数据进行音 频解码,解码后的数据格式为线性PCM数字音频格式,以及对音频叠加模 块207叠加后输出的音频数据进行编码;视频编解码^^莫块203,用来进行视频的编码和解码,具体可以解码图片 和视频等数据;主要是对多媒体编解码模块201拆分后生成的视频数据进行 解码,对视频备份模块205备份后输出的视频数据进行编码;如果录音合成 前后的视频格式相同,则将视频解码前的数据直接发给视频备份模块205, 否则将视频解码后的视频数据,再进行相应的编码后再发给视频备份模块 205;音频备份模块204,用来对解码后的PCM格式的输出音频数据进行备 份,留作与录音进行合成;视频备份模块205,用来对解码前或后的视频(图片)数据进行备份, 留作与录音进行合成;音频叠加模块(混音)207,用来将音频编解码模块解码后的线性脉码 调制录音格式的音频数据和录制的音频数据合成在一起;音频输出模块209,输出音频数据,播放语音和音乐;音频输入模块206,输入音频数据,用于录音,生成线性PCM格式的 音频数据;视频输出模块208,用于显示视频、动画和图片,输出视频编解码模块 203解码后的视频数据。本发明所述系统开始录音合成后,首先从文件系统接口读出需配音的多 媒体数据。然后进行解码,拆分音频和视频数据,如果多媒体文件的素材中 只有音频或者视频,则略过这一步。再对音频和/或视频数据进行解码。对 音频解码后的PCM (Pulse Code Modulation,脉码调制录音)格式的数字音 频数据一面进行输出播放, 一面进行备份,留作录音合成用。对视频解码后 的数据进行输出显示,但对视频数据的备份要分两种情况,如果录音合成后 的视频格式与原多媒体素材的视频格式相同,则可直接用解码前的视频数据 作为备份;如果录音合成前后的视频格式不相同,则需要将解码后的视频数据进行编码后再用作备份。在播放多媒体文件的同时要进行录音,将录音获 得的音频数据与相应时间的音频数据备份,进行叠加混音,然后进行编码。 将编码后的合成音频数据与相应时间的视频数据备份一起进行多媒体文件 的编码,形成最终的录音合成后的多J 某体数据,然后存到文件系统中。与现有技术相比较,本发明实施例所述的方法和系统可以将用户需要的 音效添加到原有多J 某体素材中,这样一来移动终端(手机)不再只单纯的播 放音乐等多媒体文件,还可以用来录制合成多J 某体,产生个性化的铃声和多 媒体短片。当然,本发明还可有其他多种实施例,在不背离本发明精神及其实质的 但这些相应的改变和变形都应属于本发明所附的权利要求的保护范围。
权利要求
1、一种在移动终端上实现录音合成的方法,应用于支持多媒体数据的移动终端中,其特征在于,包括以下步骤选择所述移动终端上要为其配音的多媒体文件,对所述多媒体文件进行音频和视频的拆分,对拆分后生成的音频数据和视频数据进行解码,生成解码后的视频数据和线性脉码调制录音格式的音频数据,并对该解码后的音频数据进行备份,如果录音合成前后的视频格式相同,则将视频解码前的数据直接用作视频备份,否则将视频解码后的视频数据,再进行相应的编码后再用作备份;在所述移动终端上开始录音,生成线性脉码调制录音格式的音频数据,将该录制的音频数据和所述解码后的线性脉码调制录音格式的音频数据合成在一起并进行编码,对所述备份后的视频数据与所述合成编码后的音频数据进行合并编码,并输出。
2、 如权利要求1所述的方法,其特征在于,所述该录制的音频数据和 所述解码后的线性脉码调制录音格式的音频数据合成在一起,进一步为运用 脉码调制录音格式的音频叠加算法,将该录制的音频数据和所述解码后的线 性脉码调制录音格式的音频数据合成在一起。
3、 如权利要求1所述的方法,其特征在于,所述对拆分后生成的音频 数据和^L频数据进行解码,进一步为对拆分后生成的音频数据和视频数据进 行解码并输出。
4、 如权利要求l、 2或3所述的方法,其特征在于,所述多媒体文件, 包括所述移动终端上支持的各种格式的音乐、动画以及视频短片。
5、 如权利要求1所述的方法,其特征在于,所述方法的步骤之前,还 包括判断所述移动终端上是否插入耳机,如没有插入耳机则提示用户插入耳 冲几并定时,如^L定时间内不插入耳才几则结束该方法的步-骤并退出;如有插入 耳机或失见定时间内插入耳机,则继续执行下面步骤。
6、 一种在移动终端上实现录音合成的系统,应用于支持多媒体数据的 移动终端中,其特征在于,包括多媒体编解码模块、音频编解码模块,视频 编解码模块、音频备份模块、视频备份模块、音频输入模块、音频输出模块、 视频输出模块、音频叠加模块,其中所述多媒体编解码模块,用于对选择所述移动终端上要为其配音的多媒体文件中的音频数据和视频数据进行拆分和合并;所述音频编解码模块,用于对所述多媒体编解码模块拆分后生成的音频 数据进行解码,对所述音频叠加模块叠加后输出的音频数据进行编码;所述视频编解码模块,用于对所述多媒体编解码模块拆分后生成的视频 数据进行解码,如果录音合成前后的视频格式相同,则将视频解码前的数据 直接发给所述视频备份模块,否则将视频解码后的视频数据,再进行相应的 编码后再发给所述视频备份模块;所述音频备份模块,用于对所述音频编解码模块输出的音频数据进行备份;所述视频备份模块,用于对所述多媒体编解码模块对多媒体数据拆分后 输出的视频数据或所述视频编解码模块编码后的视频数据进行备份;所述音频输入模块,用于接收录音数据,生成线性脉码调制录音格式的 音频数据;所述音频叠加模块,用于将所述音频输入模块生成的音频数据和所述音 频编解码模块解码后的线性脉码调制录音格式的音频数据进行合成。
7、 如权利要求6所述的系统,其特征在于,所述音频叠加模块,进一 步用于运用脉码调制录音格式的音频叠加算法,将所述音频输入模块生成的 音频数据和所述音频编解码模块解码后的线性脉码调制录音格式的音频数 据进行合成。
8、 如权利要求6所述的系统,其特征在于,进一步包括 音频输出模块,用于输出所述音频编解码才莫块解码后的音频数据; 视频输出模块,用于输出所述视频编解码模块解码后的视频数据。
9、 如权利要求6、 7或8所述的系统,其特征在于,所述多媒体文件, 包括所述移动终端上支持的各种格式的音乐、动画以及视频短片。
10、 如权利要求6所述的系统,其特征在于,进一步包括一判断才莫块和 定时器,其中,所述判断模块,用于判断所述移动终端上是否插入耳机,如 没有插入耳机则才是示用户插入耳机并启动所述定时器定时,如所述定时器的 规定时间内不插入耳机则结束退出系统;如有插入耳机或所述定时器的》见定 时间内插入耳机,则指示所述多媒体编解码模块工作。
全文摘要
本发明公开在移动终端上实现录音合成的方法和系统,其方法包括选择终端上要为其配音多媒体文件,对多媒体文件进行音频和视频的拆分,对拆分后生成音频数据和视频数据进行解码,生成解码后视频数据和线性脉码调制录音格式音频数据,并对该解码后音频数据进行备份,如果录音合成前后视频格式相同,则将视频解码前数据直接用作视频备份,否则将视频解码后视频数据,再进行相应编码后用作备份;终端上开始录音,生成线性脉码调制录音格式音频数据,将该录制音频数据和解码后线性脉码调制录音格式音频数据合成在一起并进行编码,对备份后视频数据与合成编码后音频数据进行合并编码并输出。本发明以实现用户通过移动终端实现录音合成功能的问题。
文档编号H04M1/725GK101261864SQ20081009346
公开日2008年9月10日 申请日期2008年4月21日 优先权日2008年4月21日
发明者吕文化 申请人:中兴通讯股份有限公司