用于嘈杂环境噪里的回放的音频信号整形的利记博彩app
【专利说明】
[0001] 相关申请的夺叉引用
[0002] 本专利申请要求于2012年9月2日由安东尼· J ·苏提交的题为"音频回放系统 的自适应信号整形"的临时申请号61/696216和于2012年9月7日由安东尼· J ·苏提交 的题为"使用IIR滤波器实现低时延自适应信号整形"的临时申请号61/697807优先权为。 上述引用的临时专利申请被视为完全包含在本专利申请里。
技术领域
[0003] 本发明涉及音频信号处理领域,更准确地说涉及噪音环境里提升音频信号回放质 量的解决方案。
【背景技术】
[0004] 自从手机的出现,手机用户总会碰到典型问题。当用户在嘈杂的环境中通话时,如 在行驶的汽车里,或嘈杂的酒吧里等,一般都很难听清、听懂对方。即使对方是在安静的环 境里,而且说话的语音质量很高也是如此。导致这一困难的原因是,人的听觉系统要求音频 或语音信号能量至少高于环境噪音一定的额度才能保证足够的可懂度。此外,通讯行业广 为人知的另一现象是,音频或语音信号能量还要有更高的能量才能让人觉得有舒适的通话 质量。尽管这些指标并不容易量化,但这种现象是很容易证明的,例如在一辆高速行驶的汽 车里为了让音乐欣赏舒适,用户会将音量调得远比汽车静止时大。同样的现象,在嘈杂的环 境中人们常常会喊叫着与对方交谈,而这样的喊叫对话生成的音量比在安静的环境里正常 交谈要高很多。
[0005] 从用户的角度而言,手机的设计和制造是为了再现远端呼叫者的声音并保持一定 质量的"真实度"。而这种真实度是假设用户通话的环境是在家中或办公室等相对安静的环 境。例如国际电联标准委员会(ITU-T)在制定给通讯设备如移动电话使用的语音编解码国 际标准时使用信噪比(SNR) 20dB或15dB作为典型〃噪音〃环境测试条件。遗憾的是,在现 实生活中,这样理想的环境并不总能得到保证,用户经常必须在非常嘈杂的条件下进行对 话,此时用户听见的质量或通话的体验质(QoE)不可避免地会恶化。目前用户的唯一选择 是将手机音量调到最大,但如果这还不能保证较为满意的通话,他们通常会非常无奈地选 择提前终止电话。
[0006] 在个人信息娱乐/通讯行业,便携式产品如苹果iPod?,ipad?,任天堂DS?和 索尼的PSP?,都会由于类似上述环境噪音的影响而导致用户的体验降低。当环境噪音较 强时,目前用户的唯一选择是将音量调高到设备的最大回放能力。这不仅不理想,还可能有 危害,尤其对年幼的用户,因为年轻的孩子最有可能使用这种类型的娱乐设备,而在嘈杂的 环境中长时间被迫使用最大音量必然导致他们听力系统的永久性损害。
[0007] 因此,业界迫切需要有效的在噪音环境里不是仅仅通过提高回放音量来提升用户 体验的解决方案(计算机程序)。
【发明内容】
[0008] 本发明克服以前技术的弱点,提出一种基于音频或语音信号能量和频谱整形技 术,自适应调整音频或语音信号来补偿由环境噪音导致的影响从而提高用户在噪音环境里 体验值QOE的系统和方法。在本发明的首选实施中,用无限脉冲响应线性滤波器(IIR)来 实现频谱及能量的调整。这一方案的优点是时延非常短,对移动电话等应用非常有利。而 在其它实施中,可以使用不同的信号整形技术如通过快速傅里叶变换(FFT)实现的频谱领 域的调整,或是使用有限脉冲响应线性滤波器(FIR)。在一些对时延不敏感的应用,如音乐 欣赏系统等,这些替代技术都是可行的。无论如何,使用任何不同的信号频谱整形技术并 不代表背离本发明包含的范围和广度。同时,由于信号能量的变化,使用多级自动增益控制 (AGC)技术提供合适的增益,连同精心设计的限幅技术,可以进一步保持某些低能量信号的 可懂度。
[0009] 在实例中,本发明可用来实现提高手机或信息娱乐终端用户体验值的低时延自适 应信号整形技术。应用于远端语音信号或局部重新复制的音频信号的整形技术以该远端语 音或重新复制的音频信号通过扬声器或耳机回放之前的近端环境噪音的特点为依据。可以 预料这种技术可以用在任何用户可能在嘈杂环境里听音频信号的应用,如汽车音响系统, 火车或飞机里的广播系统等。在此所使用的术语"远端音频信号"指的是远端语音信号, 或是由信息娱乐终端或MP3播放器等本地生成的音频信号。
[0010] 在本发明的实施例中,自适应信号整形技术会根据环境噪音的特征来改变从远端 发来的语音信号或是局部重新生成的音频信号的音量或频谱,这些噪音特征包含噪音强 度、噪音类型如车里的稳态噪音,或是大街上、机场里、嘈杂的餐馆、或其它类似的公共场所 里的快速变化的噪音。
[0011] 在本发明的方面,信号调整是由从一组预先准备好的滤波器中根据需要选出的具 有最理想的频谱修改特征的滤波器完成。预先准备好的滤波器例子可以是一组IIR滤波 器。按照本发明,IIR滤波器可以提供所需的频谱和信号能量调整而不增加太多时延,从而 实现低时延信号整形。同时,为了保持一些低能量信号的可懂度,实施本发明的实例中使用 多级自动增益控制(AGC)技术,连同精心设计的限幅技术。
[0012] 本发明的其它方面在下面通过对插图的解释和细节的描述自然会变得更加一目 了然。
【附图说明】
[0013] 图IA是可使用本发明的多种不同方案的典型移动电话系统的方框图。
[0014] 图IB是可使用本发明的多种不同方案的典型音频信号播放器的方框图。
[0015] 图2A/2B分别显示更详细的移动电话和音频回放系统复制音频/语音的流程图。
[0016] 图3阐述由于环境噪音的增加导致用户语音质量体验下降的典型原因。
[0017] 图4A描述在低噪音和强噪音环境下最为理想的信号整形特征
[0018] 图4B显示一组适用于本发明的信号整形滤波器特征
[0019] 图5展示环境噪音所具有的典型时变特征
[0020] 图6A展示用本发明来实现的一个典型自适应调整移动终端接收到的远端数字语 音的方法和系统的流程及框图。
[0021] 图6B展示用本发明来实现的另一个典型自适应调整移动终端接收到的远端数字 语音的方法和系统的流程及框图。
[0022] 图7展示用本发明来实现的一个典型自适应调整移动终端接收到的远端模拟语 音的方法和系统的流程及框图。
[0023] 图8A和8B展示用本发明来实现的各种典型自适应调整音乐欣赏设备重新生成的 数字音频信号的方法和系统的流程及框图。
[0024] 图9展示用本发明来实现的另一个典型自适应调整音乐欣赏设备重新生成的模 拟音频信号的方法和系统的流程及框图。
[0025] 图10描述典型的基于FFT频谱整形技术的时延增加。
[0026] 图11描述典型的基于FIR滤波器频谱整形技术的时延增加。
[0027] 图12描述典型的基于IIR滤波器频谱整形技术的时延增加。
[0028] 图13描述一个本发明中使用了多级增益的实施例。
[0029] 图14描绘一个可以实现本发明的计算机系统。
【具体实施方式】
[0030] 本发明可在此通过功能模块组件和各种处理步骤进行描述。这些功能模块可以以 任何数量的硬件组件或软件单元通过配置来实现指定的功能。例如,本发明可以使用各种 集成电路元件,如存储器元件,数字信号处理单元,逻辑单元,数据表格等,在一个或多个微 处理器或其它控制装置的控制下实现各种功能。此外,本领域技术人员会明白,本发明与任 何数据和语音传输协议完全兼容,所以在此描述的系统仅仅是本发明的一个示范性应用。
[0031] 在本文中描述的任何具体实现只是为了更好地介绍本发明以及其最佳工作模式, 不应该被理解成为对本发明的任何形式的限制。为了简化起见,传统的技术如信号处理,数 据传输,信令,分组交换传输,网络控制,及其它系统功能(以及系统的各个操作部件)可能 不会在这里详细介绍,但熟练的从业人员应该对它们有足够的了解。此外,图中的各种元件 之间的连接线是示范性的连接不同组件的功能关系和/或物理连接。应该指出的是,许多 替代或附加功能关系或物理连接可以在一个实际的通信系统应用里实现。
[0032] 图IA示出一个典型的移动电话/个人通讯系统,其中移动电话110和130,通过 它们之间的一定的无线和有线连接手段111,112和113耦合在一起。当远端用户对着麦克 风说话时,语音信号被麦克风截取,其生成模拟远端语音信号102。根据移动电话、无线接 入/传输系统必须支持的任意无线通标准,该语音信号102然后由远端的移动电话发射机 103接收,其通过无线/有线连接将语音信号发送给近端移动电话130。一旦被近端移动电 话130收到,语音信号将先被转换回其模拟形式,其被称为接收到的远端语音模拟信号(简 称远端语音)