用于嘈杂环境噪里的回放的音频信号整形的利记博彩app_2

文档序号：8367530阅读：来源：国知局

138,然后通过扬声器或耳机回放。使用近端手机的用户，如在嘈杂的酒吧或在行驶中的车辆里的情况中，可能会或不会受到环境噪音131的影响。应该指出的是，近端环境噪音131将被近端移动电话的麦克风截取，以作为近端移动电话发射机133的麦克风输入信号132的一部分。
[0033] 图IB显示了一个典型的音频回放系统160如MP3播放器。音频媒体文件存储在某种存储器161，如硬盘，存储卡等。当用户决定播放一个音频文件，媒体文件将被从存储器 161中送给音频信号再生系统162,其再生通过扬声器或耳机回放的音频信号165。使用音频回放系统的用户，如在嘈杂的酒吧或在行驶中的车辆里的情况中，可能会或不会受到环境噪音的影响。
[0034] 图2A描绘一个典型移动电话系统中在数字到模拟转换器（D/A)210之前和之后由近端手机收到的远端语音。值得注意的是，几乎所有的现代移动电话系统都是基于数字信号传输，接收到的远端语音信号首先是以数字信号形式230存在，之后通过D/A转换器210 转换回模拟信号形式235。模拟远端语音然后馈送到一个可调音量放大器237再被传递到扬声器或耳机。图2B描绘用于音频重放系统中类似的信号处理路径。
[0035] 在这里的例子里，数字远端语音信号采样率，接收到的数字远端语音采样率和近端噪音采样率被假定是相同的，在典型的通信系统通常这一假设是成立的。使用相同的采样率能简化语音处理同时避免需要在时间上调整语音样本。因此，为简单起见，在对实施例描述时，我们假设不同信号的采样速率相等。然而在实践中，如果采样率彼此不同，则众所周知的技术，例如到音频信号重新上采样或重新下采样可以用执行以确保音频样本在时间上的一致性。这些技术是本领域技术人员所熟悉的，从而包含在本发明的范围内。因此，相同采样率音频系统例子的使用不应被解释为限制本发明的范围和广度。
[0036] 现在参照图3,可以看出语音信号310的典型频谱具有非常明显的特点：在高频率区域的能量明显低于在低频率区域的能量。而典型环境噪音的频谱320在高于I. 5kHz的区域几乎是平的。
[0037] 由于这种明显的频谱差异，在低能量环境噪音时，语音信号的能量在整个频谱基本上都能保持在噪音整个频谱330之上，因此环境噪音导致的影响是轻微的，没有必要进行特殊的信号修改。然而，随着噪音水平的增加，交叉（即噪音能量大于语音信号能量）的发生将频繁的出现在高频率区域，如图340所示，使语音中的高频信号分量部分或完全变得不能被人的听觉系统听见。
[0038] 在很强环境噪音的严重情况下，有必要保持语音信号的频谱处于噪音之上从而使得对话或享受仍然可能，特别是在影响人类听懂度或人类感知的关键频段390。修改信号的一种常用的方法是简单的增加音量（或放大器增益）。遗憾的是，所有的手机或便携娱乐设备都只有一定增加音量的能力，此外，通过简单放大生成的过高能量的低频信号会让人的听觉系统生成烦扰，甚至有害因为永久性损害可能出现。所以更有利的方法是：在噪音增强时，利用一个自适应的信号整形技术对语音或音频信号进行调整从而提高影响听力的关键频段390的能量。
[0039] 图4A描述一个实现本发明的案例中信号整形的两个极端情况。在这个例子里一个移动电话和语音信号采样率为8千赫兹（KHz)，所以频率带通是4KHz。对于低噪音情况 430,使用的是几乎不改变频谱或能量的滤波器410。结果是对语音信号没有任何改变，因为此时语音信号总是高于环境噪音，所以没有整形的必要。
[0040] 另一方面对于高噪音情况440, 一个强势的频谱整形滤波器450,及其相关的增益因子被用来优化语音信号。对于高噪音情况440期望的结果是大幅度感知增强的语音信号 441 〇
[0041] 应该指出的是，在本发明的一个实施例中，利用如上文440中提到的强势信号整形，所生成的信号，相对低频率区域（200Hz到IkHz之间）而言，将在高频区（I. 5kHz到3kHz 之间）有一个明显增加的能量，与原始信号相比，有时称之为频谱倾斜452,或频谱整形增益451。例如，当远端语音频谱在低频区域有一个-18dB的峰和高频区有一个-45dB的峰，即27dB的差异。经过强信号整形后，差异可以降低为12dB甚至更少，导致在感知敏感频带有15dB以上的增益，从而提高在强噪音环境下变形后语音信号的感知质量。
[0042] 由于可听见的环境噪音通常的各种特征的范围都很广，例如它的能量范围可以从-IOdBm到-50dBm，本发明的一个示范性实施例使用12个预制信号整形滤波器，每一个都设计成适合于一定范围内的环境噪音。值得注意的是，当环境噪音很低时，例如在-60dBm 或以下，其影响变得几乎听不见。因此没有理由担心在这个范围内对用户感知的影响。
[0043] 在本发明的其它实施例中，可以选择限制到音频信号实施的最大频谱倾斜或频谱整形增益，例如根据不同的应用情况，任何大于2-3dB的增益已经可以生成明显的效果。
[0044] 在本发明的另一实施例即图4B中，一组预制的信号整形滤波器的频谱整形增益可以逐渐从OdB 471提高到25dB以上474,其中一些滤波器只能增加频谱整形增益约 l-3db范围，例如472,其它滤波器能够增加频谱整形增益达20-25dB范围474,而剩下的滤波器覆盖中间范围473。
[0045] 滤波器系数可以存储在存储设备如移动电话的本地存储单元或其它存储装置。可替换地，在本发明的另一实施例中，简单规则可以生成并且使用，使得实时或"即时"计算所需的滤波器系数。例如，在本发明的一个示范性实现中，同样阶数的IIR滤波器被用来实现信号整形，而一个技术熟练的从业人员知道，任何两个这样的线性滤波器的线性组合也是线性滤波器。
[0046] 在本发明的另一实施例中音频回放系统的音频信号采样率为44. IkHz或类似，频谱整形滤波器以及环境噪音都需要妥善安排以支持这样的采样率。在该领域技术熟练的人都能理解，这些安排可以在不背离本发明主要步骤的基础上实现。
[0047] 环境噪音的另一个特征是随时间而变化如图5所示。常见的是噪音有较低的时候 501，快速变化的时候502,各种中等程度504或强噪音阶段503, 505。根据实际的环境噪音强度与特征，理想的或最适合用于远端语音信号的整形也应该随着时间而变化。在本发明的另一实施例中，自适应系统的使用更适合于这一时变环境噪音的特征。
[0048] 图6A描述一个使用于根据本发明的一个实施方式的移动电话的自适应语音信号整形系统600实施例。数字远端语音信号630由移动电话接收电路610重新再生。近端噪音信号632持续由近端手机麦克风获取，不时与近端用户生成的近端语音掺合在一起。近端噪音的特点，如能量和或表示的频谱信息的参数，通过信号处理模块601被确定。近端噪音特征通过模块602检查以确定环境噪音是否与最后一次确定有变化。如果没有变化，没有更新环境噪音参数的必要，噪音检测模块回到环境噪音监测模式。然而，如果环境噪音发生了变化，那么新的噪音参数将被保存603,之后模块601回到监测环境噪音。
[0049] 储存在603的噪音参数由模块605用来确定增强远端语音信号整形滤波器组中的最佳选择，在一组至少有一个预定的或预存储的整形滤波器604中利用或不利于相关音量调整系数（能量增益），利用或不利于相关音量调整系数来增强前端语音信号。除了最佳信号整形滤波器之外，模块605可以另外或改为从一组至少一个预定的或预存储的自动增益控制（AGC)中选择自动增益控制（AGC)，该组具有变化的增益量，其可用于增强模块606中的远端语音信号630。一个本发明的示范性实施例中使用AGC的进一步细节在下文结合图 13来描述。
[0050] 在其决定中，模块605有可能考虑某些远端语音信号特征，如信号强度，频谱，信号的类型（即仅语音信号，或仅音乐信号，或两者都有），和远端语音中含有的远端噪音等级。当信号整形滤波器和能量增益的选择做出后，下一步是整形滤波器模块606将选择的滤波器和能量增益用来调整远端语音信号，然后输出到数字模拟转换器620。
[0051] 如前所述，更换信号整形滤波器的触发点是当环境噪音特征发生改变，如它的等级或类型，因此，在本发明的一个低复杂度示范实现中，可以将模块602,603,和605组合在一起。
[0052] 对于熟悉信号处理的技术人员来说，许多方法可以用来实现在此描述的信号整形技术，而且本发明不局限于任何特定的实现范例中描述的信号整形技术，包括但不限于以下内容：
[0053] 前文提到的信号整形可以在时域通滤波器或中频域使用基于FFT的方法来实现，以达到类似或相似的信号频谱及音量的调整。
[0054] 图6B描述一个图6A中不范实施的一个微小变形，即图

完整全部详细技术资料下载

当前第2页1 2 3 4 5