用于主动式噪声消除的自动控制的系统、方法、设备及计算机可读媒体的利记博彩app

文档序号:2824764阅读:445来源:国知局
专利名称:用于主动式噪声消除的自动控制的系统、方法、设备及计算机可读媒体的利记博彩app
技术领域
本发明涉及音频频率信号的处理。
背景技术
主动式噪声消除(ANC,也称为主动式噪声降低)为一种技术,其通过产生为噪声波的反相形式(例如,具有相同电平及反相相位)的波形(也称为“反相”或“抗噪声”波形)来主动降低周围声响噪声。ANC系统一般使用一个或一个以上麦克风来拾取外部噪声参考信号、从所述噪声参考信号产生抗噪声波形,且经由一个或一个以上扬声器再生所述抗噪声波形。此抗噪声波形破坏性地干扰原始噪声波以降低到达用户的耳的噪声的电平。ANC系统可包括围绕用户的耳的壳层或插入到用户的耳道中的耳塞(earbud)。执行ANC的装置通常封闭用户的耳(例如,闭耳式头戴耳机),或包括适配于用户的耳道内的耳塞(例如,无线耳机,例如Bluetooth 耳机)。在用于通信应用的头戴式耳机中,设备可包括麦克风及扬声器,其中所述麦克风用以俘获用户的语音以用于传输,且所述扬声器用以再生所接收的信号。在此状况下,麦克风可安装于支架上且扬声器可安装于耳杯或耳塞中。主动式噪声消除技术可应用于例如头戴式耳机及个人通信装置(例如,蜂窝式电话)的声音再生装置,以降低来自周围环境的声响噪声。在这些应用中,ANC技术的使用可降低到达耳的背景噪声的电平(例如,高达二十分贝),同时递送有用的声音信号,例如音乐及远程语音。

发明内容
—种根据一般配置的处理再生音频信号的方法包括基于来自所感测多声道音频信号的第一声道的信息及来自所述所感测多声道音频信号的第二声道的信息而产生噪声估计。此方法还包括基于来自噪声估计的信息相对于再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带,以产生均衡音频信号。此方法还包括基于来自所感测噪声参考信号的信息而产生抗噪声信号,及组合所述均衡音频信号与所述抗噪声信号以产生音频输出信号。此方法可在经配置以处理音频信号的装置内执行。一种根据一般配置的计算机可读媒体具有有形特征,所述有形特征存储机器可执行指令,所述机器可执行指令在由至少一个处理器执行时使所述至少一个处理器执行此方法。一种根据一般配置的经配置以处理再生音频信号的设备包括用于基于来自所感测多声道音频信号的第一声道的信息及来自所述所感测多声道音频信号的第二声道的信息而产生噪声估计的装置。此设备还包括用于基于来自噪声估计的信息相对于再生音频信号的至少一个频率副频带提升再生音频信号的至少一个其它频率副频带以产生均衡音频信号的装置。此设备还包括用于基于来自所感测噪声参考信号的信息而产生抗噪声信号的装置,及用于组合均衡音频信号与抗噪声信号以产生音频输出信号的装置。一种根据一般配置的经配置以处理再生音频信号的设备包括空间选择性滤波器, 其经配置以基于来自所感测多声道音频信号的第一声道的信息及来自所感测多声道音频信号的第二声道的信息而产生噪声估计。此设备还包括均衡器,其经配置以基于来自噪声估计的信息相对于再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带,以产生均衡音频信号。此设备还包括主动式噪声消除滤波器,其经配置以基于来自所感测噪声参考信号的信息而产生抗噪声信号;及音频输出级,其经配置以组合均衡音频信号与抗噪声信号以产生音频输出信号。


图IA展示根据一般配置的设备AlOO的框图。图IB展示设备AlOO的实施方案A200的框图。图2A展示耳杯EClO的横截面。图2B展示耳杯EClO的实施方案EC20的横截面。图3A展示阵列RlOO的实施方案R200的框图。图;3B展示阵列R200的实施方案R210的框图。图3C展示根据一般配置的通信装置DlO的框图。图4A至图4D展示多麦克风便携型音频感测装置DlOO的各种视图。图5展示耳机的不同操作配置的范围66的图式。图6展示安装于用户的耳上的耳机的俯视图。图7A展示装置DlOO内的位置的三个实例,用以俘获所感测多声道音频信号SS20 的声道的阵列的麦克风可位于所述位置。图7B展示装置DlOO内的位置的三个实例,用以俘获所感测噪声参考信号SSlO的麦克风可位于所述位置。图8A及图8B展示装置DlOO的实施方案D102的各种视图。图8C展示装置DlOO的实施方案D104的视图。图9A至图9D展示多麦克风便携型音频感测装置D200的各种视图。图IOA展示装置D200的实施方案D202的视图。
图IOB展示装置D200的实施方案D204的视图。图IlA展示设备AlOO的实施方案Al 10的框图。图IlB展示设备AllO的实施方案Al 12的框图。图12A展示设备AlOO的实施方案A120的框图。图12B展示设备A120的实施方案A122的框图。图13A展示设备AllO的实施方案Al 14的框图。图13B展示设备A120的实施方案AlM的框图。图14A至图14C展示用于将噪声电平值映射到ANC滤波器增益值的不同量变曲线的实例。图14D至图14F展示用于将噪声电平值映射到ANC滤波器截止频率值的不同量变曲线的实例。图15展示用于双态ANC滤波器的磁滞机制的实例。图16展示所感测多声道信号SS20的一区段的频率分量的到达方向的实例直方图。图17为根据一般配置的设备AlO的框图。图18展示根据一般配置的方法MlOO的流程图。图19A展示任务T300的实施方案T310的流程图。图19B展示任务T300的实施方案T320的流程图。图19C展示任务T400的实施方案T410的流程图。图19D展示任务T400的实施方案T420的流程图。图20A展示任务T300的实施方案T330的流程图。图20B展示任务T200的实施方案T210的流程图。图21展示根据一般配置的设备MF100的流程图。图22展示均衡器EQlO的实施方案EQ20的框图。图23A展示副频带滤波器阵列FA100的实施方案FA120的框图。图2 展示级联双二阶滤波器的转置直接形式II实施方案的框图。图M展示双二阶峰化滤波器的量值及相位响应。图25展示副频带滤波器阵列FA120的级联实施方案中的一组七个双二阶中的每一者的量值及相位响应。图沈展示副频带滤波器阵列FA120的三级双二阶级联实施方案的实例的框图。图27展示根据一般配置的设备A400的框图。图28展示设备AlOO及设备A400两者的实施方案A500的框图。
具体实施例方式除非明确受上下文限制,否则术语“信号”在本文中用以指示其普通意义中的任一者,包括如导线、总线或其它传输媒体上所表达的存储器位置(或存储器位置的集合)的状态。除非明确受上下文限制,否则术语“产生”在本文中用以指示其普通意义的任一者,例如计算或以其它方式产生。除非明确受上下文限制,否则术语“计算”在本文中用以指示其普通意义的任一者,例如计算、评估、估计,及/或从多个值中选择。除非明确受上下文限制,否则术语“获得”用以指示其普通意义中的任一者,例如计算、导出、接收(例如,从外部装置)及/或检索(例如,从存储元件阵列)。除非明确受上下文限制,否则术语“选择”用以指示其普通意义中的任一者,例如识别、指示、应用,及/或使用两者或两者以上的集合中的至少一者及少于全部。在本描述及权利要求书中使用术语“包含”的情况下,其并不排除其它元件或操作。术语“基于”(如在“A基于B”中)用以指示其普通意义中的任一者,包括以下状况⑴“从…导出”(例如,“B为A的前体”),(ii) “至少基于”(例如,“A至少基于B”),及如果在特定上下文中为适当的,(iii) “等于”(例如,“A等于B”或“A与B相同”)。类似地,术语“响应于”用以指示其普通意义中的任一者,包括“至少响应于”。除非上下文另外指示,否则对多麦克风音频感测装置的麦克风的“位置”的提及指示麦克风的声学敏感面的中心的位置。根据特定上下文,术语“声道”有时用以指示信号路径且在其它时间指示由此路径载运的信号。除非另外指示,否则术语“系列”用以指示两个或两个以上条目的序列。术语“对数”用以指示以十为基数的对数,但此运算扩展至其它基数在本发明的范畴内。术语“频率分量”用以指示信号的一组频率或频带当中的一者,例如信号的频域表示的样本(或“频段”)(例如,如由快速傅立叶变换产生)或信号的副频带 (例如,巴克(Bark)标度或美尔(mel)标度副频带)。除非另外指示,否则具有特定特征的设备的操作的任何揭示内容也明确地意在揭示具有相似特征的方法(且反之亦然),且根据特定配置的设备的操作的任何揭示内容也明确地意在揭示根据相似配置的方法(且反之亦然)。术语“配置”可如由其特定上下文所指示而关于方法、设备及/或系统使用。除非特定上下文另外指示,否则术语“方法”、“过程”、“程序”及“技术”一般地且可互换地使用。除非特定上下文另外指示,否则术语“设备” 及“装置”也一般地且可互换地使用。术语“元件”及“模块”通常用以指示更大配置的一部分。除非明确受上下文限制,否则术语“系统”在本文中用以指示其普通意义中的任一者, 包括“相互作用以实现共同目的的一群元件”。通过引用文件的一部分而作出的任何并入也应理解为并入在所述部分内所提及的术语或变量的定义(其中这些定义在文件中的别处出现)以及在所并入的部分中所提及的任何图式。近场可定义为相距声音接收器(例如,麦克风阵列)小于一个波长的空间区域。在此定义下,距所述区域的边界的距离与频率相反地变化。举例来说,在两百、七百及两千赫兹的频率下,距一个波长的边界的距离分别为约170、49及17厘米。替代地认为近场/远场边界处于距麦克风阵列的特定距离(例如,距所述阵列的一麦克风或距所述阵列的质心 50厘米,或距所述阵列的一麦克风或距所述阵列的质心1米或1. 5米)处可为有用的。可互换地使用术语“编码器”、“编解码器”及“编码系统”以表示一系统,所述系统包括经配置以接收且编码音频信号的帧(可能在例如感知加权及/或其它滤波操作的一个或一个以上预处理操作之后)的至少一个编码器及经配置以产生帧的解码表示的相应解码器。此编码器及解码器通常部署于通信链路的相对终端处。为了支持全双工通信,编码器及解码器两者的例子通常部署于此链路的每一端处。在此描述中,术语“所感测音频信号”表示经由一个或一个以上麦克风接收的信号,且术语“再生音频信号”表示从信息再生的信号,所述信息是从存储装置检索及/或经由与另一装置的有线或无线连接而接收。音频再生装置(例如,通信或播放装置)可经配置以将再生音频信号输出到所述装置的一个或一个以上扬声器。或者,此装置可经配置以将再生音频信号输出到耳承、其它耳机,或经由导线或以无线方式耦合到所述装置的外部扬声器。参考用于语音通信的收发器应用(例如,电话),所感测音频信号为待由收发器传输的近端信号,且再生音频信号为由收发器接收(例如,经由无线通信链路)的远端信号。 参考移动音频再生应用,例如所记录的音乐、视频或话音(例如,MP3编码音乐文件、电影、 视频剪辑、有声书、播客)的播放或此内容的流式传输,再生音频信号为被播放或流式传输的音频信号。可能需要结合所要音频信号的再生来使用ANC。举例来说,用于收听音乐的听筒或头戴式耳机,或用以在电话呼叫期间再生远端说话者的语音的无线耳机(例如, Bluetooth 或其它通信耳机)也可经配置以执行ANC。此装置可经配置以在扬声器上游将再生音频信号(例如,音乐信号或所接收的电话呼叫)与抗噪声信号混频,所述扬声器经布置以将所得音频信号经导引朝向用户的耳。尽管进行了 ANC操作,但环境噪声仍可能影响再生音频信号的可懂度。在一个此实例中,ANC操作在较高频率下不如在较低频率下有效,以致在较高频率下的环境噪声可能仍影响再生音频信号的可懂度。在另一此实例中,可限制ANC操作的增益(例如,以确保稳定性)。在另一此实例中,可能需要在用户的耳中的仅一者处使用执行音频再生及ANC的装置(例如,无线耳机,例如Bluetooth 耳机),以致由用户的另一只耳听到的环境噪声可影响再生音频信号的可懂度。在这些及其它状况下,除执行ANC操作之外,可能还需要修改再生音频信号的频谱以提升可懂度。图IA展示根据一般配置的设备AlOO的框图。设备AlOO包括ANC滤波器FlO,ANC 滤波器FlO经配置以基于来自所感测噪声参考信号SSlO (例如,环境声音信号或反馈信号) 的信息产生抗噪声信号SAlO (例如,根据任何所要数字及/或模拟ANC技术)。滤波器FlO 可经布置以经由一个或一个以上麦克风接收所感测噪声参考信号SS10。此ANC滤波器通常经配置以使所感测噪声参考信号的相位反相,且还可经配置以均衡频率响应及/或匹配或最小化延迟。可由ANC滤波器FlO对所感测噪声参考信号SSlO执行以产生抗噪声信号 SAlO的ANC操作的实例包括相位反相滤波操作、最小均方(LMS)滤波操作、LMS的变型或导出形式(例如,χ滤波LMS,如第2006/0069566号美国专利申请公开案(纳加尔(Nadjar)等人)及其它文献中所描述),及数字虚拟接地算法(例如,如第5,105,377号美国专利(瑞格勒(Ziegler))中所描述)。ANC滤波器FlO可经配置以在时域中及/或在变换域(例如, 傅立叶变换或另一频域)中执行ANC操作。ANC滤波器FlO通常经配置以使所感测噪声参考信号SSlO的相位反相,以产生抗噪声信号SA10。ANC滤波器FlO还可经配置以对所感测噪声参考信号SSlO执行其它处理操作(例如,低通滤波),以产生抗噪声信号SA10。ANC滤波器FlO还可经配置以均衡ANC 操作的频率响应及/或匹配或最小化ANC操作的延迟。设备AlOO还包括空间选择性滤波器F20,空间选择性滤波器F20经布置以基于来自所感测多声道信号SS20的信息产生噪声估计mo,所述所感测多声道信号SS20具有至少一第一声道及一第二声道。滤波器F20可经配置以通过使所感测多声道信号SS20中的用户语音的分量衰减而产生噪声估计WO。举例来说,滤波器F20可经配置以执行方向选择性操作,所述方向选择性操作分离所感测多声道信号SS20的一方向源分量(例如,用户的语音)与所述信号的一个或一个以上其它分量(例如,方向干扰分量及/或扩散噪声分量)。在此状况下,滤波器F20可经配置以移除方向源分量的能量,使得噪声估计NlO包括比所感测多声道音频信号SS20的每一声道所包括的能量少的方向源分量的能量(也就是说,使得噪声估计WO包括比所感测多声道信号SS20的任何个别声道少的方向源分量的能量)。对于所感测多声道信号SS20具有两个以上声道的状况,可能需要配置滤波器F20以对不同声道对执行空间选择性处理操作,且组合这些操作的结果以产生噪声估计mo。空间选择性滤波器F20可经配置以将所感测多声道信号SS20作为一系列区段来处理。典型区段长度的范围为从约5或10毫秒至约40或50毫秒,且所述区段可为重叠 (例如,邻近区段重叠达25%或50%)或非重叠的。在一特定实例中,将所感测多声道信号 SS20划分为一系列非重叠区段或“帧”,每一者具有10毫秒的长度。设备AlOO的另一元件或操作(例如,ANC滤波器FlO及/或均衡器EQ10)也可经配置以将其输入信号作为一系列区段来处理,其使用相同区段长度或使用不同区段长度。可将一区段的能量计算为在时域中的其样本的值的平方的总和。空间选择性滤波器F20可经实施以包括固定滤波器,所述固定滤波器由滤波器系数值的一个或一个以上矩阵来表征。可使用波束成形、盲源分离(BSQ或组合的BSS/波束成形方法来获得这些滤波器系数值。空间选择性滤波器F20还可经实施以包括一个以上级。这些级中的每一者可基于一相应自适应滤波器结构,其系数值可使用从源分离算法导出的学习规则来计算。所述滤波器结构可包括前馈及/或反馈系数,且可为有限脉冲响应 (FIR)或无限脉冲响应(IIR)设计。举例来说,滤波器F20可经实施以包括固定滤波器级 (例如,经训练的滤波器级,其系数在运行时间之前为固定的),接着是自适应滤波器级。在此种状况下,可能需要使用固定滤波器级来产生自适应滤波器级的初始条件。还可能需要执行到滤波器F20的输入的自适应缩放(例如,以确保IIR固定或自适应滤波器组的稳定性)。可能需要实施空间选择性滤波器F20以包括多个固定滤波器级,所述滤波器级经布置,使得所述固定滤波器级中的适当一者可在操作期间被选择(例如,根据各种固定滤波器级的相对分离性能)。术语“波束成形”指代一类技术,所述技术可用于从麦克风阵列(例如,如本文所描述的阵列R100)所接收的多声道信号的方向性处理。波束成形技术使用由麦克风的空间分集引起的在声道之间的时间差来增强从特定方向到达的信号的分量。更确切地说,有可能麦克风中的一者将更直接地定向于所要来源处(例如,用户的口),而另一麦克风可产生来自此来源的相对衰减的信号。这些波束成形技术为用于空间滤波的方法,其操控波束朝向声音源,从而在其它方向上置空值。波束成形技术未对声音源进行假设,但假设来源与传感器之间的几何结构或声音信号自身出于对信号解除混响或区域化声音源的目的而为已知的。可根据数据相依或数据独立波束成形器设计(例如,超导向波束成形器、最小平方波束成形器或统计上最佳的波束成形器设计)来计算波束成形滤波器的滤波器系数值。波束成形方法的实例包括广义旁瓣消除(GSC)、最小方差无失真响应(MVDR),及/或线性约束最小方差(LCMV)波束成形器。注意,空间选择性滤波器F20通常将实施为空值波束成形器, 使得来自方向源(例如,用户的语音)的能量将衰减以获得噪声估计mo。盲源分离算法为仅基于源信号的混合物分离个别源信号(其可包括来自一个或一个以上信息源及一个或一个以上干扰源的信号)的方法。BSS算法的范围包括独立分量分析(ICA),其将“未混合”权重矩阵应用于混频信号(例如,通过使所述矩阵与混频信号相乘)以产生分离的信号;频域ICA或复合ICA,其中滤波器系数值直接在频域中计算;独立向量分析(IVA),其为复合ICA的变型,其使用一来源,在此来源之前为频段当中的预期相依性建模;及例如受约束ICA及受约束IVA的变型,其根据其它先验信息而受约束,所述信息例如为声响源中的一者或一者以上中的每一者相对于(例如)麦克风阵列的轴的已知方向。可在2009年1月22日公开的题为“用于信号分离的系统、方法及设备(SYSTEMS, METHODS, AND APPARATUS FOR SIGNAL SEPARATION) ”的第 2009/0022336 号美国公开专利申请案及在2009年6月25日公开的题为“用于基于多麦克风的话音增强的系统、方法及设备 (SYSTEMS,METHODS,AND APPARATUS FOR MULTI-MICROPHONE BASED SPEECH ENHANCEMENT)” 的第2009/0164212号美国公开专利申请案中找到这些自适应滤波器结构的其它实例,及基于可用以训练这些滤波器结构的ICA或IVA自适应反馈及前馈机制的学习规则。可能需要使用一个或一个以上数据相依或数据独立设计技术(MVDR、IVA等)来产生空间选择性滤波器F20的多个固定空值波束。举例来说,可能需要在查找表中存储离线计算的空值波束,用于在运行时间时在这些空值波束当中选择(例如,如第2009/0164212 号美国公开专利申请案中所描述)。一个此实例针对每一滤波器包括65个复系数,且包括三个滤波器来产生每一波束。或者,空间选择性滤波器F20可经配置以执行方向选择性处理操作,所述操作经配置以针对所感测多声道信号SS20的至少一个频率分量计算来自两个麦克风的信号之间的相位差。相位差与频率之间的关系可用以指示所述频率分量的到达方向(DOA)。滤波器 F20的此实施方案可经配置以根据此关系的值将个别频率分量分类为语音或噪声(例如, 通过比较每一频率分量的值与阈值,所述阈值可为固定的或随时间而调适且针对不同频率可为相同或不同的)。在此状况下,滤波器F20可经配置以产生噪声估计mo作为被分类为噪声的频率分量的总和。或者,滤波器F20可经配置以在相位差与频率之间的关系在宽频率范围(例如,500Hz至2000Hz)内一致时(即,在相位差与频率相关时)指示所感测多声道信号SS20的一区段为语音,且否则为噪声。在任一种状况下,可能需要通过使噪声估计 νιο的频率分量在时间上平滑而降低噪声估计mo中的波动。在一个此实例中,滤波器S20经配置以在测试下的范围中于每一频率分量处应用一方向屏蔽函数,以确定在所述频率下的相位差是否对应于在特定范围内的到达方向(或到达时间延迟),且根据在所述频率范围内的此屏蔽的结果而计算相干性测量(例如,作为所述区段的各种频率分量的屏蔽分数的总和)。此方法可包括将每一频率下的相位差转换为方向的一频率独立指示项,例如到达方向或到达时间差(例如,使得可在所有频率下使用单一方向性屏蔽函数)。或者,此方法可包括将不同相应屏蔽函数应用于在每一频率下观测到的相位差。滤波器F20接着使用相干性测量的值来将区段分类为语音或噪声。在一个此实例中,方向性屏蔽函数经选择以包括用户语音的预期到达方向,使得所述相干性测量的高值指示语音区段。在另一此实例中,方向性屏蔽函数经选择以排除用户语音的预期到达方向(也称为“互补屏蔽”),使得所述相干性测量的高值指示噪声区段。在任一种状况下,滤波器F20可经配置以通过比较区段的相干性测量的值与阈值而将所述区段分类,所述阈值可为固定的或随时间而调适。在另一此实例中,滤波器F20经配置以基于在测试下的频率范围中的个别频率分量的到达方向(或时间延迟)的分布的形状(例如,将个别DOA集群在一起的紧密程度) 来计算相干性测量。如图16的实例中所展示,可使用直方图来计算此测量。在任一种状况下,可能需要配置滤波器F20以仅基于为用户语音的音高的当前估计的倍数的频率来计算相干性测量。或者或另外,空间选择性滤波器F20可经配置以通过执行基于增益的接近选择性操作来产生噪声估计mo。此操作可经配置以在所感测多声道信号SS20的两个声道的能量的比率超过一接近性阈值时(指示信号正从在麦克风阵列的特定轴方向上的近场源到达) 指示所感测多声道信号SS20的区段为语音,且否则指示所述区段为噪声。在此状况下,可基于相对于麦克风对的所要近场/远场边界半径而选择接近性阈值。滤波器F20的此实施方案可经配置以在频域中(例如,在一个或一个以上特定频率范围内)或在时域中对信号进行操作。在频域中,可将频率分量的能量计算为相应频率样本的平方量值。设备AlOO还包括均衡器EQ10,均衡器EQlO经配置以基于来自噪声估计附0的信息修改再生音频信号SRlO的频谱,以产生均衡音频信号SQ10。再生音频信号SRlO的实例包括远端或下行链路音频信号,例如所接收的电话呼叫;及预先记录的音频信号,例如正从存储媒体再生的信号(例如,从MP3、高级音频编解码器(AAC)、视窗媒体音频/视频(WMA/ WMV)或其它音频或多媒体文件解码的信号)。均衡器EQlO可经配置以通过基于来自噪声估计WO的信息相对于信号SRlO的一副频带提升信号SRlO的另外至少一个副频带而均衡信号SRlO。可能需要均衡器EQlO保持不活动,直到再生音频信号SRlO可用为止(例如,直到用户起始或接收电话呼叫,或存取媒体内容或提供信号SRlO的语音辨识系统为止)。图22展示均衡器EQlO的实施方案EQ20的框图,其包括第一副频带信号产生器 SGlOOa及第二副频带信号产生器SGlOOb。第一副频带信号产生器SGlOOa经配置以基于来自再生音频信号SRlO的信息产生一组第一副频带信号,且第二副频带信号产生器SGlOOb 经配置以基于来自噪声估计mo的信息产生一组第二副频带信号。均衡器EQ20还包括第一副频带功率估计计算器EClOOa及第二副频带功率估计计算器EClOOa。第一副频带功率估计计算器EClOOa经配置以产生一组第一副频带功率估计,其各自基于来自第一副频带信号中的对应一者的信息,且第二副频带功率估计计算器EClOOb经配置以产生一组第二副频带功率估计,其各自基于来自第二副频带信号中的对应一者的信息。均衡器EQ20还包括副频带增益因子计算器GC100,其经配置以基于相应第一副频带功率估计与相应第二副频带功率估计之间的关系针对副频带中的每一者计算一增益因子;及副频带滤波器阵列 FA100,其经配置以根据副频带增益因子对再生音频信号SRlO进行滤波以产生均衡音频信号SQ10。可(例如)在2010年1月21日公开的题为“用于增强可懂度的系统、方法、设备及计算机程序产品(SYSTEMS,METHODS,APPARATUS,AND COMPUTER PROGRAM PRODUCTS FOR ENHANCED INTELLIGIBILITY),,的第2010/0017205号美国公开专利申请案中找到均衡器 EQlO的实施方案及操作的其它实例。可能需要基于来自均衡音频信号EQlO的信息对所感测多声道音频信号SS20执行同音消除操作。举例来说,可在如本文所描述的音频预处理器APlO的实施方案内执行此操作。如果噪声估计NlO包括来自音频输出信号A010的未消除的声响回音,则均衡音频信号 SQlO与副频带增益因子计算路径之间可产生正反馈回路,使得基于音频输出信号S010 (例如,如由装置的扬声器再生)的声响信号中的均衡音频信号SQlO的电平越高,则均衡器EQlO将越倾向于增大副频带增益因子。副频带信号产生器SGlOOa及SGlOOb中的任一者或两者可经配置以通过根据所要副频带划分方案将频域信号的频段分群为q个副频带而产生一组q个副频带信号。或者, 副频带信号产生器SGlOOa及SGlOOb中的任一者或两者可经配置以对时域信号进行滤波 (例如,使用副频带滤波器组),以根据所要副频带划分方案产生一组q个副频带信号。副频带划分方案可为均勻的,使得每一频段具有大致相同的宽度(例如,在约百分之十内)。 或者,副频带划分方案可为非均勻的,例如超越方案(例如,基于巴克标度的方案)或对数方案(例如,基于美尔标度的方案)。在一实例中,一组七个巴克标度副频带的边缘对应于频率 20Hz、300Hz、630Hz、1080Hz、1720Hz、2700Hz、4400Hz 及 7700Hz。副频带的此布置可用于具有16kHz的取样率的宽带话音处理系统中。在此划分方案的其它实例中,省略较低副频带以获得六副频带布置及/或高频限制从7700Hz增大至8000Hz。副频带划分方案的另一实例为四频带准巴克方案300Hz至510Hz、510Hz至920Hz、920Hz至1480Hz及1480Hz至 4000Hz。副频带的此布置可用于具有8kHz的取样率的窄带话音处理系统中。副频带功率估计计算器EClOOa及EClOOb中的每一者经配置以接收副频带信号的相应集合,且产生副频带功率估计的相应集合(通常针对再生音频信号SRlO及噪声估计 NlO的每一帧)。副频带功率估计计算器EClOOa及EClOOb中的任一者或两者可经配置以将每一副频带功率估计计算为所述帧的相应副频带信号的值的平方的总和。或者,副频带功率估计计算器EClOOa及EClOOb中的任一者或两者可经配置以将每一副频带功率估计计算为所述帧的相应副频带信号的值的量值的总和。 可能需要实施副频带功率估计计算器EClOOa及EClOOb中的任一者或两者以计算每一帧的整个相应信号的功率估计(例如,作为平方或量值的总和),且使用此功率估计来正规化所述帧的副频带功率估计。可通过将每一副频带总和除以信号总和或从每一副频带总和减去信号总和而执行此正规化。(在除法状况下,可能需要将小值加到信号总和以避免除以零)。或者或另外,可能需要实施副频带功率估计计算器EClOOa及EClOOb中的任一者或两者以执行副频带功率估计的时间平滑操作。副频带增益因子计算器GC100经配置以基于相应的第一副频带功率估计及第二副频带功率估计而计算再生音频信号SRlO的每一帧的一组增益因子。举例来说,副频带增益因子计算器GC100可经配置以将每一增益因子计算为噪声副频带功率估计与相应信号副频带功率估计的比率。在此状况下,可能需要将小值加到信号副频带功率估计以避免除以零。副频带增益因子计算器GC100还可经配置以对功率比率中的一者或一者以上(可能全部)中的每一者执行时间平滑操作。可能需要此时间平滑操作经配置以允许增益因子值在噪声程度增大时更快速地改变及/或在噪声程度减小时抑制增益因子值的迅速改变。 此配置可帮助抵制心理声学时间屏蔽效应,其中高声噪声甚至在噪声已结束之后仍继续屏蔽所要声音。因此,可能需要根据当前增益因子值与先前增益因子值之间的关系使平滑因子的值变化(例如,在增益因子的当前值小于先前值时执行更多平滑,且在增益因子的当前值大于先前值时执行较少平滑)。或者或另外,副频带增益因子计算器GC100可经配置以将上界限及/或下界限应用于副频带增益因子中的一者或一者以上(可能全部)。这些界限中的每一者的值可为固定的。或者,这些界限中的任一者或两者的值可根据(例如)均衡器EQlO的所要边限空间及/或均衡音频信号SQlO的当前音量(例如,音量控制信号的当前的用户控制值)来调适。 或者或另外,这些界限中的任一者或两者的值可基于来自再生音频信号SRlO的信息,例如再生音频信号SRlO的当前电平。可能需要配置均衡器EQlO以补偿由副频带的重叠所引起的过量提升。举例来说, 副频带增益因子计算器GC100可经配置以减小中频副频带增益因子(例如,包括频率fs/4 的副频带,其中fs表示再生音频信号SRlO的取样频率)中的一者或一者以上的值。副频带增益因子计算器GC100的此实施方案可经配置以通过将副频带增益因子的当前值乘以标度因子而执行所述减小,所述标度因子具有小于1的值。副频带增益因子计算器GC100 的此实施方案可经配置以针对待按比例减小的每一副频带增益因子使用同一标度因子,或者针对待按比例减小的每一副频带增益因子使用不同标度因子(例如,基于相应副频带与一个或一个以上邻近副频带的重叠程度)。另外或在替代例中,可能需要配置均衡器EQlO以增大高频副频带中的一者或一者以上的提升程度。举例来说,可能需要配置副频带增益因子计算器GC100以确保再生音频信号SRlO的一个或一个以上高频副频带(例如,最高副频带)的放大不低于中频副频带 (例如,包括频率fs/4的副频带,其中fs表示再生音频信号S40的取样频率)的放大。在一个此实例中,副频带增益因子计算器GC100经配置以通过将中频副频带的副频带增益因子的当前值乘以标度因子而计算高频副频带的副频带增益因子的当前值,所述标度因子大于1。在另一此实例中,副频带增益因子计算器GC100经配置以将高频副频带的副频带增益因子的当前值计算为以下各者中的最大值(A)从所述副频带的功率比率所计算的当前增益因子值,及(B)通过将中频副频带的副频带增益因子的当前值乘以标度因子所获得的值,所述标度因子大于1。副频带滤波器阵列FA100经配置以将副频带增益因子中的每一者应用于再生音频信号SRlO的相应副频带,以产生均衡音频信号SQ10。副频带滤波器阵列FA100可经实施以包括带通滤波器阵列,所述带通滤波器各自经配置以将副频带增益因子中的对应一者应用于再生音频信号SRlO的相应副频带。此阵列的滤波器可并联及/或串联布置。图23A展示副频带滤波器阵列FA100的实施方案FA120的框图,其中带通滤波器F30-1至F30_q经布置以将副频带增益因子G(I)至G(q)中的每一者应用于再生音频信号SRlO的相应副频带,这是通过根据副频带增益因子串行地对再生音频信号SRlO进行滤波(S卩,在一级联中, 使得每一滤波器F30_k经布置以对滤波器F30-(k_l)的输出进行滤波,而进行的。滤波器F30-1至F30_q中的每一者可经实施以具有有限脉冲响应(FIR)或无限脉冲响应(IIR)。举例来说,滤波器F30-1至F30_q中的一者或一者以上(可能全部)中的每一者可实施为二阶IIR部分或“双二阶滤波器”。双二阶滤波器的转移函数可表达为购)= &:;。⑴ \Λ-αχζ + a2z可能需要使用转置直接形式II来实施每一双二阶滤波器,尤其针对均衡器EQlO 的浮点实施方案而言。图2 说明滤波器F30-1至F30_q中的一者F30_i的双二阶实施方案的转置直接形式II结构。图M展示滤波器F30-1至F30_q中的一者的双二阶实施方案的一实例的量值及相位响应曲线。副频带滤波器阵列FA120可实施为双二阶滤波器的级联。此实施方案也可称为双二阶UR滤波器级联、二阶UR部分或滤波器的级联,或级联中的一系列副频带UR双二阶滤波器。可能需要使用转置直接形式II来实施每一双二阶滤波器,尤其针对均衡器EQlO 的浮点实施方案而言。可能需要滤波器F30-1至F30_q的通带表示将再生音频信号SRlO的带宽划分为一组非均勻副频带(例如,使得滤波器通带中的两者或两者以上具有不同宽度)而非一组均勻副频带(例如,使得滤波器通带具有相等宽度)。可能需要副频带滤波器阵列FA120 应用与第一副频带信号产生器SGlOOa的副频带滤波器阵列SG30的实施方案及/或第二副频带信号产生器SGlOOb的副频带滤波器阵列SG30的实施方案相同的副频带划分方案。副频带滤波器阵列FA120甚至可使用与此(些)副频带滤波器阵列相同的分量滤波器来实施 (例如,在不同时间且具有不同增益因子值),图25展示针对如上文所描述的巴克标度副频带划分方案的副频带滤波器阵列FA120的级联实施方案中的一组七个双二阶滤波器中的每一者的量值及相位响应。副频带增益因子G(I)至G(q)中的每一者可用以更新滤波器F30_l至F30_q中的对应一者的一个或一个以上滤波器系数值。在此状况下,可能需要配置滤波器F30-1至 F30_q中的一者或一者以上(可能全部)中的每一者,使得其频率特性(例如,中心频率及其通带的宽度)为固定的且其增益为可变的。可通过仅使前馈系数(例如,上文的双二阶表达式(1)中的系数Iv 1^及132)中的一者或一者以上的值变化来针对FIR或IIR滤波器实施此技术。在一实例中,通过将偏移g加到前馈系数k及从前馈系数ID2减去同一偏移g 以获得以下转移函数,使滤波器F30-1至F30_q中的一者F30_i的双二阶实施方案的增益变化?) +奶-'+歡办―2。⑵
1 +a^/jz + a2 (z Jz在此实例中,值 及 经选择以界定所要频带,值 及Id2相等,且IDci等于1。偏移g可根据例如g = (1- ⑴)(G (i) "I) c的表达式从相应增益因子G⑴计算,其中c为具有小于1的值的正规化因子,所述正规化因子可经调谐,使得在频带的中央实现所要增益。 图沈展示双二阶滤波器的三级级联的此实例,其中将偏移g应用于第二级。可能需要配置均衡器EQlO以使再生音频信号SRlO的一个或一个以上副频带在无提升的情况下通过。举例来说,低频副频带的提升可导致对其它副频带的抑制,且可能需要均衡器EQlO使再生音频信号SRlO的一个或一个以上低频副频带(例如,包括小于300Hz 的频率的副频带)在无提升的情况下通过。可能需要在再生音频信号SRlO不活动的时间间隔期间绕过均衡器EQlO或以其它方式中止或抑制再生音频信号SRlO的均衡。在一个此实例中,设备AlOO经配置以包括对再生音频信号S40进行的语音活动检测操作(例如,根据本文所描述的实例中的任一者), 所述语音活动检测操作经布置以控制均衡器EQlO (例如,通过允许副频带增益因子值在再生音频信号SRlO不活动时衰变)。设备AlOO可经配置以包括自动增益控制(AGC)模块,所述自动增益控制(AGC)模块经布置以在均衡之前压缩再生音频信号SRlO的动态范围。此模块可经配置以提供边限空间定义及/或主音量设定(例如,以控制副频带增益因子的上界限及/或下界限)。或者或另外,设备AlOO可经配置以包括峰值限制器,所述峰值限制器经布置以限制均衡器EQlO 的声响输出电平(例如,以限制均衡音频信号SQlO的电平)。设备AlOO还包括音频输出级A010,音频输出级AOlO经配置以组合抗噪声信号 SAlO与均衡音频信号SQlO以产生音频输出信号S010。举例来说,音频输出级AOlO可实施为混频器,其经配置以通过将抗噪声信号SAlO与均衡音频信号SQlO混频而产生音频输出信号S010。音频输出级AOlO还可经配置以通过以下操作而产生音频输出信号SOlO 将抗噪声信号SA10、均衡音频信号SQlO或所述两个信号的混合物从数字形式转换为模拟形式, 及/或对此信号执行任何其它所要音频处理操作(例如,对此信号进行滤波、放大、将增益因子应用于此信号及/或控制此信号的电平)。音频输出级AOlO还可经配置以将阻抗匹配提供到扬声器或经布置以接收或传送音频输出信号SOlO的其它电接口、光学接口或磁性接口(例如,音频输出插口)。设备AlOO通常经配置以经由扬声器播放音频输出信号SOlO (或基于信号SOlO的信号),所述扬声器可导引于用户的耳处。图IB展示包括设备AlOO的实施方案的设备A200 的框图。在此实例中,设备AlOO经布置以经由阵列RlOO的麦克风接收所感测多声道信号 SS20且经由ANC麦克风AMlO接收所感测噪声参考信号SS10。音频输出信号SOlO用以驱动通常导引于用户的耳处的扬声器SP10。可能需要将产生多声道所感测音频信号SS20的麦克风定位成尽可能远离扬声器 SP10(例如,以降低声响耦合)。又,可能需要定位产生多声道所感测音频信号SS20的麦克风,使得其暴露于外部噪声。关于产生所感测噪声参考信号SSlO的ANC麦克风AM10,可能需要将此麦克风或这些麦克风定位成尽可能接近耳,甚至可能处于耳道中。设备A200可建构为前馈装置,使得ANC麦克风AMlO经定位以感测周围声响环境。 另一类型的ANC装置在噪声降低之后使用麦克风拾取声响错误信号(也称为“残余”或“残余错误”信号),且将此错误信号反馈到ANC滤波器。此类型的ANC系统被称为反馈ANC系统。反馈ANC系统中的ANC滤波器通常经配置以使所述错误反馈信号的相位颠倒且还可经配置以对所述错误反馈信号求积分、均衡频率响应及/或匹配或最小化延迟。在反馈ANC系统中,可能需要将错误反馈麦克风安置于由扬声器产生的声场内。 设备A200可建构为反馈装置,使得ANC麦克风AMlO经定位以感测腔室内的声音,所述腔室封闭用户的听道的开口且将扬声器SPlO驱动到所述腔室中。举例来说,可能需要将错误反馈麦克风与扬声器一起安置于头戴式耳机的耳杯内。还可能需要错误反馈麦克风与环境噪声在声学上隔离。图2A展示可经实施以包括设备AlOO (例如,包括设备A200)的耳杯EClO的横截面。耳杯EClO包括扬声器SP10,其经布置以向用户的耳再生音频输出信号SOlO ;及ANC 麦克风AMlO的反馈实施方案AM12,其导引于用户的耳处且经布置以接收所感测噪声参考信号SSlO作为声响错误信号(例如,经由耳杯外壳中的声响端口)。在此状况下,可能需要隔离ANC麦克风使其免于经由耳杯的材料从扬声器SPlO接收机械振动。图2B展示包括阵列RlOO的麦克风MClO及MC20的耳杯EClO的实施方案EC20的横截面。在此状况下,在使用期间,可能需要将麦克风MClO定位成尽可能接近用户的口。例如耳杯(例如,装置EClO或EC20)或耳机(例如,如下文所描述的装置DlOO或D200)的ANC装置可经实施以产生单声道音频信号。或者,此装置可经实施以在用户的耳中的每一者处产生立体声信号的相应声道(例如,作为立体声听筒或立体声耳机)。在此状况下,在每一耳处的外壳载运扬声器SPlO的相应例子。还可能需要在每一耳处包括一个或一个以上麦克风以为所述耳产生所感测噪声参考信号SSlO的相应例子,且包括ANC滤波器FlO的相应例子以处理其来产生抗噪声信号SAlO的相应例子。阵列的用以产生多声道所感测音频信号SS20的相应例子也是可能的,或者,针对两只耳使用同一信号SS20 (例如, 同一噪声估计WO)可为足够的。对于再生音频信号SRlO为立体声的状况,均衡器EQlO可经实施以根据噪声估计NlO单独处理每一声道。将理解,设备A200将通常经配置以对由麦克风阵列RlOO及/或ANC麦克风AMlO 产生的信号执行一个或一个以上预处理操作,以分别获得所感测噪声参考信号SSlO及所感测多声道信号SS20。举例来说,在典型状况下,麦克风将经配置以产生模拟信号,而ANC 滤波器FlO及/或空间选择性滤波器F20可经配置以对数字信号进行操作,使得预处理操作将包括模/数转换。可在模拟及/或数字域中对麦克风声道执行的其它预处理操作的实例包括带通滤波(例如,低通滤波)。同样,音频输出级AOlO可经配置以执行一个或一个以上后处理操作(例如,滤波、放大及/或从数字转换成模拟等)以产生音频输出信号S010。可能需要产生ANC装置,所述ANC装置具有经配置以接收声响信号的两个或两个以上麦克风的阵列R100。可经实施以包括此阵列且可用于语音通信及/或多媒体应用的便携型ANC装置的实例包括助听器、有线或无线耳机(例如,Bluetooth 耳机),及经配置以播放音频及/或视频内容的个人媒体播放器。阵列RlOO的每一麦克风可具有为全向、双向或单向(例如,心形)的响应。可用于阵列RlOO中的各种类型的麦克风包括(不限于)压电式麦克风、动圈式麦克风及驻极体麦克风。在用于便携型语音通信的装置(例如,手机或耳机)中,阵列RlOO的邻近麦克风之间的中心至中心间隔通常在从约1. 5cm至约4. 5cm的范围中,但更大间隔(例如,高达IOcm 或15cm)在例如手机的装置中也是可能的。在助听器中,阵列RlOO的邻近麦克风之间的中心至中心间隔可小到约4mm或5mm。阵列RlOO的麦克风可沿着一条线布置,或者使得其中心处于二维(例如,三角形)或三维形状的顶点处。在多麦克风ANC装置的操作期间,阵列RlOO产生多声道信号,其中每一声道是基于麦克风中的对应一者对于声响环境的响应。一个麦克风可比另一麦克风更直接地接收特定声音,使得相应声道彼此不同以共同提供比使用单一麦克风所俘获的声响环境更完整的声响环境表示。可能需要阵列RlOO对由麦克风产生的信号执行一个或一个以上处理操作,以产生所感测多声道信号SS20。图3A展示阵列RlOO的实施方案R200的框图,其包括音频预处理级AP10,音频预处理级APlO经配置以执行一个或一个以上这些操作,所述一个或一个以上这些操作可包括(不限于)阻抗匹配、模/数转换、增益控制,及/或在模拟及/或数字域中滤波。图;3B展示阵列R200的实施方案R210的框图。阵列R210包括音频预处理级APlO 的实施方案AP20,实施方案AP20包括模拟预处理级PlOa及PlOb。在一实例中,级PlOa及 PlOb各自经配置以对相应麦克风信号执行高通滤波操作(例如,截止频率为50Hz、100Hz或 200Hz)。
可能需要阵列RlOO产生多声道信号作为数字信号,也就是说,作为样本序列。阵列R210 (例如)包括模/数转换器(ADC) ClOa及ClOb,模/数转换器(ADC) ClOa及ClOb各自经布置以对相应模拟声道进行取样。用于声响应用的典型取样率包括8kHz、12kHz、16kHz 及在从约8kHz到约16kHz的范围中的其它频率,但也可使用高达IMHZ(例如,约44kHz或 192kHz)的取样率。在此特定实例中,阵列R210还包括数字预处理级P20a及P20b,数字预处理级P20a及P20b各自经配置以对相应数字化声道执行一个或一个以上预处理操作(例如,回音消除、噪声降低及/或频谱成形)。当然,将通常需要ANC装置包括类似于音频预处理级APlO的预处理级,所述预处理级经配置以对由ANC麦克风AMlO产生的信号执行这些预处理操作中的一者或一者以上(可能全部)以产生所感测噪声参考信号SS10。设备AlOO可以硬件及/或以软件(例如,固件)实施。图3C展示根据一般配置的通信装置DlO的框图。本文所揭示的ANC装置中的任一者可实施为装置DlO的例子。装置DlO包括芯片或芯片组CS10,芯片或芯片组CSlO包括如本文所描述的设备AlOO的实施方案。芯片/芯片组CSlO可包括一个或一个以上处理器,所述一个或一个以上处理器可经配置以执行设备AlOO的全部或部分(例如,作为指令)。芯片/芯片组CSlO还可包括阵列 RlOO的处理元件(例如,音频预处理级APlO的元件)。芯片/芯片组CSlO还可包括接收器,其经配置以经由无线传输信道接收射频 (RF)通信信号且解码在所述RF信号内编码的音频信号(例如,再生音频信号SR10);及发射器,其经配置以编码基于由设备AlOO产生的经处理信号的音频信号且传输描述所述经编码的音频信号的RF通信信号。举例来说,芯片/芯片组CSlO的一个或一个以上处理器可经配置以处理所感测多声道信号SS20的一个或一个以上声道,使得经编码的音频信号包括来自所感测多声道信号SS20的音频内容。在此状况下,芯片/芯片组CSlO可实施为 Bluetooth 及/或移动台调制解调器(MSM)芯片组。如本文所描述的设备AlOO的实施方案可以多种ANC装置体现,包括耳机及耳杯 (例如,装置EClO或EC20)。具有一个或一个以上麦克风的耳承或其它耳机为一个种类的便携型通信装置,其可包括如本文所描述的ANC设备的实施方案。此耳机可为有线或无线的。举例来说,无线耳机可经配置以经由与例如蜂窝式电话手机的电话装置的通信(例如, 使用如由蓝牙技术联盟有限公司(华盛顿州贝尔维尤市)发布的Bluetooth 协议的一版本)支持半双工或全双工电话。图4A至图4D展示多麦克风便携型音频感测装置D100的各种视图,多麦克风便携型音频感测装置D100可包括如本文所描述的ANC设备的实施方案。装置D100为包括载有多麦克风阵列R100的实施方案的外壳ZlO及听筒Z20的无线耳机,听筒Z20包括扬声器 SPlO且从所述外壳延伸。大体而言,耳机的外壳可如图4A、图4B及图4D中所展示为矩形或另外狭长的(例如,形状如同酷行通耳机(miniboom)),或可更圆化或甚至为圆形。所述外壳还可封闭电池及处理器及/或其它处理电路(例如,印刷电路板及安装于其上的组件), 且可包括电端口(例如,小型通用串行总线(USB)或用于电池充电的其它端口)及例如一个或一个以上按钮开关及/或LED的用户接口特征。通常,外壳沿其主轴的长度是从1英寸到3英寸的范围中。通常,阵列R100的每一麦克风安装于装置内在外壳中的用作声响端口的一个或一个以上小孔的后面。图4B至图4D展示装置D100的两麦克风阵列的主要麦克风的声响端口 Z40及此阵列的次要麦克风的声响端口 Z50的位置,其可用以产生多声道所感测音频信号SS20。在此实例中,主要麦克风及次要麦克风经导引远离用户的耳以接收外部环境声
曰O图5展示在使用期间的耳机DlOO的不同操作配置的范围66的图式,其中耳机 DlOO安装于用户的耳65上且以多种方式经导引朝向用户的口 64。图6展示相对于用户的口以标准定向安装于用户的耳上的耳机DlOO的俯视图。图7A展示阵列RlOO的麦克风可安置于耳机DlOO内所处的若干候选位置。在此实例中,阵列RlOO的麦克风经导引远离用户的耳以接收外部环境声音。图7B展示ANC麦克风AMlO (或ANC麦克风AMlO的两个或两个以上例子中的每一者)可安置于耳机DlOO内所处的若干候选位置。图8A及图8B展示耳机DlOO的实施方案D102的各种视图,实施方案D102包括至少一个额外麦克风AMlO以产生所感测噪声参考信号SSlO。图8C展示耳机DlOO的实施方案D104的视图,实施方案D104包括麦克风AMlO的反馈实施方案AM12以产生所感测噪声参考信号SS10,反馈实施方案AM12导引于用户的耳处(例如,沿着用户的耳道向下)。耳机可包括紧固装置(例如,耳钩^30),其通常可从耳机拆卸。外部耳钩可为可反转的,(例如)以允许用户配置耳机用于任一耳上。或者或另外,可将耳机的听筒设计为内部紧固装置(例如,耳塞),其可包括可移除耳承以允许不同用户使用不同大小(例如,直径)的耳承用于更好地适配于特定用户的耳道的外部部分。对于反馈ANC系统,耳机的听筒还可包括经布置以拾取声响错误信号的麦克风。图9A至图9D展示为无线耳机的另一实例的多麦克风便携型音频感测装置D200 的各种视图,多麦克风便携型音频感测装置D200可包括如本文所描述的ANC设备的实施方案。装置D200包括圆化的椭圆形外壳Z12及听筒Z22,听筒Z22包括扬声器SPlO且可配置为耳塞。图9A至图9D还展示装置D200的多麦克风阵列RlOO的主要麦克风的声响端口 Z42及次要麦克风的声响端口 Z52的位置。有可能次要麦克风端口 Z52可至少部分地闭塞 (例如,通过用户接口按钮)。图IOA及图IOB展示耳机D200的实施方案D202的各种视图, 实施方案D202包括至少一个额外麦克风AMlO以产生所感测噪声参考信号SSlO。在另一实例中,包括如本文所描述的自适应ANC设备(例如,设备A100)的实施方案的处理元件的通信手机(例如,蜂窝式电话手机)经配置以从包括阵列RlOO及ANC麦克风AMlO的耳机接收所感测噪声参考信号SSlO及所感测多声道信号SS20,且经由有线及 /或无线通信链路将音频输出信号SOlO输出到耳机(例如,使用Bluetooth 协议的一版本)。在通信应用中,可能需要将用户自己的语音的声音混合到在用户的耳处播放的所接收信号中。在语音通信装置(例如,耳机或电话)中将麦克风输入信号混合到扬声器输出中的技术被称为“侧音”。通过准许用户听到其自己的语音,侧音通常增强用户舒适度且提高通信效率。ANC装置通常经配置以在用户的耳与外部环境之间提供良好隔音。举例来说,ANC 装置可包括插入到用户的耳道中的耳塞。当需要ANC操作时,此隔音为有利的。然而,在其它时间,此隔音可能阻止用户听到所要环境声音,例如来自另一人的谈话,或例如汽车喇叭、报警器及其它告警信号的警告信号。因此,可能需要配置设备AlOO以提供ANC操作模式,其中ANC滤波器FlO经配置以使环境声音衰减;及通过操作模式(也称为“助听”或“侧音”操作模式),其中ANC滤波器FlO经配置以使所感测周围声音信号的一个或一个以上分量通过,且可能均衡或增强所述一个或一个以上分量。经由接通/断开开关手动地控制当前ANC系统。然而,由于声响环境的改变及/ 或用户使用ANC装置的方式的改变,已手动地选择的操作模式可能不再适当。可能需要实施设备AlOO以包括对ANC操作的自动控制。此控制可包括检测用户正使用ANC装置的方式,及选择适当操作模式。在一实例中,ANC滤波器FlO经配置以在ANC操作模式中产生反相信号,且在通过操作模式中产生同相信号。在另一实例中,ANC滤波器FlO经配置以在ANC操作模式中具有正滤波器增益,且在通过操作模式中具有负滤波器增益。可手动地(例如,经由按钮、触控式传感器、电容接近传感器或超声波手势传感器)及/或自动地执行这两个模式之间的切换。图1IA展示设备AlOO的实施方案Al 10的框图,实施方案Al 10包括ANC滤波器FlO 的可控制实施方案F12。ANC滤波器FlO经布置以根据控制信号SClO的状态对所感测噪声参考信号SSlO执行ANC操作,以产生抗噪声信号SA10。控制信号SClO的状态可控制ANC 滤波器F12的ANC滤波器增益、ANC滤波器截止频率、启动状态(例如,接通或断开)或操作模式中的一者或一者以上。举例来说,设备AllO可经配置,使得控制信号SClO的状态使 ANC滤波器F12在第一操作模式(也称为ANC模式)与第二操作模式(也称为通过模式) 之间切换,所述第一操作模式用于主动地消除周围声音,所述第二操作模式用于使周围声音通过或用于使周围声音的一个或一个以上选定分量(例如,周围话音)通过。ANC滤波器F12可经布置以通过开关或触控式传感器(例如,电容性触控式传感器)的致动或从另一用户接口接收控制信号SC10。图IlB展示设备AllO的实施方案A112 的框图,实施方案A112包括经配置以产生控制信号SClO的例子SC12的传感器SEW0。传感器SEmO可经配置以检测电话呼叫何时切断(或用户何时挂断电话),且响应于此检测撤销激活ANC滤波器F12 (即,经由控制信号SC12)。此传感器还可经配置以检测何时接收到电话呼叫或用户何时起始电话呼叫,且响应于此检测而激活ANC滤波器F12。或者或另外,传感器SENlO可包括接近性检测器(例如,电容性或超声波传感器),所述接近性检测器经布置以检测装置是否当前处于用户的耳中或接近用户的耳,且相应地激活(或撤销激活)ANC滤波器F12。或者或另外,传感器SEmO可包括手势传感器(例如,超声波手势传感器),所述手势传感器经布置以检测用户的命令手势,且相应地激活或撤销激活ANC滤波器 F12。设备AllO还可经实施,使得ANC滤波器F12响应于传感器SEWO的输出在第一操作模式(例如,ANC模式)与第二操作模式(例如,通过模式)之间切换。ANC滤波器F12可经配置以在通过操作模式中执行对所感测噪声参考信号SSlO的额外处理。举例来说,ANC滤波器F12可经配置以执行频率选择性处理操作(例如,放大所感测噪声参考信号SSlO的选定频率,例如在500Hz以上的频率或另一高频范围)。或者或另外,对于所感测噪声参考信号SSlO为多声道信号的状况,ANC滤波器F12可经配置以执行方向选择性处理操作(例如,使来自用户的口的方向的声音衰减),及/或接近选择性处理操作(例如,放大远场声音及/或抑制近场声音(例如,用户自己的语音))。(例如)通过比较在不同时间及/或在不同频带中的声道的相对电平,可执行接近选择性处理操作。在此状况下,不同声道电平倾向于指示近场信号,而类似声道电平倾向于指示远场信号。如上文所描述,可使用控制信号SClO的状态来控制ANC滤波器FlO的操作。举例来说,设备AllO可经配置以使用控制信号SClO通过控制ANC滤波器F12的增益来使音频输出信号SOlO中的抗噪声信号SAlO的电平变化。或者或另外,可能需要使用控制信号SClO 的状态来控制音频输出级AOlO的操作。图12A展示设备AlOO的此实施方案A120的框图, 实施方案A120包括音频输出级AOlO的可控制实施方案A012。音频输出级A012经配置以根据控制信号SClO的状态产生音频输出信号S010。举例来说,可能需要配置级A012以通过根据控制信号SClO的状态使音频输出信号SOlO中的抗噪声信号SAlO的电平变化(例如,有效地控制ANC操作的增益)而产生音频输出信号S010。在一实例中,音频输出级A012经配置以在控制信号SClO指示ANC模式时将抗噪声信号SAlO的高(例如,最大)电平与均衡信号SQlO混频,且在控制信号SClO指示通过模式时将抗噪声信号SAlO的低(例如,最小或零)电平与均衡音频信号SQlO混频。在另一实例中,音频输出级A012经配置以在控制信号SClO指示ANC模式时将抗噪声信号SAlO 的高电平与均衡信号SQlO的低电平混频,且在控制信号SClO指示通过模式时将抗噪声信号SAlO的低电平与均衡音频信号SQlO的高电平混频。图12B展示设备A120的实施方案 A122的框图,实施方案A122包括如上文所描述的传感器SEMO的例子,其经配置以产生控制信号SClO的例子SC12。设备AlOO可经配置以基于来自所感测多声道信号SS20、噪声估计附0、再生音频信号SRlO及/或均衡音频信号SQlO的信息来修改ANC操作。图13A展示设备AllO的实施方案Al 14的框图,实施方案Al 14包括ANC滤波器F12及控制信号产生器CSGlO。控制信号产生器CSGlO经配置以基于来自所感测多声道信号SS20、噪声估计附0、再生音频信号 SRlO及均衡音频信号SQlO当中的至少一者的信息而产生控制信号SClO的例子SC14,例子 SC14控制ANC滤波器F12的操作的一个或一个以上方面。举例来说,设备A114可经实施, 使得ANC滤波器F12响应于信号SC14的状态在第一操作模式(例如,ANC模式)与第二操作模式(例如,通过模式)之间切换。图13B展示设备A120的类似实施方案AlM的框图, 其中控制信号SC14控制音频输出级A012的操作的一个或一个以上方面(例如,音频输出信号SOlO中的抗噪声信号SAlO及/或均衡信号SQlO的电平)。可能需要配置设备A110,使得当无再生音频信号SRlO可用时,ANC滤波器F12保持不活动。或者,ANC滤波器F12可经配置以在这些周期期间在所要操作模式(例如,通过模式)中操作。在再生音频信号SRlO不可用的周期期间的特定操作模式可由用户选择(例如,作为装置中的配置中的一选项)。当再生音频信号SRlO变得可用时,可能需要控制信号SClO提供最大程度的噪声消除(例如,允许用户更好地听到远端音频)。举例来说,可能需要控制信号SClO控制ANC 滤波器F12具有高增益,例如最大增益。或者或另外,可能需要在此状况下控制音频输出级 A012将高电平的抗噪声信号SAlO与均衡音频信号SQlO混频。还可能需要控制信号SClO在远端活动停止时提供较小程度的主动式噪声消除 (例如,控制音频输出级A012将较低电平的抗噪声信号SAlO与均衡音频信号SQlO混频,及 /或控制ANC滤波器F12具有较低增益)。在此状况下,可能需要在控制信号SClO的这些状态之间实施磁滞或其它时间平滑机制(例如,以避免或减小讨厌的内部/外部假影,所述假影是归因于远端音频信号中的话音瞬变,例如词或句子之间的停顿)。控制信号产生器CSGlO可经配置以将所感测多声道信号SS20及/或噪声估计附0 的一个或一个以上质量的值映射到控制信号SC14的相应状态。举例来说,控制信号产生器 CSGlO可经配置以基于所感测多声道信号SS20或噪声估计mo的电平(例如,能量)产生控制信号SC14,所述电平可随时间而平滑化。在此状况下,控制信号SC14可控制ANC滤波器F12及/或音频输出级A012在所述电平为低时提供较小程度的主动式噪声消除。可由控制信号产生器CSGlO映射到控制信号SC14的相应状态的所感测多声道信号SS20及/或噪声估计mo的质量的其它实例包括在一个或一个以上频率副频带中的每一者上的电平。举例来说,控制信号产生器CSGio可经配置以计算在低频频带(例如,低于 200Hz或低于500Hz的频率)上的所感测多声道信号SS20或噪声估计WO的电平。控制信号产生器CSGlO可经配置以通过对频域信号的频带中的频率分量的量值(或平方的量值) 求和而计算在所述所要频带上的电平。或者,控制信号产生器CSGlO可经配置以通过对时域信号进行滤波以获得副频带信号及计算所述副频带信号的电平(例如,能量)而计算在所述信号的频带上的电平。可能需要使用双二阶滤波器来有效地执行此时域滤波。在这些状况下,控制信号SC14可控制ANC滤波器F12及/或音频输出级A012在所述电平为低时提供较小程度的主动式噪声消除。可能需要配置设备Al 14以使用控制信号SC14来控制ANC滤波器F12的一个或一个以上参数,例如ANC滤波器F12的增益、ANC滤波器F12的截止频率及/或ANC滤波器F12 的操作模式。在此状况下,控制信号产生器CSGlO可经配置以根据可为线性或非线性及连续或不连续的映射将信号质量值映射到相应控制参数值。图14A至图14C展示用于将所感测多声道信号SS20或噪声估计NlO (或此信号的副频带)的电平的值映射到ANC滤波器增益值的不同量变曲线的实例。图14A展示线性映射的有界限实例,图14B展示非线性映射的实例,且图14C展示将电平值范围映射到有限增益状态集合的实例。在一特定实例中,控制信号产生器CSGlO将高达60dB的噪声估计WO的电平映射到第一 ANC滤波器增益状态, 将从60dB到70dB的电平映射到第二 ANC滤波器增益状态,将从70dB到80dB的电平映射到第三ANC滤波器增益状态,且将从SOdB到90dB的电平映射到第四ANC滤波器增益状态。图14D至图14F展示可由控制信号产生器CSGlO使用以将信号(或副频带)电平值映射到ANC滤波器截止频率值的类似量变曲线的实例。在低的截止频率下,ANC滤波器通常更有效。尽管在高的截止频率下可降低ANC滤波器的平均效率,但有效带宽得以扩展。 ANC滤波器F12的最大截止频率的一实例为两千赫兹。控制信号产生器CSGlO可经配置以基于所感测多声道信号SS20的频率分布而产生控制信号SC14。举例来说,控制信号产生器CSGlO可经配置以基于所感测多声道信号 SS20的不同副频带的电平之间的关系(例如,高频副频带的能量与低频副频带的能量之间的比率)产生控制信号SC14。此比率的高值指示话音活动的存在。在一实例中,控制信号产生器CSGlO经配置以将高频能量与低频能量的比率的高值映射到通过操作模式,且将低的比率值映射到ANC操作模式。在另一实例中,控制信号产生器CSGlO将比率值映射到ANC 滤波器截止频率的值。在此状况下,控制信号产生器CSGlO可经配置以将高的比率值映射到低的截止频率值,且将低的比率值映射到高的截止频率值。或者或另外,控制信号产生器CSGlO可经配置以基于一个或一个以上其它话音活动检测(例如,语音活动检测)操作(例如,音高及/或共振峰检测)的结果而产生控制信号SC14。举例来说,控制信号产生器CSGlO可经配置以检测所感测多声道信号SS20中的话音(例如,检测频谱倾斜、调和性及/或共振峰结构),且响应于此检测而选择通过操作模式。在另一实例中,控制信号产生器CSGlO经配置以响应于话音活动检测而选择ANC滤波器F12的低截止频率,且否则选择高的截止频率值。可能需要随时间使ANC滤波器F12的状态之间的转变平滑化。举例来说,可能需要配置控制信号产生器CSGlO以随时间使一个或一个以上信号质量及/或控制参数中的每一者的值平滑化(例如,根据线性或非线性平滑函数)。线性时间平滑函数的一实例为y = ap+(l-a)X,其中χ为当前值,ρ为最近的平滑化值,y为当前平滑化值,且a为具有在从零 (无平滑化)至一(无更新)的范围中的值的平滑因子。或者或另外,可能需要使用磁滞机制来抑制在ANC滤波器F12的状态之间的转变。 此机制可经配置以仅在已针对给定数目个连续帧满足转变条件之后从一个滤波器状态转变为另一个滤波器状态。图15展示用于双态ANC滤波器的此机制的一实例。在滤波器状态0中(例如,停用ANC滤波),在每一帧处评估噪声估计WO的电平NL。如果满足转变条件(即,如果NL至少等于阈值T),则使计数值Cl递增,且否则使Cl清零。仅当Cl的值达到阈值TCl时,发生到滤波器状态1(例如,启用ANC滤波)的转变。类似地,仅当NL已小于T的连续帧的数目超过阈值TCO时,发生从滤波器状态1到滤波器状态O的转变。可应用类似磁滞机制以控制在两个以上滤波器状态之间的转变(例如,如图14C及图14F中所展示)。可能需要避免对一些周围信号的主动式消除。举例来说,可能需要避免对以下各者中的一者或一者以上的主动式消除具有在阈值以上的响度的近端信号;含有话音共振峰的近端信号;以其它方式识别为话音的近端信号;具有警告信号的特性的近端信号,例如警报器、车辆喇叭,或其它紧急或告警信号(例如,特定频谱签名,或能量集中于一个或仅几个窄带中的频谱)。当在用户的环境中(例如,在所感测多声道信号SS20内)检测到此信号时,可能需要控制信号SClO使得ANC操作使所述信号通过。举例来说,可能需要控制信号SC14控制音频输出级A012来衰减、阻断抗噪声信号SAlO或甚至使抗噪声信号SAlO反相(或者, 控制ANC滤波器F12以具有低增益、零增益或甚至负增益)。在一实例中,控制信号产生器 CSGlO经配置以检测所感测多声道信号SS20中的警告声音(例如,音调分量,或与其它声音信号相比具有窄带宽的分量,例如噪声分量),且响应于此检测选择通过操作模式。在远端音频可用的周期期间,在大多数状况下,可能需要音频输出级AOlO在整个周期内将高量(例如,最大量)的均衡音频信号SQlO与抗噪声信号SAlO混频。然而,在一些状况下,可能需要根据一外部事件(例如,警告信号或近端话音的存在)而临时超驰 (override)此操作。可能需要根据所感测多声道信号SS20的频率含量来控制均衡器EQlO的操作。举例来说,可能需要在警告信号或近端话音存在期间停用再生音频信号SRlO的修改(例如, 根据控制信号SClO或类似控制信号的状态)。可能需要停用任何此修改,除非再生音频信号SRlO为活动的而近端信号不活动。在近端话音及再生音频信号SRlO均为活动的“双边谈话(double talk) ”的状况下,可能需要控制信号SC14控制音频输出级A012以适当百分比(例如,简单地50-50,或与相对信号强度成比例)将均衡信号SQlO与抗噪声信号SAlO混频。可能需要根据装置的用户偏好(例如,经由与所述装置的用户接口)配置控制信号产生器CSG10,及/或配置控制信号SClO对ANC滤波器F12或音频输出级A012的效应。 此配置可指示(例如)对环境噪声的主动式消除是否应在外部信号存在时被中断,及何种信号将触发此中断。举例来说,用户可选择不被接近的讲话者中断,但仍被通知紧急信号。 或者,用户可选择以不同于紧急信号的速率放大近端说话者。设备AlOO为更一般配置AlO的特定实施方案。图17展示设备AlO的框图,其包括噪声估计产生器F2,噪声估计产生器F2经配置以基于来自所感测周围声响信号SS2的信息而产生噪声估计mo。信号SS可为单声道信号(例如,基于来自单一麦克风的信号)。 噪声估计产生器F2为空间选择性滤波器F20的更一般配置。噪声估计产生器F2可经配置以对所感测周围声响信号SS2执行时间选择操作(例如,使用语音活动检测(VAD)操作,例如本文所描述的话音活动操作中的任何一者或一者以上),使得噪声估计NlO仅针对缺乏语音活动的帧更新。举例来说,噪声估计产生器F2可经配置以将噪声估计NlO计算为所感测周围声响信号SS2的不活动帧的随时间的平均值。注意,尽管空间选择性滤波器F20可经配置以产生包括非固定噪声分量的噪声估计mo,但不活动帧的时间平均值很可能仅包括固定噪声分量。图18展示根据一般配置的方法MlOO的流程图,方法MlOO包括任务T100、T200、 T300及T400。可在经配置以处理音频信号的装置(例如,本文所描述的ANC装置中的任一者)内执行方法M100。任务TlOO基于来自所感测多声道音频信号的第一声道的信息及来自所述所感测多声道音频信号的第二声道的信息而产生噪声估计(例如,如本文关于空间选择性滤波器F20所描述)。任务T200基于来自所述噪声估计的信息相对于再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带,以产生均衡音频信号(例如,如本文关于均衡器EQlO所描述)。任务T300基于来自所感测噪声参考信号的信息产生抗噪声信号(例如,如本文关于ANC滤波器FlO所描述)。任务T400组合所述均衡音频信号与所述抗噪声信号以产生音频输出信号(例如,如本文关于音频输出级AOlO 所描述)。图19A展示任务T300的实施方案T310的流程图。任务T310包括子任务T312,子任务T312响应于在所感测多声道信号中检测到话音活动而使音频输出信号中的抗噪声信号的电平变化(例如,如本文关于ANC滤波器F12所描述)。图19B展示任务T300的实施方案T320的流程图。任务T320包括子任务T322, 子任务T322基于以下各项当中的至少一者而使音频输出信号中的抗噪声信号的电平变化 (例如,如本文关于ANC滤波器F12所描述)噪声估计的电平、再生音频信号的电平、均衡音频信号的电平,及所感测多声道音频信号的频率分布。图19C展示任务T400的实施方案T410的流程图。任务T410包括子任务T412,子任务T412响应于在所感测多声道信号中检测到话音活动而使音频输出信号中的抗噪声信号的电平变化(例如,如本文关于音频输出级A012所描述)。图19D展示任务T400的实施方案T420的流程图。任务T420包括子任务T422, 子任务T422基于以下各项当中的至少一者而使音频输出信号中的抗噪声信号的电平变化(例如,如本文关于音频输出级A012所描述)噪声估计的电平、再生音频信号的电平、均衡音频信号的电平,及所感测多声道音频信号的频率分布。图20A展示任务T300的实施方案T330的流程图。任务T330包括子任务T332,子任务T332对所感测噪声参考信号执行滤波操作以产生抗噪声信号,且任务T332包括子任务T334,子任务T334基于来自所感测多声道音频信号的信息而使所述滤波操作的增益及截止频率当中的至少一者变化(例如,如本文关于ANC滤波器F12所描述)。图20B展示任务T200的实施方案T210的流程图。任务T210包括子任务T212,子任务T212基于来自噪声估计的信息计算增益因子的值。任务T210还包括子任务T214,子任务T214使用滤波器级的级联对再生音频信号进行滤波,且任务T214包括子任务T216,子任务T216使用增益因子的所计算值来使所述级联的滤波器级的增益响应相对于所述级联的不同滤波器级的增益响应变化(例如,如本文关于均衡器EQlO所描述)。图21展示根据一般配置的设备MF100的流程图,设备MF100可包括于经配置以处理音频信号的装置(例如,本文所描述的ANC装置中的任一者)内。设备MF100包括用于基于来自所感测多声道音频信号的第一声道的信息及来自所述所感测多声道音频信号的第二声道的信息而产生噪声估计的装置FlOO (例如,如本文关于空间选择性滤波器F20及任务TlOO所描述)。设备MF100还包括用于基于来自所述噪声估计的信息相对于再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带以产生均衡音频信号的装置F200 (例如,如本文关于均衡器EQlO及任务T200所描述)。设备MF100 还包括用于基于来自所感测噪声参考信号的信息产生抗噪声信号的装置F300(例如,如本文关于ANC滤波器FlO及任务T300所描述)。设备MF100还包括用于组合所述均衡音频信号与所述抗噪声信号以产生音频输出信号的装置F400(例如,如本文关于音频输出级AOlO 及任务T400所描述)。图27展示根据另一一般配置的设备A400的框图。设备A400包括频谱对比度增强 (SCE)模块SC10,频谱对比度增强(SCE)模块SClO经配置以基于来自噪声估计mo的信息修改抗噪声信号ANio的频谱,以产生对比度增强的信号SC20。SCE模块SClO可经配置以计算描述抗噪声信号SAlO的频谱的对比度增强版本的增强向量,且通过提升及/或衰减抗噪声信号ANlO的副频带以增强在噪声估计WO的功率为高的副频带处的抗噪声信号ANlO 的话音内容的频谱对比度而产生信号SC20(如由增强向量的相应值指示)。可(例如)在 2009年12月3日公开的题为“用于频谱对比度增强的系统、方法、设备及计算机程序产品 (SYSTEMS, METHODS, APPARATUS, AND COMPUTER PROGRAM PRODUCTS FOR SPECTRAL CONTRAST ENHANCEMENT),,的第2009/(^99742号美国公开专利申请案中的增强器ENlO的描述中找到 SCE模块SClO的实施方案及操作的其它实例。图28展示为设备A100及设备A400两者的实施方案的设备A500的框图。本文所揭示的方法及设备可大体应用于任何收发及/或音频感测应用中,尤其是这些应用的移动或另外的便携型例子中。举例来说,本文所揭示的配置的范围包括驻留于无线电话通信系统中的通信装置,所述无线电话通信系统经配置以使用码分多址(CDMA) 空中接口。然而,所属领域的技术人员将理解,具有如本文所描述的特征的方法及设备可驻留于使用所属领域的技术人员所已知的广泛范围的技术的各种通信系统中的任一者中,例如经由有线及/或无线(例如,CDMA、TDMA、FDMA及/或TD-SCDMA)传输信道使用IP语音(VoIP)的系统。明确地预期且特此揭示,本文所揭示的通信装置可适于用于包交换式网络(例如,经布置以根据例如VoIP的协议载运音频传输的有线及/或无线网络)及/或电路交换式网络中。还明确地预期且特此揭示,本文所揭示的通信装置可适于用于窄带编码系统 (例如,编码约四千赫兹或五千赫兹的音频频率范围的系统)中及/或用于宽带编码系统 (例如,编码大于五千赫兹的音频频率的系统)中,包括全带宽带编码系统及分带宽带编码系统。提供所描述配置的前述呈现以使任何所属领域的技术人员能够制造或使用本文所揭示的方法及其它结构。本文所展示且描述的流程图、框图及其它结构仅为实例,且这些结构的其它变型也在本发明的范畴内。对这些配置的各种修改是可能的,且本文所呈现的一般原理也可应用于其它配置。因此,本发明不意在限于上文所展示的配置,而应被赋予与在本文中以任何方式揭示的原理及新颖特征一致的最广范畴,其包括于如所申请的所附权利要求书中,所述权利要求书形成原始揭示内容的一部分。所属领域的技术人员将理解,可使用多种不同技艺及技术中的任一者来表示信息及信号。举例来说,可通过电压、电流、电磁波、磁场或磁粒子、光场或光粒子,或其任何组合来表示可贯穿以上描述而引用的数据、指令、命令、信息、信号、位及符号。针对如本文所揭示的配置的实施方案的重要设计要求可包括最小化处理延迟及/ 或计算复杂性(通常以每秒数百万指令或MIPS测量),尤其针对计算密集型应用,例如压缩音频或视听信息(例如,根据一压缩格式编码的文件或流,例如本文所识别的实例中的一者)的播放,或用于宽带通信的应用(例如,以高于八千赫兹的取样率进行的语音通信,例如 12kHz、16kHz 或 44kHz)。多麦克风处理系统的目标可包括实现10至12dB的总体噪声降低,在所要说话者的移动期间保持语音电平及色彩,获得噪声已移动至背景中而非主动噪声移除的感知,话音的解除混响,及/或启用后处理选项以用于更主动的噪声降低。如本文所揭示的ANC设备的实施方案的各种元件可以被认为适合于预期应用的硬件、软件及/或固件的任何组合来体现。举例来说,这些元件可制造为驻留于(例如)同一芯片上或一芯片组中的两个或两个以上芯片当中的电子及/或光学装置。此装置的一实例为例如晶体管或逻辑门的固定或可编程逻辑元件阵列,且这些元件中的任一者均可实施为一个或一个以上这些阵列。这些元件中的任何两者或两者以上乃至全部可实施于同一阵列或相同的多个阵列内。这个或这些阵列可实施于一个或一个以上芯片内(例如,实施于包括两个或两个以上芯片的芯片组内)。本文所揭示的ANC设备的各种实施方案的一个或一个以上元件还可全部或部分地实施为一个或一个以上指令集,所述一个或一个以上指令集经布置以执行于一个或一个以上固定或可编程逻辑元件阵列上,例如微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA(现场可编程门阵列)、ASSP (专用标准产品)及ASIC(专用集成电路)。如本文所揭示的设备的实施方案的各种元件中的任一者还可体现为一个或一个以上计算机(例如, 包括经编程以执行一个或一个以上指令集或指令序列的一个或一个以上阵列的机器,也称为“处理器”),且这些元件中的任何两者或两者以上乃至全部可实施于相同的这个或这些计算机内。
如本文所揭示的处理器或用于处理的其它装置可制造为驻留于(例如)同一芯片上或一芯片组中的两个或两个以上芯片当中的一个或一个以上电子及/或光学装置。此装置的一实例为例如晶体管或逻辑门的固定或可编程逻辑元件阵列,且这些元件中的任一者可实施为一个或一个以上这些阵列。这个或这些阵列可实施于一个或一个以上芯片内(例如,实施于包括两个或两个以上芯片的芯片组内)。这些阵列的实例包括固定或可编程逻辑元件阵列,例如微处理器、嵌入式处理器、IP核心、DSP、FPGA、ASSP及ASIC。如本文所揭示的处理器或用于处理的其它装置也可体现为一个或一个以上计算机(例如,包括经编程以执行一个或一个以上指令集或指令序列的一个或一个以上阵列的机器)或其它处理器。如本文所描述的处理器有可能用以执行并不与相干性检测程序直接相关的任务或执行并不与相干性检测程序直接相关的其它指令集,例如与处理器被嵌入的装置或系统(例如,音频感测装置)的另一操作相关的任务。如本文所揭示的方法的部分也有可能由音频感测装置的处理器执行,且所述方法的另一部分也有可能在一个或一个以上其它处理器的控制下执行。所属领域的技术人员将了解,结合本文所揭示的配置所描述的各种说明性模块、 逻辑块、电路,及测试及其它操作可实施为电子硬件、计算机软件或两者的组合。这些模块、 逻辑块、电路及操作可通过通用处理器、数字信号处理器(DSP)、ASIC或ASSP、FPGA或其它可编程逻辑装置、离散门或晶体管逻辑、离散硬件组件或其经设计以产生如本文所揭示的配置的任何组合来实施或执行。举例来说,此配置可至少部分地实施为硬连线电路、实施为制造至专用集成电路中的电路配置,或实施为加载至非易失性存储装置中的固件程序或作为机器可读取代码从数据存储媒体加载或加载至数据存储媒体中的软件程序,此代码为可由逻辑元件阵列(例如,通用处理器或其它数字信号处理单元)执行的指令。通用处理器可为微处理器,但在替代例中,处理器可为任何常规处理器、控制器、微控制器或状态机。处理器也可实施为计算装置的组合,例如,DSP与微处理器的组合、多个微处理器、结合一 DSP核心的一个或一个以上微处理器,或任何其它此配置。软件模块可驻留于RAM(随机存取存储器)、R0M (只读存储器)、例如快闪RAM的非易失性RAM (NVRAM)、可擦除可编程ROM (EPROM)、 电可擦除可编程ROM(EEPROM)、寄存器、硬盘、可装卸盘、CD-ROM或此项技术中已知的任何其它形式的存储媒体中。说明性存储媒体耦合到处理器,使得所述处理器可从存储媒体读取信息及将信息写入至所述存储媒体。在替代例中,存储媒体可与处理器形成一体。处理器及存储媒体可驻留于ASIC中。所述ASIC可驻留于用户终端中。在替代例中,处理器及存储媒体可作为离散组件驻留于用户终端中。注意,本文所揭示的各种方法可通过例如处理器的逻辑元件阵列执行,且如本文所描述的设备的各种元件可实施为经设计以在此阵列上执行的模块。如本文所使用,术语 “模块”或“子模块”可指代包括呈软件、硬件或固件形式的计算机指令(例如,逻辑表达式) 的任何方法、设备、装置、单元或计算机可读取数据存储媒体。应理解,多个模块或系统可组合成一个模块或系统,且一个模块或系统可分成多个模块或系统以执行相同功能。当以软件或其它计算机可执行指令实施时,过程的要素基本上为用以执行相关任务的代码段,例如以例程、程序、对象、组件、数据结构及其类似者。术语“软件”应理解为包括源代码、汇编语言码、机器码、二进制代码、固件、宏码、微码、可由逻辑元件阵列执行的指令的任何一个或一个以上集合或序列,及这些实例的任何组合。程序或代码段可存储于处理器可读媒体中或经由传输媒体或通信链路通过体现于载波中的计算机数据信号来传输。本文所揭示的方法、方案及技术的实施方案也可有形地体现(例如,在如本文所列出的一个或一个以上计算机可读媒体中)为可由包括逻辑元件阵列(例如,处理器、微处理器、微控制器或其它有限状态机)的机器读取及/或执行的一个或一个以上指令集。术语“计算机可读媒体”可包括可存储或传送信息的任何媒体,包括易失性、非易失性、可装卸及不可装卸媒体。计算机可读媒体的实例包括电子电路、半导体存储器装置、ROM、闪存、可擦除ROM(EROM)、软盘或其它磁性存储装置、CD-R0M/DVD或其它光学存储装置、硬盘、光纤媒体、射频(RF)链路,或可用以存储所要信息且可被存取的任何其它媒体。计算机数据信号可包括可经由例如电子网络信道、光纤、空气、电磁、RF链路等的传输媒体传播的任何信号。代码段可经由例如因特网或内联网的计算机网络下载。在任何状况下,本发明的范围不应解释为由这些实施例限制。本文所描述的方法的任务中的每一者可直接以硬件、以由处理器执行的软件模块或以两者的组合体现。在如本文所揭示的方法的实施方案的典型应用中,逻辑元件(例如, 逻辑门)的阵列经配置以执行方法的各种任务中的一者、一者以上乃至全部。任务中的一者或一者以上(可能全部)也可实施为体现于计算机程序产品(例如,一个或一个以上数据存储媒体,例如磁盘、快闪存储卡或其它非易失性存储卡、半导体存储器芯片等)中的代码(例如,一个或一个以上指令集),所述代码可由包括逻辑元件阵列(例如,处理器、微处理器、微控制器或其它有限状态机)的机器(例如,计算机)读取及/或执行。如本文所揭示的方法的实施方案的任务也可由一个以上此阵列或机器执行。在这些或其它实施方案中,任务可在用于无线通信的装置(例如,蜂窝式电话)或具有此通信能力的其它装置内执行。此装置可经配置以与电路交换式网络及/或包交换式网络通信(例如,使用例如VoIP 的一个或一个以上协议)。举例来说,此装置可包括经配置以接收及/或传输经编码帧的 RF电路。明确地揭示,本文所揭示的各种方法可由例如手机、耳机或便携型数字助理(PDA) 的便携型通信装置执行,且本文所描述的各种设备可包括于此装置内。典型的实时(例如, 在线)应用为使用此移动装置进行的电话通话。在一个或一个以上示范性实施例中,本文所描述的操作可以硬件、软件、固件或其任何组合来实施。如果以软件实施,则这些操作可作为一个或一个以上指令或代码而存储于计算机可读媒体上或经由计算机可读媒体传输。术语“计算机可读媒体”包括计算机存储媒体与通信媒体(包括促进将计算机程序从一个地方转移至另一个地方的任何媒体)两者。存储媒体可为可由计算机存取的任何可用媒体。通过实例且非限制,这些计算机可读媒体可包含存储元件阵列,例如半导体存储器(其可包括(但不限于)动态或静态RAM、R0M、 EEPROM及/或快闪RAM),或铁电、磁阻、双向、聚合或相变存储器;CD-ROM或其它光盘存储装置、磁盘存储装置或其它磁性存储装置,或可用于以可由计算机存取的有形结构存储呈指令或数据结构的形式的所要程序代码的任何其它媒体。又,将任何连接恰当地称为计算机可读媒体。举例来说,如果使用同轴电缆、光纤电缆、双绞线、数字用户线(DSL),或无线技术(例如,红外线、无线电及/或微波)而从网站、服务器或其它远程源传输软件,则同轴电缆、光纤电缆、双绞线、DSL,或无线技术(例如,红外线、无线电及/或微波)包括于媒体的定义中。如本文所使用,磁盘及光盘包括压缩光盘(CD)、激光光盘、光盘、数字多功能盘(DVD)、软性磁盘及Blu-ray Disc (蓝光光盘协会,加州环球影城),其中磁盘通常以磁性方式再生数据,而光盘通过激光以光学方式再生数据。以上各物的组合也应包括在计算机可读媒体的范畴内。如本文所描述的声响信号处理设备可并入至电子装置(例如,通信装置)中,所述电子装置接受话音输入以便控制某些操作或可以其它方式从所要噪声与背景噪声的分离获益。许多应用可从增强清楚的所要声音或分离清楚的所要声音与源自多个方向的背景声音获益。这些应用可包括并入有例如语音辨识及检测、话音增强及分离、语音激活控制及其类似者的能力的电子或计算装置中的人机界面。可能需要实施此声响信号处理设备以适合于仅提供受限处理能力的装置中。可将本文所描述的模块、元件及装置的各种实施方案的元件制造为驻留于(例如)同一芯片上或一芯片组中的两个或两个以上芯片当中的电子及/或光学装置。此装置的一实例为固定或可编程逻辑元件阵列,例如晶体管或门。本文所描述的设备的各种实施方案的一个或一个以上元件还可全部或部分地实施为一个或一个以上指令集,所述一个或一个以上指令集经布置以在一个或一个以上固定或可编程逻辑元件阵列上执行,所述阵列例如为微处理器、嵌入式处理器、IP核心、数字信号处理器、FPGA、ASSP及ASIC。如本文所描述的设备的实施方案的一个或一个以上元件有可能用以执行并不与所述设备的操作直接相关的任务或执行并不与所述设备的操作直接相关的其它指令集,例如与所述设备被嵌入的装置或系统的另一操作相关的任务。此设备的实施方案的一个或一个以上元件还有可能具有共同结构(例如,用以执行在不同时间对应于不同元件的代码部分的处理器,经执行以在不同时间执行对应于不同元件的任务的指令集,或在不同时间执行不同元件的操作的电子及/或光学装置的布置)。
权利要求
1.一种处理再生音频信号的方法,所述方法包含在经配置以处理音频信号的装置内执行以下动作基于来自所感测多声道音频信号的第一声道的信息及来自所述所感测多声道音频信号的第二声道的信息而产生噪声估计;基于来自所述噪声估计的信息,相对于所述再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带以产生均衡音频信号;基于来自所感测噪声参考信号的信息而产生抗噪声信号;及组合所述均衡音频信号与所述抗噪声信号以产生音频输出信号。
2.根据权利要求1所述的方法,其中所述方法包含检测所述所感测多声道音频信号中的话音活动;及响应于所述检测,使所述音频输出信号中的所述抗噪声信号的电平变化。
3.根据权利要求1所述的方法,其中所述方法包含基于以下各项当中的至少一者使所述音频输出信号中的所述抗噪声信号的电平变化所述噪声估计的电平、所述再生音频信号的电平、所述均衡音频信号的电平及所述所感测多声道音频信号的频率分布。
4.根据权利要求1所述的方法,其中所述方法包含产生声响信号,所述声响信号是基于所述音频输出信号且经导引朝向用户的耳,且其中所述所感测噪声参考信号是基于由经导引朝向所述用户的耳的麦克风产生的信号。
5.根据权利要求4所述的方法,其中所述所感测多声道音频信号的每一声道是基于由经经导引远离所述用户的耳的多个麦克风中的对应一者产生的信号。
6.根据权利要求1所述的方法,其中所述产生抗噪声信号包含对所述所感测噪声参考信号执行滤波操作以产生所述抗噪声信号,且其中所述方法包含基于来自所述所感测多声道音频信号的信息,使所述滤波操作的增益及截止频率当中的至少一者变化。
7.根据权利要求1所述的方法,其中所述再生音频信号是基于经由无线传输信道接收的经编码音频信号。
8.根据权利要求1所述的方法,其中所述产生噪声估计包含对所述所感测多声道音频信号执行方向选择性处理操作。
9.根据权利要求1所述的方法,其中所述相对于所述再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带包含基于来自所述噪声估计的所述信息,计算增益因子的值;及使用滤波器级的级联对所述再生音频信号进行滤波,其中所述对所述再生音频信号进行滤波包含使用所述增益因子的所述所计算值来使所述级联的滤波器级的增益响应相对于所述级联的不同滤波器级的增益响应变化。
10.一种具有有形结构的计算机可读媒体,所述有形结构存储机器可执行指令,所述机器可执行指令在由至少一个处理器执行时使所述至少一个处理器进行以下操作基于来自所感测多声道音频信号的第一声道的信息及来自所述所感测多声道音频信号的第二声道的信息而产生噪声估计;基于来自所述噪声估计的信息,相对于再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带以产生均衡音频信号; 基于来自所感测噪声参考信号的信息而产生抗噪声信号;及组合所述均衡音频信号与所述抗噪声信号以产生音频输出信号。
11.一种经配置以处理再生音频信号的设备,所述设备包含用于基于来自所感测多声道音频信号的第一声道的信息及来自所述所感测多声道音频信号的第二声道的信息而产生噪声估计的装置;用于基于来自所述噪声估计的信息相对于所述再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带以产生均衡音频信号的装置; 用于基于来自所感测噪声参考信号的信息而产生抗噪声信号的装置;及用于组合所述均衡音频信号与所述抗噪声信号以产生音频输出信号的装置。
12.根据权利要求11所述的设备,其中所述设备包括用于进行以下操作的装置产生控制信号以使所述用于产生抗噪声信号的装置及所述用于组合的装置当中的至少一者基于以下各项当中的至少一者来使所述抗噪声信号的电平变化所述噪声估计的电平、所述再生音频信号的电平、所述均衡音频信号的电平及所述所感测多声道音频信号的频率分布。
13.根据权利要求11所述的设备,其中所述设备包括经导引朝向用户的耳的扬声器及经导引朝向所述用户的耳的麦克风,且其中所述扬声器经配置以基于所述音频输出信号而产生声响信号,且其中所述所感测噪声参考信号是基于由所述麦克风产生的信号。
14.根据权利要求13所述的设备,其中所述设备包括经经导引远离所述用户的耳的麦克风的阵列,且其中所述所感测多声道音频信号的每一声道是基于由所述阵列的所述麦克风中的对应一者产生的信号。
15.根据权利要求11所述的设备,其中所述用于产生噪声估计的装置经配置以对所述所感测多声道音频信号执行方向选择性处理操作。
16.一种经配置以处理再生音频信号的设备,所述设备包含空间选择性滤波器,其经配置以基于来自所感测多声道音频信号的第一声道的信息及来自所述所感测多声道音频信号的第二声道的信息而产生噪声估计;均衡器,其经配置以基于来自所述噪声估计的信息相对于所述再生音频信号的至少一个频率副频带提升所述再生音频信号的至少一个其它频率副频带以产生均衡音频信号;主动式噪声消除滤波器,其经配置以基于来自所感测噪声参考信号的信息而产生抗噪声信号;及音频输出级,其经配置以组合所述均衡音频信号与所述抗噪声信号以产生音频输出信号。
17.根据权利要求16所述的设备,其中所述设备包括控制信号产生器,其经配置以控制所述主动式噪声消除滤波器及所述音频输出级当中的至少一者基于以下各项当中的至少一者来使所述抗噪声信号的电平变化所述噪声估计的电平、所述再生音频信号的电平、 所述均衡音频信号的电平及所述所感测多声道音频信号的频率分布。
18.根据权利要求16所述的设备,其中所述设备包括经导引朝向用户的耳的扬声器及经导引朝向所述用户的耳的麦克风,且其中所述扬声器经配置以基于所述音频输出信号而产生声响信号,且其中所述所感测噪声参考信号是基于由所述麦克风产生的信号。
19.根据权利要求18所述的设备,其中所述设备包括经导引远离所述用户的耳的麦克风的阵列,且其中所述所感测多声道音频信号的每一声道是基于由所述阵列的所述麦克风中的对应一者产生的信号。
20.根据权利要求16所述的设备,其中所述空间选择性滤波器经配置以对所述所感测多声道音频信号执行方向选择性处理操作。
全文摘要
本发明涉及将主动式噪声消除与再生音频信号的频谱修改组合以增强可懂度。
文档编号G10K11/178GK102405494SQ201080017442
公开日2012年4月4日 申请日期2010年4月23日 优先权日2009年4月23日
发明者太元·李, 朴勋真, 杰里米·托曼 申请人:高通股份有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1