专利名称:用于声束形成的设备和方法
用于声束形成的设备和方法本发明涉及用于声束形成的设备和方法,并且尤其涉及但不是唯 5—涉及用于语音源的波束形成。音频到电信号的转换是很重要的过程,今天在许多应用中都有所 使用并且目的各有不同。例如,音频信号到采样的数字化信号的转换 已经成为很多通信服务和应用的基础。例如,由诸如固定的传统电话 10系统、蜂窝通信系统或基于分组的网络(例如因特网)之类的通信系 统支持的语音通信在大多数国家已经成为通信服务规定的重要部分。为了实现高质量的通信服务,必不可少的是实现希望的具有高信 噪比的信号的转换。然而,通信终端越来越多地在艰难的环境和有挑战性的条件下使用。例如,日益流行的移动通信已经导致在嘈杂和快15速变化的环境中发生的电话通话的大量增加。作为典型的示例,在汽 车环境中可能经常使用免持操作进行移动语音呼叫。显然,在这些环境中对想要的语音信号而不是背景噪声的高质量 产生转换信号是有挑战性的任务。已经提出的一种方法是使用多个麦 克风并且处理该多个信号以产生朝向希望的音频源的声束形成。这种20 波束形成可以有效地增加希望的信噪比,因为希望的信号可以被放大 而来自其他源和方向的背景噪声可以被减小。已经提出了各种方法和算法用于声束形成。然而,这些算法面临 的问题是如何提供精确的音频源跟踪,同时保证只跟踪希望的音频源。 具体地,由于音频源可以相对麦克风移动,声束形成算法必须跟25随这种移动,以确保最佳性能。然而,由于可能存在干扰噪声源,波 束形成滤波器的适应只跟随希望的音频源是很重要的,并且希望减小 波束形成算法锁定到强噪声源的风险。对于诸如人类语音的非连续音 频源,这个问题甚至更具有挑战性,因为即使当希望的语音源是安静 的,波束形成算法也必须跟随希望的语音源而不是千扰源。30 解决该问题的一种方法是将更新限制到小的、緩慢的变化,并且抛弃大的、突然的变化。具体来说,波束形成算法可以包括一种标准,该标准只有当存在相当大的波束内信号时才允许更新波束形成特性。 因此,如果没有波束内信号存在时可以阻止更新,因为假设任何波束 外部的音频源都是噪声源。然而,这种方法具有许多缺点并且具体来 说限制了波束形成算法跟踪希望的音频源的大的或突然移动和/或锁 5定到新音频源的能力。此外,难以设计用于可靠地检测波束内音频的用是主要障碍。" 、 、 ; 、、々二 ;因此, 一种用于声束形成的改进系统将是有利的,并且特别地, 一种允许具有在采集和跟踪性能之间的改进的权衡、改进的波束形成 10精度、对希望的音频源的大的和/或突然变化的改进的适应性、改进的 采集性能、改进的波束内检测、简化的实施、改进的跟踪性能和/或改 进的波束形成性能的系统将是有利的。因此,本发明旨在分别地或者以任意组合优选地减轻、緩和或消 15除上面提及的缺点中的一个或多个。根据本发明的第一方面,提供了一种用于声束形成的设备,该设备包括用于从第一音频输入产生第一输入信号的装置;用于从第二 音频输入产生第二输入信号的装置;波束形成装置,包括用于对第一 和第二输入信号进行滤波以产生组合的波束形成信号的波束形成滤波 20器;更新装置,用于当满足更新标准时更新波束形成滤波器;自适应滤波器,用于对第一输入信号进行滤波以产生第一滤波信号;用于对 第二输入信号和第一滤波信号产生差分信号的装置;用于调整自适应滤波器以最小化差分信号的装置;以及用于响应于归一化的差分信号 而修改更新标准的修改装置。25 本发明可以允许改进的声束形成。特别地,本发明可以允许对新音频源和/或具有重大和/或突然变化的位置的音频源的改进的适应。 本发明可以允许其中可以实现有效跟踪和采集性能的波束形成算法。 可以实现高效和/或低复杂性的实施。组合的波束形成信号可以具体地对应于语音信号。波束形成装置30可以包括用于对第一输入信号进行滤波的第一自适应滤波器,用于对 第二输入信号进行滤波的第二自适应滤波器以及用于通过组合(例如求和)得到的经过滤波的信号产生组合的波束形成信号的组合装置。 差分信号可能是归一化的差分信号。根据本发明的可选特征,波束形成装置被配置成产生第 一输入信 号和第二输入信号的至少其中 一 个相对于组合波束形成信号的噪声参5 考信号》这可以允许改进的性能并且允许用于控制设备操作的额外信息。 例如可以通过从第一和/或第二输入信号中减去对应于希望的信号的 分量来产生噪声参考信号。例如,噪声参考信号可以是第一输入信号和/或第二输入信号与对应于时间反转(t ime inver se)的滤波的组合波 10束形成信号的差分的指示,其中时间反转滤波对应于波束形成装置的滤波。根据本发明的可选特征,更新标准包括波束形成信号的功率量度 高于响应于噪声参考信号而确定的阈值这一标准。这可以允许波束形成信号更新的高效而且实际的控制并且提供了15 可以由修改装置有效而且实用地进行改变的更新标准。根据本发明的可选特征,修改装置被配置为响应于差分信号而修 改所述阈值。这可以允许对波束形成信号的更新的高效而且实际的控制,并且 提供了可以由修改装置有效而且实用地进行改变的更新标准。当差分 20信号的幅度减小时,修改装置可以具体地修改阈值以放宽更新标准。 例如,如果差分信号低于给定值时,可以减小阈值。根据本发明的可选特征,更新标准包括第 一输入信号的功率量度 高于响应于第二输入信号而确定的阈值这一标准。这可以改进波束形成操作并且尤其可以允许改进的适应性能。 25 根据本发明的可选特征,修改装置被配置为响应于差分信号而修改阈值。这可以允许对波束形成信号的更新的高效而且实际的控制,并且 提供了可以由修改装置有效而且实用地进行改变的更新标准。修改装 置可以具体地减小阈值,以减小差分信号的幅度。例如,如果差分信邓号低于给定值时,可以减小阈值。根据本发明的可选特征,修改装置被配置为如果差分信号低于阈值,则放宽更新标准。这允许改进的波束形成设备的性能并且可以允许改进的对新的音 频源或者发生相当大移动的音频源的采集。通过允许更多数量的参数 组合以更新波束形成装置来放宽更新标准。 5 根据本发明的可选特征,响应于第一输入信号和第二输入信号的至少其中一个相对于组合的波束形成信号的噪声参考信号而确定阈 值。这可以允许波束形成设备的改进性能并且可以具体地允许采集和 跟踪性能之间的改进的、动态变化的权衡。 10 根据本发明的可选特征,响应于第一输入信号而确定阈值。这可以允许波束形成设备的改进性能并且可以具体地允许采集和 跟踪性能之间的改进的、动态变化的权衡。根据本发明的可选特征,该设备进一步包括用于确定组合的波束 形成信号的可靠性指示的装置并且用于修改的装置被配置为响应于可 15靠性指示而修改更新标准。这可以允许改进的而且更灵活的操作。例如,该设备可操作以工 作在跟踪模式和采集模式,并且可以包括用于响应于可靠性指示而在 这些模式之间切换的装置。修改装置可以被配置为在采集模式而不是 跟踪模式来修改更新标准。可靠性指示可以表示所述波束形成产生包 20括希望的音频源的声束的可能性。根据本发明的可选特征,修改装置被配置为仅当可靠性指示低于 阈值时修改更新标志。这可以允许波束形成设备的改进性能并且可以具体地允许采集和 跟踪性能之间的改进的、动态变化的权衡。 25 根据本发明的第二方面,提供了一种用于通信系统的通信单元,包括用于从第一音频输入产生第一输入信号的装置;用于从第二音 频输入产生第二输入信号的装置;波束形成装置,包括波束形成滤波 器,其用于对第 一和第二输入信号进行滤波以产生组合的波束形成信 号;更新装置,用于如果满足更新标准,则更新波束形成滤波器;自 30适应滤波器,用于对第一输入信号进行滤波以产生第一滤波信号;用 于对第二输入信号和第一滤波信号产生差分信号的装置;用于调整自适应滤波器以最小化差分信号的装置;以及用于响应于差分信号而修 改更新标准的修改装置。根据本发明的第三方面,提供了声束形成的方法,该方法包括 从第一音频输入产生第 一输入信号;从第二音频输入产生第二输入信 5号;波束形成滤波器对第一和第二输入信号进行滤波,以产生组合的 波束形成信号;如果满足更新标准,则更新波束形成滤波器;自适应 滤波器对第一输入信号进行滤波,以产生第一滤波信号;为第二输入 信号和第一滤波信号产生差分信号;调整自适应滤波器以最小化差分信号;以及响应于差分信号而修改更新标准。 io从以下描述的实施例将明了本发明的这些以及其他方面、特征和 优势,并且将参照这些实施例对其加以阐述。参考附图,仅以示例的方式来描述本发明的实施例,在附图中
图1示出了根据本发明的一些实施例的声束形成设备; 15 图2示出了一种移动电话的示例,其包括根据本发明的一些实施例的用于声束形成的装置;图3示出了用于产生用在根据本发明一些实施例的声束形成设备 中的信号的拓朴结构的示例的框图;以及图4示出了根据本发明的一些实施例的声束形成方法。20以下描述集中在适用于语音信号的本发明的实施例,所述语音信号用于蜂窝通信系统的通信单元(诸如全球移动通信系统(GSM)的移 动电话)。然而,应当理解本发明并不限于这个应用,而是可以应用到 包括例如免持的头戴式设备的许多其他器件和设备。25 图1示出了根据本发明的一些实施例的声束形成设备。该设备包括第一和第二输入元件101、 103。在这个具体示例中, 每个输入元件101、 103包括麦克风以及用于对信号进行采样和数字化 以产生形式为数字值的比特流的第 一和第二信号的功能。第一和第二输入元件耦合到波束形成处理器105,波束形成处理器 30被配置为产生组合的波束形成信号z。具体来说,波束形成处理器105 包括波束形成滤波器,其对第 一和/或第二输入信号进行滤波并且组合这些信号以产生对应于朝向希望的音频源的声束的组合信号。然后可以按照单个应用的要求进一步处理波束形成信号Z。对于蜂窝通信单元的具体示例而言,波束形成信号z可以馈入到语音编码器,用于语音编码并且随后通过空中接口传送到基站,或者在将其馈入到5语音编码器之前,可以由频谱后处理器进行处理以进一步减小噪声。随着希望的音频源的移动,调整波束形成处理器105的滤波使得所得到的声束跟随希望的音频源。为此,所述波束形成设备包括耦合到波束形成处理器105的更新处理器107。更新处理器107可以使用任何合适的算法来更新波束形成处理器 io 105的滤波,并且可以具体地使用本技术领域/^知的标准自适应滤波优 化技术,其例如来自波束形成设备或者来自诸如回波消除的类似应用。 更新处理器107耦合到评价更新标准的标准处理器109。如果满足 更新标准,则标准处理器109为更新处理器107产生控制信号,该控 制信号指示更新处理器107可以更新波束形成处理器105。然而,如果 15不满足更新标准,则标准处理器109为更新处理器107产生控制信号, 该控制信号指示更新处理器107可以不更新波束形成处理器105。更新标准通常可以是当前用于更新波束形成处理器105的信号确 实是希望的信号的概率的评价。具体地,更新处理器107可以响应于 波束内信号而更新波束形成处理器105(即假设主波束内的信号确实是 20希望的信号)。因此,标准处理器109可以评价指示波束形成处理器105 目前是否跟踪活动(active)音频源的标准。标准处理器109可以有效防止波束形成处理器105被更新到位于 声束之外的不希望的(潜在较强的)语音源。它因此可以提供增加的 可靠性并且例如在来自主音频源的音频暂停期间可以减小波束被错误 25地引导至不希望的语音源的概率。然而,这个方法也会减小波束形成 设备对主波束之外的音频源形成新波束的能力。因此,不仅波束形成 设备会具有减小的对新音频源的采集性能,而且如杲现有的音频源突 然移动到声束之外,它还会松开现有的音频源。图1的波束形成设备包括可以緩和该问题的功能。 30该波束形成设备包括耦合到第二输入元件103的自适应滤波器 111。自适应滤波器111还耦合到差分处理器113,差分处理器113又耦合到第一输入元件111。因此,差分处理器113接收第一麦克风的信 号以及第二输入信号的滤波信号。具体地,差分处理器113可以产生 差分信号作为这些信号之间的直接差,但是应理解的是,在一些实施 例中,在确定差分信号之前,可以进一步地处理(例如滤波)输入信5号。差分处理器113耦合到适应处理器115,适应处理器115配置为调 整自适应滤波器以最小化差分信号。因此,适应处理器115调整自适 应滤波器lll,以便最小化滤波的输出和来自其他麦克风的输入信号之 间的差分。通过这种方式可以调整自适应滤波器以补偿从主要音频源 io到两个麦克风的声道的差异。实际上,在理想情况下以及对于单个音 频源来说,可以调整自适应滤波器lll使得差分信号基本为零。此外, 其他音频源以及尤其是噪声和干扰源可以导致增强功率的千扰信号。因此,可能归一化的差分信号提供了麦克风当前是否正在采集来 自强音频源的信号的指示。典型地,如果例如扬声器接近麦克风放置,15就可能发生这样的情况。例如,如果波束形成设备是移动电话的一部分,那么可能归一化的差分信号会是用户当前是否正从近距向麦克风 说话或者当前的音频是否主要为背景噪声的良好指示。在图1的示例中,差分处理器113耦合到标准处理器109,并且将 差分信号馈送到标准处理器109。标准处理器109配置为响应于差分信 20 号而纟务改更新标准。具体地,标准处理器109可以被配置为如果差分信号非常接近于 零,表示存在强的、接近的音频源,则放宽更新标准。例如,在正常操作期间,标准处理器109可以忽略差分信号并且 使用预定的标准用于确定是否可以更新波束形成处理器105。然而,如 25果失去了当前音频源,例如由于用户快速改变了相对于设备的位置(例 如移动电话的用户可以从一个耳朵到另一个耳朵来切换位置),那么标 准处理器109可以进入采集模式,其中响应于差分信号而控制更新标 准。如果差分信号足够低,那么标准处理器109可以控制更新处理器 30 107,以便执行波束形成处理器105的更新,而如果差分信号不是足够 ^f氐,那么标准处理器109可以阻止这样的更新。因此通过响应于差分信号而修改更新标准而不是只使用固定的更 新标准,可以实现改进的采集性能同时保持有效的跟踪。作为具体示例,如果波束形成处理器105产生的组合波束形成信 号在相对较长的时间段内幅度较低,那么这也许是因为例如在那个时5间段内语音源保持沉默,或者因为语音源已经相对于麦克风发生了移动,使得语音源当前位于主波束之外。在这种情况下,如果差分信号足够高,由此表示在麦克风处没有接收到主要的音频源,那么标准处理器109可以阻止更新。因为当说 话者长时间只是保持沉默时最可能发生这种情况,这种方法可以允许 io 波束保持在相同的位置,因此当用户再次开始说话时允许有效地捕获信号。然而,如果差分信号足够高,由此表示存在主要音频源但是在主 波束之外,那么标准处理器109可以允许更新波束形成处理器105。因 为当说话者已经相对于麦克风发生了移动时最可能发生这种情况,这15种方法可以允许波束移动到新位置。下文中,将说明使用具体波束形成算法的示范性实施例的更详细 描述。特别地,将描述使用称为噪声消除算法(noise voidalgorithm) 的波束形成算法的实施例。图2示出了根据本发明一些实施例的包括用于声束形成的装置的20 移动电i舌的示例。图2的移动电话包括两个麦克风210、 203。麦克风201、 203耦合 到第一和第二模数转换器205、 207,第一和第二模数转换器205、 207 对来自麦克风201、 203的信号进行采样和数字化,以产生第一和第二 输入信号ul、 u2。噪声消除算法由波束形成器209和后处理器211实25 施。波束形成器209是滤波总和波束形成器(Filtered-Sum Beamformer (FSB)),如在例如欧洲专利号EP0954850-B "Audio Processing arrangement with multiple sources" 中描述的。后处 理器211是动态非平稳噪声抑制器(Dynamic Non-statio證y Noise Suppressor (DNNS)),如在PCT专利申请号WO0358607: "Audio30 Enhancement system having a spectral power dependent processor" 中描述的。更具体地,FSB 209用滤波器/1和/2对麦克风信号Ml和m2进行滤波,并将这些滤波信号求和得到FSB输出z。在频域中,FSB的输出z(uu, 0由下式给出 z(叫,/)=《(叫,(叫,/) +尸2 (0)t, /)w2 (0)*, /).5其中F,和F2是波束形成滤波器的频率响应,并且1表示FFT块。更新滤波器,这样最大化输出Z(Wk, 1),同时对滤波器的权值进行限制,使得<formula>formula see original document page 12</formula>具体地,可以如在滤波声信号领域中对自适应滤波器众所周知的io那样更新滤波器。除了波束形成信号,FSB209还产生两个参考信号,其是波束形成信号的补充。具体地,这些参考信号试图最小化希望的语音,并且因此可以被认为是噪声参考信号,因为它们表示除了麦克风201、 203采集的希望的音频源之外的其他音频信号分量的存在。15 可以按下式计算参考信号<formula>formula see original document page 12</formula>其中An (wk)是N样本的延时,以补偿滤波器中的延时。在该具体示 20例中,只使用了第二噪声参考信号。这个信号可以被表示为<formula>formula see original document page 12</formula>其可重写为<formula>formula see original document page 12</formula>应理解的是,噪声参考信号x,和X2表示第一和第二麦克风201、2 03相对采集的不是来自希望源的音频源的幅度。例如,假设只存在单个希望的音频源并且其由麦克风信号U,和U2代表。在这种情况中,山和仏产生于相同的单一源,但是从单一源到 麦克风201、 203可能经历了不同的声道。执行操作和波束形成以便滤 5波器L和f2补偿这些不同的声道,这样接收直接对应于来自音频信号 的信号的组合信号z。通过用滤波器fl的时逆滤波器F/对组合信号z进行滤波,产生了 在这种理想情况下基本等同于由第一麦克风201产生的信号的信号。 换言之,调整fl使其具有从音频源到第一麦克风201的声道的时逆滤 io 波器响应,并且因此fl的时逆滤波器固有地对应于从音频源到第一麦 克风201的声道的传递函数。由于z对应于来自音频源的原始音频信 号,时逆滤波器F,'的输出在理想情况下将等于ih并且x,将为零。然而,对于其他音频源,时逆滤波器F,将不对应于它们经历的声 道,因此它们将对x,贡献信号分量。此外,实际中,fl不会完全匹配 声道响应,这或者是由于信道估计不准确(滤波器的非理想适应)或 者由于实施不准确,并且这个偏差还会给参考信号x!引入信号分量。上述原理同样适用于X2,并且应理解的是,x,和X2是噪声参考信 号,其指示组合波束形成信号z中存在的噪声。在所述系统中,希望当接收的声信号主要是来自希望源的语音时仅仅更新滤波器。这提高了跟踪性能,并且减小了通过形成新波束错误锁定到不希望的音频源的风险。因此,对于描述的移动电话而言, 希望可以检测想要语音的存在的检测器。不幸的是,稳健的检测器的 设计并不容易,这对实际产品中自适应波束形成器的应用是个主要障碍。 在示例中,移动电话包括用于将FSB 209的更新限制到当期望的说话者讲话时的功能。期望的说话者的这个检测也称为波束内检测, 并且其检测期望的说话者是否在波束形成器的(主)波束内。因此, 后处理器211可以评价更新标准并且仅当满足这个标准时才更新FSB 209。
在这个具体示例中,通过将FSB 209的输出z与参考信号x2进行 比较来在后处理器211中进行波束内检测。具体地,更新标准包括波束形成信号的功率量度高于响应于噪声参考信号而确定的阔值这一标准。更详细地,后处理器211要求Pz〉WbTh一。,J^,其中Pz是组合波束形成信号z的功率,Px2是噪声参考信号x2的功率,WbThw是固定参 数。WbThWd依赖于具体应用以及希望的性能,但是其值通常设为2到 5 3之间。此外,更新标准包括第一输入信号的功率量度高于响应于第二输 入信号而确定的阈值这一标准。这个评价可以对应于直接考虑麦克风 201、 203采集的信号的功率。例如,对于手持应用或头戴式应用,通常可以假设第一麦克风比 io第二麦克风离期望说话者的嘴要近得多。当期望的说话者讲话时,第 一麦克风的信号的功率因此大于第二麦克风的信号的功率。因此,其他考虑包括麦克风功率并且对于波束内检测尤其要求P"〉M—es,Pu2,其中P^是第一麦克风201的信号的功率,Pw是第二麦克风203的信号的功率,MpThresh。,d是固定参数。M一re由'd的优选值依赖于具体应用以及要求15的性能,但是其值通常设为2到10之间。当然更新标准可以依赖于具体应用。例如,对于手持或头戴式应用,在可以更新FSB 209之前必须满足这两个要求。然而,对于免持 应用,满足波束内检测要求就足够了。然而,虽然将FSB 209的更新限制到其中检测器指示希望的音频 20源在主波束之内的情况提供了改进的跟踪性能并且减少了错误锁定的 变化,但是如前所述其仍具有多个缺点。具体地,如果希望的说话者 在与波束形成器的期望不同的位置,那么波束形成器也许永远不会适 应。在启动时,例如,用对应于在希望的说话者的期望位置方向上形 成的波束的滤波器来初始化波束形成器。然而,如果希望的说话者在25另一位置,那么波束形成器也许永远不会适应到这个位置。而且,如果希望的说话者例如在打电话期间移动电话(并且因此改变他相对于 移动电话的位置),那么波束内检测器和/或功率检测器不会检测到语音源确实是希望的语音源并且因此FBS 209不会被更新,也不会适应 到这个新位置。30 在图2的示例中,通过引入其他功能克服了这些缺陷。具体地,移动电话包括自适应滤波器213,其耦合到减法器215和第一模数转换器205。减法器215还耦合到第二模数转换器207。使用频域标记,减法器215的输出信号因此产生差分信号,由下式给出<formula>formula see original document page 15</formula>5 其中H(Wk, 1 )代表自适应滤波器213的频域传递函数。调整自适应滤波器213以最小化u,和U2之间的相关,并且尤其调 整到最小化差分信号r。可以认为差分信号是接近的音频源是否存在的良好指示。例如, 在只有单一音频源的理想情况下,在麦克风201、 203处接收的信号只 io作为音频源和相应麦克风201、 203之间的声道之间的差异的函数而不 同。这个差异可以由自适应滤波器213补偿,并且可以得到基本等于 零的差分信号r。然而,如果不存在主要音频源,那么来自相应麦克风 的信号不能被抵消,而且会导致幅度相当大的差分信号r。通常可以假设接近的语音源确实是希望的语音源,并且差分信号r 15因此可以提供希望的语音源是否存在的单独指示。此外,这个指示独 立于FSB 209的跟踪性能并且不受后处理器209实施的更新标准的影 响。图3示出了用于产生所描述的信号的拓朴结构的示例的框图。 在图2的系统中,减法器215耦合到接收差分信号的修改处理器 20 217。修改处理器217被配置为确定后处理器211的检测算法所使用的 阈值。具体地,修改处理器217确定用以确定阈值的值W bthreshold 和M bthreshold 所述阈值用以确定是否更新FSB 209。在示例中,修改处理器217响应于差分信号而修改值Wbt^sh。ni和 Mbuuw,因此导致用于波束内检测和用于麦克风功率4企测的阈值祐:修 25 改。修改处理器217具体地考虑相对于第二噪声参考信号的功率P"的 差分信号的功率Pr。例如,可以确定下值<formula>formula see original document page 15</formula>应理解的是在一些实施例中,在比较Pr和Px2之前可以补偿Pr或30 Px2。例如,比较r和x2的方程,可以看出u2(wk, 1 )乘以因子A4wO-F2(Wk, 1) F2 '(Wk, 1)。为了校正该因子,Pr可以被修改为1虽然这不是准确的近似,但是在实际中发现可以提供希望的性能。 应理解的是,PP。d是FSB 2 07的波束形成性能和自适应滤波消除的 5相对噪声水平的指示。因此,对于低值的P—来说,自适应滤波器能够 有效地消除麦克风201、 203之间的信号,而FSB 209则不能这样做。 这表示存在强音频信号但是位于FSB 209的声束之外。在图2的示例中,修改处理器217在这种情况下可以放宽后处理 器211的更新标准,由此允许改进的采集性能。标准的放宽可以认为 io是标准的修改,这样在放宽之前本不能允许更新的波束形成设备的至 少一个参数组合现在将允许更新。因此,在FSB 209由于波束内不存 在信号而不能正常更新的情况中,如果差分信号的独立指示表明确实 存在接近的音频源,则可以放宽更新标准。这可以允许FSB 209捕获 这个音频源。15 另一个有用量度是自适应滤波器中的消除量。它的合适量度被标i己为PPCdz,由下式确定 尸-A"*pcdz p 厂wl应理解的是,可以认为Pp^是差分信号功率的归一化量度,并且P一的值越小,消除越好,而且更接近的音频源存在的指示更强烈。20在示例中,修改处理器217评《介两个参数。具体地,如果P—和Ppcciz都足够小,那么减小W bthreshold 和W btlireshold 的值。如果这些值足够小,那么将满足波束内和麦克风功率检测器要求,因此满足更新标准,导致 FSB 209 ^皮更新并且适应于强音频源。在更新FSB 209之后,可以再增加Wbthreshold和W bthreshold 的值。当FSB 209已经收敛时,波束对准希望的25说话者,并且更新标准回到标称值,这样波束形成器对其他音频源不 敏感。因此,可以自动实现跟踪性能和采集功能之间权衡的暂时变化。 下列程序段(使用c语言)给出了修改处理器217的操作的具体 示例if( Ppcd < PpcdThr) M ( Ppcdz <■ PpcdzThr )WbThreshold - MAX(丽hreshold _ 0.1, 1); MpThreshold = MAX(MpThreshold - 0.1, 0,5);else if( ( UpdateOnOff!=0 ) II((Ppcd > 0) M ( Ppcdz< PpcdzThr )))WbThreshold = MIN(WbThreshold +0.02, W跳resholdMax ); MpThreshold - MIli(MpThreshold +0.02, MpThresholdMax );应理解的是,更新标准的修改可以限于其中认为波束形成不可靠的情况。例如,相对于组合参考信号的功率的噪声参考信号X2的功率 可以被认为是波束形成信号的可靠性指示。这个值越小,波束形成信5号越可靠。在简单实施例中,可以将这个可靠性指示与预定阈值进行比较。 如果可靠性指示低于阈值,那么可以认为波束形成器在有效跟踪希望 源的跟踪状态,并且因此可以将更新标准保持在标称值。然而,如果可靠性指示增加到阈值之上(或者第二阔值之上,由 10此在检测中引入滞后),那么可以认为波束形成器已经失去信号并且因 此可能处于采集状态,其中可以放宽更新标准以提高检测希望源的变 化。图4示出了根据本发明一些实施例的声束形成方法。 该方法开始于步骤401,其中在一个时间间隔中从第一音频输入产 15生第一输入信号,并且从第二音频输入产生第二输入信号。步骤401之后是步骤403,其中波束形成滤波器对第一和第二输入 信号进行滤波以产生组合波束形成信号。步骤403之后是步骤405,其中自适应滤波器对第一输入信号进行滤波以产生第一滤波信号。 20 步骤405之后是步骤407,其中产生第二输入信号和第一滤波信号之间的差分信号。步骤407之后是步骤409,其中调整自适应滤波器以最小化差分信步骤409之后是步骤411,其中响应于差分信号而修改更新标准。步骤411之后是步骤413,其中评价更新标准并且如果满足更新标 准,则更新波束形成滤波器。在步骤413之后,该方法返回步骤401,进行下一个时间间隔的处理。5 应理解的是,为清楚起见上述描述参考不同功能单元和处理器对本发明的实施例进行了说明。然而显而易见的是,在不脱离本发明的 前提下可以使用不同功能单元或处理器之间的任何合适的功能分配。 例如,示为由分开的处理器和控制器执行的功能可以由同一的处理器 或控制器执行。因此,对具体功能单元的引用只能被看作是对用于提 (> 供所述功能的适当装置的引用,而不是表示严格的逻辑或物理结构或 构造。可以以包括硬件、软件、固件或其任意组合的任何合适的形式来 实施本发明。可选地,本发明可以至少部分地实施为在一个或多个数 据处理器和/或数字信号处理器上运行的计算机软件。本发明实施例的15 元件和部件可以以任何适当形式从物理上、功能上和逻辑上实施。实 际上,可以在单个单元、多个单元或作为其他功能单元的一部分来实 现所述功能。同样,可以在单个单元中实施本发明,或者本发明可以 从物理上、功能上分配在不同单元和处理器之间。虽然结合一些实施例对本发明进行了描述,但这并不意味着将本20发明限于此处所述的具体形式。相反,本发明的范围仅由随附的权利 要求所限定。另外,虽然好像结合特定实施例描述了特征,本领域技 术人员应认识到,可以根据本发明组合所描述实施例的各个特征。在 权利要求书中,术语包括并不排除其他元件或步骤的存在。此外,虽然单独列出,但是可以通过例如单个单元或处理器来实25 施多个装置、元件或方法步骤。另外,虽然单个特征可以包舍在不同 的权利要求中,这些可能有利地结合,并且在不同权利要求中的包含 不意味着这些特征的组合不是可行的和/或有利的。而且,在一类权利 要求中包含一特征并不意味着限于该类,而是表示该特征同样适用于 其他权利要求类。此外,权利要求中的特征的顺序并不意味这些特征30 必须按照任何具体顺序来实施,特别地,方法权利要求中的各个步骤 的顺序不意味着必须以这样的顺序执行这些步骤。相反,这些步骤可以按任何合适的顺序来执行。此外,单数引用并不排除多数。因此对 "一"、"第一"、"第二"等的引用不排除多数。提供权利要求中的参 考标记仅仅是为了阐明示
权利要求
1.一种用于声束形成的设备,该设备包括用于从第一音频输入产生第一输入信号的装置(101);用于从第二音频输入产生第二输入信号的装置(103);波束形成装置(105),包括波束形成滤波器,该波束形成滤波器用于对第一和第二输入信号进行滤波以产生组合波束形成信号;更新装置(107),用于如果满足更新标准,则更新波束形成滤波器;自适应滤波器(111),用于对第一输入信号进行滤波以产生第一滤波信号;用于产生针对第二输入信号和第一滤波信号的差分信号(113)的装置;用于调整自适应滤波器以最小化差分信号的装置(115);以及修改装置(109),用于响应于差分信号而修改更新标准。
2.权利要求1的设备,其中波束形成装置(105)被配置为产生第 一输入信号和第二输入信号的至少其中 一 个相对于组合波束形成信号的噪声参考信号。
3.权利要求2的设备,其中更新标准包括波束形成信号的功率量 度高于响应于噪声参考信号而确定的阈值这一标准。 20
4.权利要求3的设备,其中修改装置(109)被配置为响应于差分信号而修改阈值。
5. 权利要求l的设备,其中更新标准包括第一输入信号的功率量 度高于响应于第二输入信号而确定的阈值这 一标准。
6. 权利要求5的设备,其中修改装置(109)被配置为响应于差 25 分信号而修改阈值。
7. 权利要求1的设备,其中修改装置(109)被配置为如果差分 信号低于阈值,则放宽更新标准。
8. 权利要求7的设备,其中响应于第一输入信号和第二输入信号 的至少其中一个相对于组合波束形成信号的噪声参考信号而确定阈30 值。
9. 权利要求7的设备,其中响应于第一输入信号而确定阈值。
10. 权利要求1的设备,其中该设备进一步包括用于确定组合波 束形成信号的可靠性指示的装置并且用于修改的装置(109)被配置为 响应于可靠性指示而修改更新标准。
11. 权利要求10的设备,其中修改装置(109)被配置为如果可 5靠性指示低于阈值,则仅仅修改更新标准。
12. —种用于通信系统的通信单元,包括 用于从第一音频输入产生第一输入信号的装置(201, 205 ); 用于从第二音频输入产生第二输入信号的装置(203, 307 ); 波束形成装置(209 ),包括波束形成滤波器,该波束形成滤波器用于对第一和第二输入信号进行滤波以产生组合波束形成信号;更新装置(211),用于如果满足更新标准,则更新波束形成滤波器;自适应滤波器(213),用于对第一输入信号进行滤波以产生第一 滤波信号; 用于产生针对第二输入信号和第 一 滤波信号的差分信号的装置(215);用于调整自适应滤波器(213)以最小化差分信号的装置(213, 215);以及修改装置(217),用于响应于差分信号而修改更新标准。
13. —种声束形成方法,该方法包括从第一音频输入产生(401)第一输入信号; 从第二音频输入产生(401)第二输入信号;波束形成滤波器对第一和第二输入信号进行滤波(403 )以产生组 合波束形成信号; 如果满足更新标准,则更新(405)波束形成滤波器;自适应滤波器对第一输入信号进行滤波(407 )以产生第一滤波信产生针对第二输入信号和第一滤波信号的差分信号(409 ); 调整(4U)自适应滤波器以最小化差分信号;以及 30 响应于差分信号而修改(413)更新标准。
14. 一种用于执行权利要求13的方法的计算机程序产品。
全文摘要
一种用于声束形成的设备包括用于从两个音频输入产生波束形成信号的波束形成处理器(105)。如果满足更新标准,那么更新处理器(107)更新波束形成处理器(105)的波束形成滤波器。自适应滤波器(111)对来自其中一个信号的信号进行滤波,并且产生滤波信号和来自另一个音频输入(101)的信号之间的差分信号。适应处理器(115)调整自适应滤波器(111)以最小化差分信号。标准处理器(109)响应于(可能归一化的)差分信号而修改更新标准。具体来说,如果差分信号指示在波束形成处理器(105)的波束之外的强信号,则放宽更新标准以改进采集性能。
文档编号H04R3/00GK101218848SQ200680024834
公开日2008年7月9日 申请日期2006年7月3日 优先权日2005年7月6日
发明者I·L·D·M·默克斯 申请人:皇家飞利浦电子股份有限公司