在这里将被忽略。
[0043] 实施例
[0044] 为了更好地说明本发明的技术内容,首先对本发明所使用的信号模型及方法推导 进行说明。
[0045] 假设一宽带声源辐射平面波信号,Μ只传声器构成的阵列用于接收声信号。如果选 择第1只传声器作为参考点,贝U第m只传声器在时刻η拾取的信号样本Xm(n)可表不为:
[0046] Xm(n) =ams[n-t-fm(x) ]+wm(n) (1)
[0047] 其中,111=1,2,-_,,<^是声信号传输效应导致的衰减因子,8(11)是未知的零均值 因果宽带声源信号,t是从声源到第1只传声器间的传输时间,w m(n)是第m只传声器上的加 性噪声,假设该噪声与声源信号以及其它传声器的噪声不相关,τ是声源信号到达第1只和 第2只传声器间的时延,f m(i)是声源信号到达第1只和第m只传声器间的相对时延,它是时 延τ的函数。本实施例为了易于推导与实验,假设使用等间距的线性阵列,则在远场条件下 fm(T) = (m-l)T0
[0048] 在上述信号模型基础上,时延估计的目的是给定Μ只传声器采集的样本信号来估 计时延τ。对于一个假定的时延Ρ,利用时移信号 Xm(n+fm(p))对齐传声器信号。当ρ = τ时,皿只 传声器信号对齐,此时Μ只传声器拾取的信号间相似性最大。为简化符号,将Xm(n+fm(P))记 为Xm(n,p)〇
[0049] 将Μ只传声器在时刻η拾取的信号样本表不成一个向量:
[0050] χ(η,ρ) = [χι(η,ρ),Χ2(η,ρ)^··ΧΜ(η,ρ)]Τ (2)
[0051]其中,xm(n,p)表不第m只传声器在时刻η的信号样本的时移信号,(· "表不向量或 矩阵的转置。
[0052]为了便于推导,对第m只传声器的信号在时刻η-1定义另一个向量:
[0053] xm(n-l,p) = [Xm(n_l,p),xm(n_2,p),…Xm(n_K,p) ]T (3)
[0054] 其中Κ表示预测器阶数,其取值范围为1(<匕
[0055] 现在利用Μ个通道过去的信号向量χι(η_1,ρ)、Χ2(η_1,ρ)、…、ΧΜ(η_1,ρ)来预测X (114),即预测值奴/人^)表示为:
[0056]
(4)
[0057] 其中AJ/Oe'K##是多通道前向预测器的系数矩阵。
[0058] 于是,可得预测误差向量e(n,p)的表达式为:
[0059]
(3)
[0060] e(n,p)可以记为:
[0061] e(n,p) = [ei(n,p),e2(n,p),"eM(n,p)]T (6)
[0062] A(p)是KMXM的多通道前向预测系数矩阵,可以表示为:
[0063] Α(ρ) = [Αι(ρ) A2(p)…Am(p)]t (7)
[0064] y(n-l,p)是Μ只传声器在时刻η-1拾取的信号向量,可以表不为:
[0065]
(8)
[0066] 根据以上推导过程可以看出,公式(5)是采用Μ个通道时刻η-Κ到时刻η-1的样本预 测Μ个通道时刻η的样本,以期获得对应的预测系数矩阵。在实际应用中,为了利用预测稀疏 矩阵的群稀疏特性以提高时延估计的准确度,需要将(5)写成矩阵方程。因此利用Μ只传声 器采集的长度分别为L的数据帧,根据公式(5)扩展得到:
[0067] E(n,p)=X(n,p)-Y(n-l ,p)A(p) (9)
[0068] 其中:
[0069] E(n,p) = [e(n,p) e(n+l,p) ··· e(n+K+L_l,p)]T (10)
[0070] X(n,p) = [x(n,p) x(n+l,p) ··· x(n+K+L_l,p)]T (11)
[0071] Y(n-l,p) = [y(n_l,p) y(n,p)…y(n+K+L_2,p)]T (12)
[0072] 其中,X(n,pd)是(K+L) XM的矩阵,Y(n-1,pd)是(K+L) XKM的矩阵。本发明中,将传 声器采集的长度为L的样本中第一个样本序号作为时刻η来构建X(n,pd)和Y(n-l,p d),即n = 0。由于数据帧的长度为L,那么在构建X(n,p)和Y(n_l,p)时,对于时刻q的信号样本Xm(q, P),如果q<〇Sq>L_l,则令xm(q,p)=0。
[0073] 传统线性预测器由长时预测器和短时预测器级联组成,由此预测器系数向量具有 高度的稀疏性。因此在多通道线性预测中,预测器系数矩阵也具有稀疏性。以预测器阶数为 80、传声器采集的语音帧长度为1024个采样点、4只传声器用于时延估计为例,对多通道预 测器的系数矩阵进行分析。图1是基于最小二乘的多通道空时预测器对纯净语音预测时预 测系数矩阵的一个列向量。从图1可以看出,基于最小二乘的多通道空时线性预测系数矩阵 的列向量是稀疏的,而且预测系数矩阵不同列向量的大能量样本基本上处于相同的位置, 这说明所有列向量具有类似的群稀疏特性。图2是基于最小二乘的多通道空时线性预测器 对含噪语音预测时预测系数矩阵的一个列向量。图2中语音信号的信噪比SNR = 5dB。从图2 可以看出,当存在噪声时,预测器系数矩阵的稀疏特性降低。既然对于纯净语音信号,预测 器系数矩阵是群稀疏的,则可利用这一特性来提高噪声环境下线性预测器的鲁棒性。为此, 本发明在最小二乘基础上引入一个预测系数矩阵的群稀疏正则化约束,强制预测系数矩阵 的列向量具有相同的稀疏结构。于是,提出如下F/l 1>2范数优化准则来预处理传声器信号:
[0074]
(Π )
[0075] 其中,| | · | |F表示矩阵的F范数,λ是正则化参数,取值范围为λ>〇
玎表 示为:
[0076]
(14)
[0077] 其中,I ·||&表示矩阵或向量的12范数,AVp)表示预测系数矩阵Α(ρ)的第i行。
[0078] 本发明中,令n = 0,求解公式(13)即可得到预测系数矩阵A(p),再根据预测系数矩 阵A(p)即可计算出时延。
[0079]图3是采用本发明对含噪语音预测时预测系数矩阵的一个列向量。图3中语音信号 的信噪比SNR = 5dB,从图3可以看出,在噪声环境下通过本发明所提出的如下F/l1>2范数优 化准则可以获得稀疏的预测系数矩阵。
[0080]基于以上推导,可以得到本发明多通道群稀疏线性预测时延估计方法。图4是本发 明多通道群稀疏线性预测时延估计方法的流程图。如图4所示,本发明多通道群稀疏线性预 测时延估计方法的具体步骤包括:
[0081 ] S401:信号采集:
[0082] Μ只传声器分别对声信号进行持续采集,第m只传声器采集的时域信号记为Xm=[xm (0),Xm(l),. . .,Xm(L-l)],其中m=l,2,. . .,M,Xm(n)表示第m只传声器在时亥Ijn的采集样本, η = 0,1,. . .,L-1,L表示每只传声器采集的样本数量。
[0083] S402:初始化时移序号:
[0084] 令时移序号d=l,声源信号到达第1只和第2只传声器间的初始时移?1 = -?腹,?應 表示时延的最大可能值。
[0085] S403:信号时移:
[0086]分别将第m只传声器采集的信号Xm按照时延匕(?(1)进行时移,fm( Pd)表示声源信号 到达第1只和第m只传声器间的相对时延,该时延是关于时移pd的函数。时移后的信号样本 即为Xm(t+f m(pd)),为简化表达,记第m只传声器在时刻η的时移信号为Xm(n,p d)。将Μ只传声 器在时刻η的时移信号Xm(n,Pd)进行叠放,得到信号向量x(n,p d)。
[0087] S404:求解预测系数矩阵:
[0088]求解以下公式,得到预测系数矩阵A(pd):
[0089]
(15)
[0090] 其中,A(pd)是KMXM的矩阵,| | · | |f表示矩阵的F范数,|·1表示矩阵或向量的I2范 数,λ是正则化参数,取值范围为λ> 〇,
[0091] X(0,pd) = [x(0,pd) x(l,pd) ... x(K+L~l ,pa) ]τ (16)
[0092] Y(-l,pd) = [y(-l,pd) y(0,pd) ... y(K+L-2,pd)]T (17)
[0093] 其中:
[0094] x(w,pd) = [xi(w,pd),X2(w,pd),···XM(w,pd) ]T (18)
[0095]
(19)
[0096] Xm(w-1 ,pa) = [xm(w-l ,pa) ,Xm(w-2,pd), -Xm(w~K,pa)]T (20)
[0097] w = 0,l,…,K+L-1;K表示预测器阶数,其取值范围为1(<匕对于构建矩阵X(0,p