多通道群稀疏线性预测时延估计方法

文档序号:9886370阅读:1193来源:国知局
多通道群稀疏线性预测时延估计方法
【技术领域】
[0001] 本发明属于声源定位技术领域,更为具体地讲,涉及一种多通道群稀疏线性预测 时延估计方法。
【背景技术】
[0002] 时延估计是利用传声器阵列拾取的声信号估计声源到各阵元间的到达时间差,在 雷达、声呐以及免提语音通信系统的声源定位和跟踪中扮演着极其重要的角色。常见的时 延估计方法有广义互相关方法、盲通道辨识方法、信息论方法、基于语音信号的某些特征进 行时延估计等。然而在室内声环境下,由于噪声和混响的不利影响,基于传声器阵列的时延 估计是一项具有挑战性的工作。
[0003] 为了提高时延估计对噪声和混响的鲁棒性,一种多通道互相关系数方法被提出, 其具体方法可参考文献"J.Chen,J.Benesty, and Y.Huang, "Robust time delay estimation exploiting redundancy among multiple microphonesIEEE Trans . Speech Audio Process·,vol·11,no·6,pp·549-557,Nov·2003·"和 "J·Benesty, J.Chen,and Y.Huang,"Time-delay estimation via linear interpolation and crosscorrelation, ,! IEEE Trans . Speech Audio Process. ,vol.12,no.5,pp.509-519, Sep.2004."。相对于传统的双通道方法,多通道互相关系数方法利用多只传声器间的空间 冗余信息抑制噪声和混响的影响,极大地提高了时延估计对噪声的鲁棒性。然而,这种多通 道方法对混响仍然敏感。多通道空时预测方法对多通道互相关系数方法进行了推广,其具 体方法可参考文献"H.He,L.Wu,J.Lu,X.Qiu,and J.Chen, "Time difference of arrival estimation exploiting multichannel spatio-temporal predictionIEEE Trans .Audio Speech Lang .Process · , vol · 21 ,pp · 463-475 ,Mar· 2013 ·"。这种方法以目前 最优的方式利用空间和时间信息预白化传声器信号,由此获得时延估计对混响的鲁棒性。 然而,这种方法在低信噪比条件下性能降低。
[0004] 线性预测广泛应用于语音处理。传统的线性预测器由长时预测器和短时预测器级 联组成。对于语音信号,这种结构的预测系数向量具有高度的稀疏性。该特性目前已成功应 用于语音编码领域。然而,当语音信号受到噪声污染时,这种稀疏性降低甚至消失,线性预 测器的性能急剧下降。在最近的研究中"H.He,T.Yang,and J.Chen,"0n time delay estimation from a sparse linear prediction perspective /'J.Acoust.Soc.Amer., vol. 137,no. 2,pp. 1044-1047,Feb. 2015一种稀疏线性预测时延估计方法被提出。这种方 法在最小二乘基础上引入一个稀疏正则化项,构成一种Wli范数优化方法,提高了时延估 计对噪声的鲁棒性。但该方法是在双通道情形下对两个通道的数据分别进行预白化,也即 仅仅对数据进行时间预白化,没有综合利用多通道空间和时间预测的白化能力,从而降低 该方法的估计性能。

【发明内容】

[0005] 本发明的目的在于克服现有技术的不足,提供一种多通道群稀疏线性预测时延估 计方法,利用预测系数矩阵列向量的群稀疏特性构建一个F/l 1>2范数优化准则,统一了多通 道互相关系数方法和多通道空时预测方法,联合应用空间和时间线性预测的白化能力,以 提尚时延估计性能。
[0006] 为实现上述发明目的,本发明多通道群稀疏线性预测时延估计方法包括以下步 骤:
[0007] S1:M只传声器分别对声源信号进行持续采集,第m只传声器采集的时域信号记为 Xm= [Xm(0),Xm(l),…,Xm(L-l)],其中m=l,2,…,M,Xm(n)表示第m只传声器在时刻η的采集 样本,η = 0,1,…,L-l,L表示每只传声器采集的样本数量;
[0008] S2:令时移序号d = l,声源信号到达第1只和第2只传声器间的初始时移?1 = -?_\, Pmax表示时延的最大可能值;
[0009] S3:分别将第m只传声器采集的信号Xm按照时延匕(?(1)进行时移,fm(pd)表示声源信 号到达第1只和第m只传声器间的相对时延,该时延是关于时移p d的函数;时移后的信号中 每个样本记为Xm(n,pd),将Μ只传声器在时刻η的时移样本Xm(n,pd)进行叠放,得到信号向量 x(n,pd);
[0010] S4:求解以下公式,得到预测系数矩阵A(pd):
[0011]
[0012] 其中,I卜I |F表示矩阵的F范数,||·1表示矩阵的12范数,λ是正则化参数,取值范 围为λ>〇;
[0013] X(0,pd) = [x(0,pd) x(l,pd)…x(K+L_l,pd)]T
[0014] Y(-l,pd) = [y(-l,pd) y(0,pd)…y(K+L-2,pd)]T
[0015] 其中:
[0016] x(w,pd) = [xi(w,pd),X2(w,pd),]τ
[0017]
[0018] Xm(W-l,Pd) = [Xm(W_l,Pd),Xm(W_2,Pd),···XmCw-Kjd)]1'
[0019] w = 0,l,···,K+L_1 ;K表示预测器阶数,其取值范围为K<L;对于Xm(q,pd),如果q<0 Sq>L_l,则令xm(q,pd)=0;
[0020] S5:计算预测误差矩阵E(0,pd):
[0021 ] E(0,pd) =X(0 ,pd)-Y(-l ,pd)A(pd)
[0022] S6:计算预测误差相关矩阵R(pd):
[0023]
[0024] S7:计算多通道互相关系数p(pd):
[0025]
[0026] 其中det( ·)表示方阵的行列式,rm,m(pd)是矩阵R(pd)的第m个对角元素;
[0027] S8 :如果Pd < PmaX,令Pd = pd+1,返回步骤S3,否则根据以下公式求得时延估计值r
[0028]
[0029] 本发明多通道群稀疏线性预测时延估计方法,采用各个可能的时延值计算多通道 互相关系数,将多通道互相关系数的平方最大值所对应的时延作为时延估计值;多通道互 相关系数的计算方法为:对每只传声器拾取的声信号分别截取一个长度为L的信号帧,对这 些信号帧进行时移后叠放成信号向量以及信号矩阵,根据F/l 1>2范数优化准则建立时延估 计模型,求解群稀疏预测系数矩阵,然后计算预测误差相关矩阵,根据预测误差相关矩阵计 算得到多通道互相关系数。
[0030] 本发明将基于稀疏线性预测的h/h范数优化方法推广到多通道,提出了一种多通 道群稀疏线性预测时延估计方法。本发明利用预测系数矩阵列向量的群稀疏特性构建一个 F/l1>2范数优化准则,从时延估计性能角度统一了多通道互相关系数方法和多通道空时预 测方法。本发明还可以通过调节正则化参数来构建一组在传声器信号预白化和非预白化间 可作折中处理的时延估计器,以适应不同需求。
【附图说明】
[0031] 图1是基于最小二乘的多通道空时预测器对纯净语音预测时预测系数矩阵的一个 列向量;
[0032] 图2是基于最小二乘的多通道空时线性预测器对含噪语音预测时预测系数矩阵的 一个列向量;
[0033]图3是采用本发明对含噪语音预测时预测系数矩阵的一个列向量;
[0034] 图4是本发明多通道群稀疏线性预测时延估计方法的流程图;
[0035] 图5是基于增广拉格朗日乘子交替方向法求解预测系数矩阵的流程图;
[0036] 图6是噪声和混响环境下各方法时延估计性能随传声器个数变化的曲线图;
[0037] 图7是噪声环境下各方法时延估计性能随混响时间变化的曲线图;
[0038]图8是轻度混响环境下各方法时延估计性能随信噪比SNR变化的曲线图;
[0039] 图9是中度混响环境下各方法时延估计性能随信噪比SNR变化的曲线图;
[0040] 图10是轻度混响环境下本发明时延估计性能随参数δ变化的曲线图;
[0041] 图11是中度混响环境下本发明时延估计性能随参数δ变化的曲线图。
【具体实施方式】
[0042]下面结合附图对本发明的【具体实施方式】进行描述,以便本领域的技术人员更好地 理解本发明。需要特别提醒注意的是,在以下的描述中,当已知功能和设计的详细描述也许 会淡化本发明的主要内容时,这些描述
当前第1页1 2 3 4 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1