专利名称::通过可控组合环境与矩阵解码信号分量进行的环绕声音频通道的混合推导的利记博彩app
技术领域:
:本发明涉及音频信号处理。更加具体地,涉及从源音频信号获得环境信号分量,从源音频信号获得矩阵解码信号分量,并且对环境信号分量与矩阵解码信号分量进行可控组合。引用结合以下参考文献每个都以其整体通过引用结合于此。C.AvendanoandJean-MarcJot,"FrequencyDomainTechniquesforStereotoMultichannelUpmix,"AES22ndInt.ConfonVirtual,SyntheticEntertainmentAudio;E.Zwicker,H..Fastl,"Psycho-acoustics,"SecondEdition,Springer,1990,Germany;B.Crockett,"ImprovedTransientPre-NoisePerformanceofLowBitRateAudioCodersUsingTimeS.calingSynthesis,"PaperNo.6184,117thAESConference,SanFrancisco,Oct.2004;UnitedStatesPatentApplicationS.N.10/478,538,PCTfiledFebruary26,2002,publishedasUS2004/0165730AlonAugust26,2004,"SegmentingAudioSignalsintoAuditoryEvents,"BrettG.Crockett.A.Seefeldt,M.Vinton,C.Robinson,"NewTechniquesinSpatialAudioCoding,"P叩erNo.6587,119'hAESConference,NewYork,Oct2005.UnitedStatesPatentApplicationS.N.10/474,387,PCTfiledFebruary12,2002,publishedasUS2004/0122662AlonJune24,2004,"HighQualityTime-ScalingandPitch-ScalingofAudioSignals,"BrettGrahamCrockett.UnitedStatesPatentApplicationS.N.10/476,347,PCTfiledApril25,2002,publishedasUS2004/0133423AlonJuly8,2004,"TransientPerformanceofLowBitRateAudioCodingSystemsByReducingPre-Noise,"BrettGrahamCrockett.UnitedStatesPatentApplicationS.N.10/478,397,PCTfiledFebruary22,2002,publishedasUS2004/0]72240AlonJuly8,2004,"ComparingAudioUsingCharacterizationsBasedonAuditoryEvents,"BrettG.Crockettetal.UnitedStatesPatentApplicationS.N.10/478,398,PCTfiledFebruary25,2002,publishedasUS2004/0148159AionJuly29,2004,"MethodforTimeAligningAudioSignalsUsingCharacterizationsBasedonAuditoryEvents,"BrettG.Crockettetal.UnitedStatesPatentApplicationS.N.,78,398,PCTfiledFebruary25,2002,publishedasUS2004/0148159AlonJuly29,2004,"MethodforTimeAligningAudioSignalsUsingCharacterizationsBasedonAuditoryEvents,"BrettG.Crockettetal.UnitedStatesPatentApplicationS.N.10/911,404,PCTfiledAugust3,2004,publishedasUS2006/0029239AlonFebruary9,2006,"MethodforCombiningAudioSignalsUsingAuditorySceneAnalysis,"MichaelJohnSmithers.InternationalApplicationPublishedUnderthePatentCooperationTreaty,PCT/US2006/020882,InternationalFilingDate26May2006,designatingtheUnitedStates,publishedasWO2006/132857A2andA3on14December2006,"ChannelReconfigurationWithSideInformation,"AlanJeffreySeefeldt,etal,InternationalApplicationPublishedUnderthePatentCooperationTreaty,PCT/US2006/028874,InternationalFilingDate24July2006,designatingtheUnitedStates,publishedasWO2007/016107A2on8February2007,"ControllingSpatialAudioCodingParametersasaFunctionofAuditoryEvents,"AlanJeffVeySeefeldt,etal.nternationalApplicationPublishedUnderthePatentCooperationTreaty,PCT/US2007/004904,InternationalFilingDate22February2007,designatingtheUnitedStates,publishedasWO2007/106234Alon20September2007,"RenderingCenterChannelAudio,"MarkStuartVinton.InternationalApplicationPublishedUnderthePatentCooperationTreaty,PCT/US2007/008313,InternationalFilingDate30March2007,designatingtheUnitedStates,publishedasWO2007/127023on8November2007,"AudioGainControlUsingSpecificLoudness-BasedAuditoryEventDetection,"BrettG.Crockett,etal.
背景技术:
:6从标准矩阵编码双通道立体声材料(其中通道通常被指示为"Lt"和"Rt")或者从非矩阵编码双通道立体声材料(其中通道通常被指示为"Lo"和"Ro")创建多通道音频材料通过环绕通道的推导而增强。然而,环绕通道针对每个信号类型(矩阵和非矩阵编码材料)的角色非常不同。对于非矩阵编码材料,使用环绕通道来强调原始材料的环境常常产生听觉愉悦的结果。然而,对于矩阵编码材料,所希望的是重新创建或逼近原始环绕通道的摇摄声像。进而,所希望的是提供下述装置,该装置以最适当的方式自动处理环绕通道,而不管输入类型(非矩阵或矩阵编码),不需要收听者选择解码模式。目前存在用于将两个通道向上混合为多个通道的许多技术。这样的技术范围从简单固定的或无源的矩阵解码器延伸到有源矩阵解码器以及用于环绕通道推导的环境提取技术。最近,用于推导环绕通道的频域环境提取技术(例如参见参考文献1)已示出了用于创建令人愉快的多通道体验的承诺。然而,这样的技术并没有从矩阵编码(URt)材料中再现环绕通道图像,因为它们主要针对非矩阵编码(LoRo)材料而设计。代替地,无源和有源矩阵解码器做出了隔离用于矩阵编码材料的环绕摇摄图像的相当好的工作。然而,与矩阵解码相比,环境4^取技术为非矩阵编码材料提供了更好的性能。使用当前生成的向上混合器,收听者常常需要切换向上混合系统以选择最匹配输入的音频材料的一个。因此本发明的目的是在没有对用户在操作的解码模式之间进行切换的任何要求的情况下,创建对于矩阵和非矩阵编码材料两者都听觉愉悦的环绕通道信号。
发明内容根据本发明的方面,提供了一种用于从两个输入的音频信号获得两个环绕声音频通道的方法,其中所述音频信号可以包括通过矩阵编码生成的分量,该方法包括从所述音频信号获得环境信号分量;从所述音频信号获得矩阵解码信号分量;以及对环境信号分量和矩阵解码信号分量进行可控组合以提供所述环绕声音频通道。获得环境信号分量可以包括向输入的音频信号施加动态变化的环境信号分量增益标度因数。环境信号分量增益标度因数可以是输入的音频信号的交X^目关的测度的函数,其中,例如环境信号分量增益标度因数随着交3U目关度增加而下降,反之亦然。交叉相关的测度可以是时间平滑的,并且例如交叉相关的测度可以通过以下而时间平滑使用信号相关泄漏积分器,或者代替地使用移动平均。时间平滑可以是信号自适应的,使得例如时间平滑响应于镨分布的变化而适应。才艮据本发明的方面,获得环境信号分量可以包括施加至少一个解相关滤波器序列。相同的解相关滤波器序列可以施加到输入的音频信号中的每一个,或者代替地,不同的解相关滤波器序列可以施加到输入的音频信号中的每一个。根据本发明的进一步的方面,获得矩阵解码信号分量可以包括施加矩阵解码至输入的音频信号,所述矩阵解码适合于提*个与后环绕声方向相关联的第一和第二音频信号。可控组合可以包括施加增益标度因数。增益标度因数可以包括在获得环境信号分量时施加的动态变化的环境信号分量增益标度因数。增益标度因数可以进一步包括向与后环绕声方向相关联的第一和第二音频信号中的每一个施加的动态变化的矩阵解码信号分量增益标度因数。矩阵解码信号分量增益标度因数可以是输入的音频信号的交5U目关的测度的函数,其中例如动态变化的矩阵解码信号分量增益标度因数随着交叉相关度增加而增加,并且随着交5U目关度减少而减少。动态变化的矩阵解码信号分量增益标度因数和动态变化的环境信号分量增益标度因数可以以保存矩阵解码信号分量和环境信号分量的组合能量的方式相对于彼此增加和减少。增益标度因数可以进一步包括用于进一步控制环绕声音频通道增益的动态变化的环绕声音频通道的增益标度因数。环绕声音频通道的增益标度因数可以是输入的音频信号的交^U目关的测度的函数,其中例如该函数使环绕声音频通道增益标度因数随着交^u目关的测度减少直到下述值而增加,在所述值之下,环绕声音频通道的增益标度因数减少。本发明的各个方面可以在时间频率域中执行,其中例如本发明的方面可以在时间频率域中的一个或多个频带中执行。要生i环4通道。众所周知的矩阵解码S统对于矩阵编码材料工作良好,而环境"提取"技术则对于非矩阵编码材料工作良好。为了避免需要收听者在向上混合的两个模式之间切换,本发明的方面在矩阵解码和环境提取之间可变地调配,以自动为当前输入的信号类型提供适当的向上混合。为了实现这一点,原始输入通道之间的交ibf目关的测度控制来自局部矩阵解码器(在矩阵解码器仅需要解码环绕通道的意义上的"局部的直接信号分量与环境信号分量的比例。如果两个输入的通道高度相关,那么比环200880018896境信号分量更多的直接信号分量被施加到环绕通道。相反地,如果两个输入的通道解相关,那么比直接信号分量更多的环境信号分量被施加到环绕通道。诸如参考文献1中公开的那样的环境提取技术从原始前通道中去除环境音频分量并将它们摇摄到环绕通道,这可以加强前通道的宽度并改善包络感。然而,环境提取技术并不将离散图像摇摄到环绕通道。另一方面,矩阵解码技术做出了将直接图像(与反映或"间接"的回响或环境声相对照的具有从源到收听者位置的直接路径的声音的意义上的"直接")摇摄到环绕通道的比较好的工作,并因此能够更加如实地重构矩阵编码材料。为了利用两种解码系统的力量,环境提取和矩阵解码的混合是本发明的一个方面。本发明的目的是在不需要收听者切换模式的情况下,从矩阵编码或非矩阵编码的双通道信号中创建听觉愉悦的多通道信号。为了简化起见,在使用左、右、左环绕和右环绕通道的四通道系统的环境下描述本发明。然而本发明可以扩展到五通道或更多。尽管可以使用用于提供中央通道作为第五个通道的任何不同的已知技术,在MarkStuartVinton的名称为"RenderingCenterChannelAudio"的2007年2月22日申请并于2007年9月20日公布的专利^ft条约WO2007/106324Al之下公布的国际申请中描述了一种特别有用的技术。所述WO2007/106324Al乂^布以其整体通过引用结合于此。图1示出了才艮据本发明的方面的用于从两个输入的音频信号中推导两个环绕声音频通道的装置或过程的示意性功能框图。图2示出了其中在时间频率域中执行处理的根据本发明的方面的音频向上混合器或向上混合过程的示意性功能框图。图2装置的一部分包括图1的装置或过程的时间频率域实施例。图3描绘了可以在实施本发明的方面时使用的可用于时间频率变换中的两个连续短时间离lt傅立叶变换(STDFT)时间块的适当分析/合成窗对。图4示出了对于44100Hz的采样率的以赫兹计的每个带的中心频率的曲线图,该采样率可以在实施本发明的方面时使用,其中增益标度因数被施加到每个具有近似一半临界带宽的谱带中的各个系数。图5在平滑系数(垂直轴)对比于变换块数(水平轴)的曲线图中示出了信号相关泄漏积分器的a(alpha)参数的示例性响应,该信号相关泄漏积分器可以用作在实施本发明的方面时在减少交叉相关的测度的时间偏差时使用的估计器。听觉事件边界的发生表现为刚好在块20之前的块边界处的平滑系数的急剧下降。图6示出了根据本发明的方面的图2的音频向上混合器或向上混合过程的环绕声获得部分的示意性功能框图。为了表示简化起见,图6示出了多个频带之一中的信号流的示意图,应理解全部的多个频带中的组合行为产生了环绕声音频通道Ls和R。图7示出了增益标度因数G;,和G;(垂直轴)对比于相关系数(PM…,6))(水平轴)的曲线图。具体实施例方式图1示出了根据本发明的方面的用于从两个输入的音频信号中推导两个环绕声音频通道的装置或过程的示意性功能框图。输入的音频信号可以包括通过矩阵编码生成的分量。输入的音频信号可以是一M示左右声音方向的两个立体声音频通道。如上所述,对于标准矩阵编码双通道立体声材料,通道通常被指示为"Lt"和"Rt",而对于非矩阵编码双通道立体声材料,通道通常被指示为"Lo"和"Ro"。这样一来,为了指示输入的音频信号有时可以是矩阵编码的而在其它时间不是矩阵编码的,在图1中将输入标记为"Lo/Lt"和"Ro/Rt"。图1例子中的两个输入音频信号^L施加到局部矩阵解码器或解码函数("局部矩阵解码器")2,其响应于成对的输入音频信号而生成矩阵解码信号分量。从两个输入的音频信号中获得矩阵解码信号分量。具体地,局部矩阵解码2适合于提*个与后环绕声方向(诸如左环绕和右环绕)相关联的第一和第二音频信号。这样一来,例如,局部矩阵解码2可以被实施为2:4矩阵解码器或解码函数的环绕通道部分(亦即"局部"矩阵解码器或解码函数)。矩阵解码器可以是无源或有源的。局部矩阵解码2可以M征为处在"(一个或多个)直接信号路径"中(其中在上面解释的意义上4吏用"直接")(参见在下面描述的图6)。在图l的例子中,两个输出还被施加到环境4,该环境4可以是任何的各种众所周知的环境生成、推导或提取装置或功能,其响应于一个或两个输入的音频信号进行操作,以提供一个或两个环境信号分量输出。从两个输入音频信号中获得环境信号分量。环境4可以包括装置和函数(1),其中环境可以祐J^征为从(一个或多个)输入信号中"提取"(以例如1950年的Hafler环境提取器的方式,其中从左右立体声信号中推导一个或多个不同信号(L-R,R-L)),或者包括如参考文献(1)和(2)中的现代时间频率域环境提取器,其中环境可以M征为响应于(一个或多个)输入信号而"生成"或"添加,,(以例如数字(延迟线、巻积器等)或模拟(室、板、弹簧、延迟线等)混响器的方式)。在现代频域环境提取器中,环境提取可以通过以下实现监视输入通道之间的交3U目关,并且提取解相关(具有小的相关系数,接近于零)的以时间和/或频率计的信号的分量。为了进一步增强环境提取,可以在环境信号路径中施加解相关以改善前/后分离感。这样的解相关不应当与提取的解相关信号分量或用于提取它们的过程或装置相混淆。这种解相关的目的是减少前通道和获得的环绕通道之间的任何剩余相关。参见下面的标题"用于环绕通道的解相关"。在一个输入音频信号和两个环境输出信号的情况下,两个输入音频信号可以被组合,或者只使用它们中的一个。在两个输入和一个输出的情况下,相同的输出可以用于两个环境信号输出。在两个输入和两个输出的情况下,装置或功能可以对每个输入独立地操作,以便每个环境信号输出仅响应于一个特定输入,或者代替地,两个输出可以响应并依赖于两个输入。环境4可以^征为处在"(一个或多个)环境信号路径"中。在图1的例子中,环境信号分量和矩阵解码信号分量被可控地组合以提供两个环绕声音频通道。这可以以图1所示的方式或者以等效的方式完成。在图1的例子中,动态变化的矩阵解码信号分量增益标度因数被施加到局部矩阵解码2输出中的两者。这被示出为将相同的"直接路径增益"和8中的每一个。动态变化的环境信号分量增益标度因数被施加到环境4输出中的两者。这被示出为将相同的"环境iM圣增益"标度因数施加到每个都处在环境4的输出中的两个乘法器10和12中的每一个。乘法器6的动态增益调整的矩阵解码输出与乘法器10的动态增益调整的环境输出在加法组合器14(示出为求和符号E)中相加,以产生环绕声输出中之一。乘法器8的动态增益调整的矩阵解码输出与乘法器12的动态增益调整的环境输出在加法组合器16(示出为求和符号E)中相加,以产生环绕声输出中的另一个。为了提供来自组合器14的左环绕(Ls)输出,来自乘法器6的增益调整的局部矩阵解码信号应当从局部矩阵解码2的左环绕输出获得,并且来自乘法器10的增益调整的环境信号应当从旨在用于左环绕输出的环境4输出获得。类似地,为了提供来自组合器16的右环绕(Rs)输出,来自乘法器8的增益调整的局部矩阵解码信号应当M部矩阵解码2的右环绕输出获得,并且来自乘法器12的增益调整的环境信号应当从旨在用于右环绕输出的环境4输出获得。将动态变化的增益标度因数施加到馈送环绕声输出的信号可以被表征为将该信号向和从这样的环绕声输出"摇摄"。对直接信号路径和环境信号路径进行增益调整以基于进来的信号提供适当量的直接信号音频和环境信号音频。如果输入的信号良好相关,那么大比例的直接信号路径应当存在于最终环绕通道信号中。代替地,如果输入的信号基本上解相关,那么大比例的环境信号路径应当存在于最终环绕通道信号中。因为输入信号的声能中的一些^L传递到环绕通道,所以另外可能希望调整前通道的增益,以便总再生声压基本上不变。参见图2的例子。应当注意的是,当使用如参考文献1中的时间频率域环境提取技术时,可以通过将适当的动态变化的环境信号分量增益标度因数施加到输入的音频信号中的每一个来完成环境提取。在这种情况下,环境4块可以被认为包括乘法器10和12,使得环境路径增益标度因数独立地被施加到音频输入信号Lo/Lt和Ro/Rt中的每一个。在本发明最宽的方面,如在图1的例子中表征的那样,本发明可以(l)在时间频率域或频域中(2)在宽带或带状基础上(指的是频带)并且(3)以模拟、数字或混合模拟/数字的方式来实施。虽然可以以宽带的方式进行将局部矩阵解码音频材料与环境信号交叉调配以创建环绕通道的技术,但是通过计算多个频带中的每一个中的期望环绕通道可以改善性能。用于推导频带中的期望环绕通道的一种可能方式是对于原始双通道信号的分析和多通道信号的最终合成两者都使用重叠的短时间离散傅立叶变换。然而,存在许多更多众所周知的技术允许信号分段成时间和频率两者用于分析和合成(例如滤波器组、正交镜式滤波器等等)。图2示出了其中在时间频率域中执行处理的根据本发明的方面的音频向上混合器或向上混合过程的示意性功能框图。图2装置的一部分包括图1的装置或过程的时间频率域实施例。一对立体声输入信号Lo/Lt和Ro/Rt被施加到向上混合器或向上混合过程。在图2的例子中以及在这里的其中在时间频率域中执行处理的其它例子中,增益标度因数可以如变换块率那样常常动态更新,或者以时间平滑块率动态更新。尽管在原理上本发明的方面可以通it^拟、数字或混合模拟/数字实施例来实施,但是图2的例子以及下面讨论的其它例子是数字实施例。这样一来,输入的信号就可以是时间样本,其可以>^漠拟音频信号中推导。时间样本可以被编码为线性脉冲码调制(PCM)信号。每个线性PCM音频输入信号可以由滤波器组功能或装置处理,所述滤波器组功能或装置具有同相和正交输出两者,诸如2048点有窗的短时间离散傅立叶变换(STDFT)。这样一来,双通道立体声输入信号就可以使用短时间离散傅立叶变换(STDFT)装置或过程("时间频率变换")20而被转换到频域并分组成带(分组未示出)。可以独立地处理每个带。控制路径在装置或功能("后/前增益计算")22中计算前/后增益标度因数比率(Gf和Gb)(参见下面的方程12和13以及图7及其描述)。对于四通道系统,两个输入的信号可以乘以前增益标度因数GF(被示出为乘法器符号24和26)并被传递通过逆变换或变换过程("频率时间变换")28,以提供左右输出通道L,o/L,t和R,o/R,t,它们由于Gr增益标度而在水平方面可能不同于输入信号。从图1的装置或过程的时间频率域版本("环绕通道生成")30获得的环绕通道信号L和Rs,它们表示环境音频分量与矩阵解码音频分量的可变调配,在逆变换或变换过程("频率时间变换")36之前乘以后增益标度因数Gb(被示出为乘法器符号32和34)。时间频率变换20用于从输入的双通道信号生成两个环绕通道的时间频率变换20可以基于众所周知的短时间离散傅立叶变换(STDFT)。为了使圆周巻积效应最小化,可以对分析和合成两者使用75%重叠。使用恰当选择的分析和合成窗,重叠的STDFT可以用于使听觉圆周巻积效应最小化,同时提供向镨施加量值和相位修改的能力。尽管具体的窗对并不严格,图3描绘了用于两个连续STDFT时间块的适当分析/合成窗对。分析窗设计成使得重叠分析窗之和等于所选重叠间隔之整体。可以使用恺撒-贝塞尔-推导(Kaiser-Bessel-Derived,KBD)窗的平方,尽管该特殊窗的使用对于本发明并不是决定性的。使用这样的分析窗,如果没有对重叠STDFT进行修改,则可以在没有合成窗的情况下完美地合成分析的信号。然而,由于在这个示例性实施例中使用的解相关序列和施加的量值更换,所以所希望的是使合成窗逐渐缩减以防止听觉块不连续。下面列出了示例性空间音频编码系统中使用的窗参数。STDFT长度2048分析窗主瓣长度(AWML):1024跳i^UC寸(HS):512前导零填充(ZPlead):256滞后零填充(ZPlag):768合成窗锥度(SWT):128分带根据本发明的方面的向上混合的示例性实施例计算并施加增益标度因数给具有近似一半临界带宽的镨带中的各个系数(例如参见参考文献2)。图4示出了对于44100Hz的采样率的以赫兹计的每个带的中心频率的曲线图,并iL^1给出了对于44100Hz的采样率的每个带的中心频率。表l对于44100Hz的采样率的以赫兹计的每个带的中心频率带号中心频率带号中心频率(Hz)(Hz>1332420952652522883129262492422127272852892829856356293253<table>tableseeoriginaldocumentpage15</column></row><table>信号自适应泄漏积分器在根据本发明的方面的示例性向上混合装置中,每个统计量和变量首先在镨带之上计算,然后经由时间被平滑。每个变量的时间平滑是如方程1所示的简单一阶IIR。然而,oc^优选地随时间而适应。如果检测到听觉事件(例如参见参考文献3或参考文献4),则ot^!t下降到较低值,然后随着时间过去返回建立直到较高值。这样一来,系统就在音频变化期间更加i5Jl地更新'听觉事件可以被定义为音频信号的急剧变化,例如乐器音符的变化或说话者语音的开始。因此,使得向上混合有意义的是,在事件检测点附近快速改变其统计估计量。进而,人类听觉系统在过〉:t/事件的开始期间较不敏感,这样一来,音频片段中的这种时刻就可以用于隐藏统计量的系统估计的不稳定性。可以通过以时间计的两个相邻块之间的镨分布的变化来检测事件。图5示出了当检测到听觉事件开始时(在图5的例子中听觉事件边界刚好在变换块20之前)带中的oc^(参见就在下面的方程1)的示例性响应。方程l描述了信号相关泄漏积分器,该信号相关泄漏积分器可以用作在减少交^Uf目关的测度的时间偏差时使用的估计器(还参见下面方程4的讨论)。C'(",6)=aC'("-1,W+(1—6)(1)其中,c"W是在块n处在镨带b之上计算的变量,而C'(",^则是在块n处在时间平滑之后的变量。环绕通道计算图6更加详细地示出了^fl据本发明的方面的图2的音频向上混合器或向上混合过程的环绕声获得部分的示意性功能框图。为了表示简化起见,图6示出了多个频带之一中的信号流的示意图,应理解全部的多个频带中的组合行为产生了环绕声音频通道Ls和Rs。如图6所指示的那样,输入信号(Lo/Lt和Ro/Rt)中的每一个被分成三个路径。第一个#是"控制路径"40,在这个例子中,该"控制路径"40在包括用于提供输入信号交5U目关测度的装置或过程(未示出)的计算机或计算功能("控制每带计算")42中,计算前/后比率增益标度因数(Gf和Gb)和直接/环境比率增益标度因数(Gd和Ga)。另外两个路径是"直M号i^"44和环境信号路径46,它们的输出在Gu和GA增益标度因数的控制下被可控地调配在一起,以提供一对环绕通道信号Ls和Rs。直接信号路径包括无源矩阵解码器或解码过程("无源矩阵解码器")48。代替地,可以使用有源矩阵解码器而不是无源矩阵解码器以改善某些信号条件下的环绕通道分离。许多这样的有源和无源矩阵解码器和解码功能在本领域中都是众所周知的,并且任何具体的一个这样的装置或过程的使用对于本发明都不是决定性的。可选地,为了进一步改善通it^fe加GA增益标度因数而将环境信号分量摇摄到环绕通道所产生的包络效应,来自左右输入信号的环境信号分量可以在与来自矩阵解码器48的直接图像音频分量相调配之前被施加到各个解相关器或乘以各个解相关滤波器序列("解相关器")50。尽管解相关器50可以彼此等同,但当它们不等同时,一些收听者可以优选所提供的性能。虽然许多类型的解相关器中的任何一种都可以用于环境信号路径,但是应当注意使听觉梳状滤波器效应最小化,该听觉梳状滤波器效应可能由将解相关的音频材料与非解相关的信号相混合而造成。下面描述一种特别有用的解相关器,尽管它的使用对于本发明不是决定性的。直接信号路径44可以祐J^征为包括各个乘法器52和54,其中直接信号分量增益标度因数GD被施加到各个左环绕和右环绕矩阵解码信号分吾.直烚4f拔^赫始.知菊liL水:Ao法紐厶哭;i;知s8f备水^^4i头炎知膝号E)。代替地,直接信号分量增益标度因数GD可以被施加到直接信号路径44的输入端。后增益标度因数GB然后可以被施加到乘法器64和66处的每个组合器56和58的输出端,以产生左右环绕输出Ls和Rs。代替地,在将结果施加到组合器56和58之前,GB和GD增益标度因数可以乘在一起,然后施加到各个左环绕和右环绕矩阵解码信号分量。环境信号路径可以^J^i为包括各个乘法器60和62,其中环境信号分量增益标度因数GA被施加到各个左右输入信号,所述信号可以已被施加到可选的解相关器50。代替地,环境信号分量增益标度因数GA可以被施加到环境信号路径46的输入端。动态变化的环境信号分量增益标度因数GA的施加导致从左右输入信号中提取环境信号分量,而不管是否使用了任何解相关器50。这样的左右环境信号分量然后被施加到各个加法组合器56和58。如果不是在组合器56和58之后施加,则Ge增益标度因数可以与增益标度因数Ga相乘,并且在将结果施加到组合器56和58之前施加到左右环境信号分量。如图6的例子中可能需要的环绕声通道计算可以祐J^征为以下步骤和分步骤。步骤l将输入信号中的每一个分组为带如图6所示,控制路径生成增益标度因数G^GB、Gd和Ga——这些增益标度因数在每个频带中都计算和施加。注意,在获得环绕声通道时没有使用GF增益标度因数一一它可以被施加到前通道(参见图2)。计算增益标度因数中的第一步是将输入信号中的每一个分组为带,如方程2和3所示。<formula>formulaseeoriginaldocumentpage18</formula>(3)其中m是时间索引,b是带索引,L(m,k)是在时间m处的左通道的第k个镨样本,R(m,k)是在时间m处的右通道的第k个镨样本,"'",。是包含用于带b的左通道的镨样本的列矩阵,^'",W是包含用于带b的右通道的镨样本的列矩阵,Lb是带b的下界,并且Ub是带b的上界。步骤2计算每个带中的两个输入信号之间的交5U目关的测度下一步是计算每个带中的两个输入信号之间的通道间相关(亦即"交iU目关")的测度。在这个例子中,这通过三个分步骤完成。分步骤2a计算交^U目关的减少时间偏差(时间平滑)测度首先,如方程4所示,计算通道间相关的减少时间偏差测度。在方程4以及此处的其它方程中,E是估计器运算符。在这个例子中,估计器表示信号相关泄漏积分器方程(诸如方程1)。存在许多其它技术可以用作估计器以减少测度的M的时间偏差(例如简单移动时间平均),并且任何具体估计器的使用对于本发明都不是决定性的。18<formula>formulaseeoriginaldocumentpage19</formula>其中T是Hermitian转置,P"(加刈是在时间m处的带b中的左右通道之间的相关系数的估计。P"(加,的可以具有范围在0到1的值。Hermitian转置是复数项的转置和共轭。在方程4中,例如,A"》)^"W导致复数标量,因为Z('"》)和对"',^是如方程1和2所定义的复数行向量。分步骤2b构造交5U目关的偏置测度相关系数可以用于控制被摇摄到环绕通道的环境和直接信号的量。然而,如果左右信号完全不同,例如两个不同的乐器分别被摇摄到左右通道,那么如果单独使用诸如分步骤2a之类的方法,则交5U目关为零并且硬摇摄的乐器会被摇摄到环绕通道。为了避免这样的结果,可以构造左右输入信号的交叉相关的偏置测度,如方程5所示。<formula>formulaseeoriginaldocumentpage19</formula>A…"'的可以具有范围在o到i的值。其中&('",6)是左右通道之间的相关系数的偏置估计。方程4的分母中的"max"运算符导致分母为^"0』("")1和弗",&)^"6^中的最大值。因此,交叉相关被左信号中的能量或右信号中的能量归一化,而不4一被如方程4中的几何平均归一化。如果左右信号的功率不同,那么方程5的相关系数&('",6)的偏置估计导致比方程4中的相关系数^w("^)所生成的值更小的值。这样一来,偏置的估计就可以用于减少摇摄到被硬摇摄左和/或右的乐器的环绕通道的程度。分步骤2c组合交5U目关的无偏和偏置测度下一步,将方程4中给出的无偏交iU目关估计与方程5中给出的偏置估计组合成通道间相关的最终测度,其可以用于控制摇摄到环绕通道的环境和直接信号。该组合可以表达为方程6,其表明如W目关系数的偏置估计(方程5)处在阈值之上,则通道间相干性等于相关系数;否则,通道间相干性线性逼近一。方程6的目标是要确保在输入信号中被硬摇摄左和右的乐器不被摇摄到环绕通道。方程6只是用于实现这种目标的许多中的一种可能方式。<formula>formulaseeoriginaldocumentpage20</formula>其中p。是预定阈值。阈值^应当尽可能小,但是优选地不为零。它可以近似等于偏置相关系数&("',6)的估计的偏差。步骤3计算前后增益标度因数Gp和Gb下一步,计算前后增益标度因数Gp和GB。在这个例子中,这通过三个分步骤完成。分步骤3a和3b可以按顺序或同时执行。分步骤3a计算仅由环境信号引起的前后增益标度因数GV和G,b下一步,计算分别如方程7和8所示的第一中间组的前/后摇摄增益标度因数(GV和G,b)。这些表示了仅由环境信号的检测引起的后/前摇摄的期望量;如下所述,最终的后/前摇摄增益标度因数考虑环境摇摄和环绕图像摇摄两者。<formula>formulaseeoriginaldocumentpage21</formula>(7)<formula>formulaseeoriginaldocumentpage21</formula>,(8)其中^是预定阈值并且控制可以从前声场摇摄到环绕通道中的能量的最大量。阈值^可以由用户选择以控制发送到环绕通道的环境内容的量。尽管方程7和8中对于GV和G,b的表达是合适的并且保存了功率,但它们对于本发明不是决定性的。可以使用其中G,f和G,b—般互逆的其它关系。图7示出了增益标度因数G;'和^对比于相关系数(P"(w,的)的曲线图。注意,随着相关系数下降,更多能量被摇摄到环绕通道。然而,当相关系数降到某个点亦即阈值JL1。之下时,信号被摇摄回到前通道。这防止原始左右通道中的硬摇摄隔离乐器被摇摄到环绕通道。图7仅示出了其中左右信号能量相等的情形;如果左右能量不同,则信号以相关系数的较高值被摇摄回到前通道。更加具体地,转折点亦即阈值n。在相关系数的较高值处发生。分步骤3b计算仅由矩阵解码直接信号引起的前后增益标度因数G和G"b至此,已描述了由于环境音频材料的检测有多少能量被^V到环绕通道中;下一个步骤是要计算仅由矩阵解码离散图像引起的期望环绕通道水平。为了计算由这样的离散图像引起的环绕通道中的能量的量,首先估计图4的相关系数的实部,如方程9所示。<formula>formulaseeoriginaldocumentpage21</formula>由于矩阵编码过程(向下混合)期间的卯度相移,随着原始多通道信号中的图像在向下混合之前从前通道移动到环绕通道,相关系数的实部平滑地从0横移到-l。因此,可以构造如方程10和11所示的进一步的中间组的前/后摇摄增益标度因数。G)=i+;ii/f("!,6)(10)G:("a)一卜(G;—))2,(ii)其中GW",W和W(""W分别是在时间m处的用于带b的用于矩阵解码直接信号的前后增益标度因数。尽管方程10和11中对于G^"'W和G》i,W的表达是合适的并且*了能薈.但它们对于本发明不是决定性的。可以使用其中G"'"》)和G"""的一般互逆的其它关系。分步骤3c使用分步骤3a和3b的结果,计算最终组的前后增益标度因数GF和GB现在如通过方程12和13给出的那样计算最终组的前后增益标度因数。(w,6)=(m,Z),(m,州(12)其中MIN指的是,如果^(m,&)小于G〖("^),则最终前增益标度因数C^(/n,Z)等于(^(m,&),否则C^(An,6)等于G;,("0)。尽管方程10和11中对于Gf和Gfi的表达是合适的并且保存了能量,但它们对于本发明不是决定性的。可以使用其中Gf和Gb—般互逆的其它关系。计算环境和矩阵解码直接增益标度因数Gd和Ga在这一点上,已确定了由环境信号检测和矩阵解码直接信号检测两者引起的被发送到环绕通道的能量的量。然而,现在需要控制存在于环绕通道中的每个信号类型的量。为了计算控制直接和环境信号之间的交叉调配的增益标度因数(Gd和Ga),可以使用方程4的相关系数P"("^)。如果左右输入信号相对不相关,那么比直接信号分量更多的环境信号分量应当存在于环绕通道中;如果输入的信号很好i^目关,那么比环境信号分量更多的直接信号分量应当存在于环绕通道中。因此,可以如方程14所示的那样推导用于直接/环境比率的增益标度因数。G)=yC^(w,Z>)尽管方程14中对于Gd和GA的表达是合适的并且保存了能量,但它们对于本发明不是决定性的。可以使用其中Gd和GA—般互逆的其它关系。步骤5构造矩阵解码和环境信号分量下一步构造矩阵解码和环境信号分量。这可以通过两个分步骤来完成,这两个分步骤可以按顺序或同时执行。分步骤5a构造用于带b的矩阵解码信号分量例如^^方程15所示的那样构造用于带b的矩阵解码信号分量。^D(m,6)=々Z(m,6)+a^(/w》),其中,Zj"',W是在时间m处的带b中的来自用于左环绕通的矩阵解码器的矩阵解码信号分量,并且^(""W是在时间m处的带b中的来自用于右环绕通道的矩阵解码器的矩阵解码信号分量。步骤5b构造用于带b的环境信号分量以时间平滑变换块率来动态变化的增益标度因数GA的施加起作用以推导环境信号分量(例如参见参考文献1)。可以在环境信号路径46(图6)之前或之后施加动态变化的增益标度因数GA。通过将原始左右信号的整个谱乘以解相关器的谱域表示,可以进一步增强推导的环境信号分量。因此,对于带b和时间m,例如通过方程16和17给出用于左右环绕信号的环境信号。丄(m,丄J.Z)、丄》(16)其中,^('"》)是在时间m处的带b中的用于左环绕通道的环境信号,并且"i是在仓库(bin)k处的左通道解相关器的镨域表示。'一,丄丄DD尺(附,^+l).Z/(;+l)(17)其中,足('"》)是在时间m处的带b中的用于右环绕通道的环境信号,并且""("是在仓库k处的右通道解相关器的镨域表示。步骤6施加增益标度因数GB、GD、GA以获得环绕通道信号在已推导控制信号增益GB、Gd、GA(步骤3和4)以及矩阵解码和环境信号分量(步骤5)之后,可以如图6所示施加它们以获得每个带中的最终环绕通道信号。现在可以通过方程18给出最终输出的左右环绕信号。=.(A^(>m,Z))+(VZD(m》))其中^("^)和^('",h)是在时间m处的带b中的最终左右环绕通道信号。如结合步骤5b在上面注意到的那样,将会意识到的是,以时间平滑变换块率来动态变化的增益标度因数GA的施加可以祐:认为^1推导环境信号分量。环绕声通道计算可以总结如下。1.将输入信号中的每一个分组成带(方程2和3)。2.计算每个带中的两个输入信号之间的交3U目关的测度。a.计算交^U目关的减少时间偏差(时间平滑)测度(方程4)b.构造交5U目关的偏置测度(方程5)c.组合交X^目关的无偏和偏置测度(方程6)3.计算前后增益标度因数GF和GB。a.计算仅由环境信号引起的前后增益标度因数GV和G,b(方程7、8)b.计算仅由矩阵解码直接信号引起的前后增益标度因数G和G,,b(方程IO、11)c.使用分步骤3a和3b的结果,计算最终组的前后增益标度因数Gf和Gb(方程12、13)4.计算环境和矩阵解码直接增益标度因数Gd和GA(方程14)5.构造矩阵解码和环境信号分量a.构造用于带b的矩阵解码信号分量(方程15)b.构造用于带b的环境信号分量(方程16、17,施加Ga)6.向构造的信号分量施加增益标度因数GB、GD、GA以获得环绕通道信号(方程18)备选方案本发明的方面的一种适当实施使用处理步骤或者装置,所述装置执行各个处理步骤并且如上所述在功能上相关。尽管上面列举的步骤可以每个由按照上面列举的步骤的顺序运行的计算机软件指令序列执行,但是将会理解的是,在考虑到某些量从较早的量导出的同时,可以通过以其它方式排序的步骤获得等价或类似的结果。例如,可以使用多线程计算机软件指令序列,以便并行执行某些步骤序列。作为另一个例子,上述例子中某些步骤的排序是任意的,并且可以改变而不影响结果一一例如,分步骤3a和3b可以颠倒,并且分步骤5a和5b可以颠倒。而且,如从对方程18的检查中将会明显的那样,增益标度因数GB不需要与增益标度因数GA和GD的计算分开计算一一可以以方程18的其中将增益标度因数Gb放到括号之内的修改形式来计算和使用单个增益标度因数GbGa和羊个増益标度因数GB.GD。代替地,描述的步骤可以被实施为执行所述功能的装置,各种装置具有如上所述的功能相互关系。用于环绕通道的解相关器为了改善前通道和环绕通道之间的分离(或者为了强调原始音频材料的包络),可以向环绕通道施加解相关。如下一步描述的那样,解相关可以类似于参考文献5中提议的那些。尽管下一步描述的解相关器已仗良现特别适合,但它的使用对于本发明不是决定性的,并且可以使用其它解相关技术。每个滤波器的脉沖响应可以^^l定为有限长度正弦序列,它的瞬时频率在序列的持续时间之上从7T到零单调下降261^(0^,(19)其中,"々)是单调下降的瞬时频率函数,"'w是瞬时频率的一阶导数,是通过瞬时频率的积分给出的瞬时相位,并且Lj是滤波器的长度。需要乘法项/1^以使/',["]的频率响应跨越全部频率近似平坦,并且增益Gi被计算使得,!=0规定的脉冲响应具有啁啾声状序列的形式,结果,用这样的滤波器过滤音频信号有时可能导致在过渡的位置处的听觉"啁嗽声"假象。通过将噪声项添加到滤波器响应的瞬时相位可以减少这个效果=G々l必,'0)1cos(-,(")+A/",[;i]),(21)4吏这个噪声序列^W等于具有作为7T的一小部分的偏差的白高斯噪声足以使脉冲响应听起来与像啁啾声相比更像噪声,同时仍然很大程度上维持".w所规定的延迟和频率之间的期望关系。在非常低的频率处,啁啾声序列所产生的延迟非常长,这样一来,当向上混合的音频材料向下混合回到两个通道时,就导致听觉凹口(notch)。为了减少这个假象,可以以2.5kHz之下的频率用90度相位翻转替换啁啾声序列。使用以对数间隔发生的翻转,在正负卯度之间翻转相位。因为向上混合系统使用具有足够零填充(在上面描述)的STDFT,所以使用镨域中的乘法可以施加通过方程21给出的解相关器滤波器。实施本发明可以用硬件或软件或两者的组合(例如可编程逻辑阵列)来实施。除非另外规定,否则作为本发明的一部分而包括的算法或过程并不固有地与任何具体的计算机或其它设备相关。特别地,各种通用机器可以与根据此处教导而编写的程序一起使用,或者可以更加方便地构造更专业化的设备(例如集成电路)来执行需要的方法步骤。这样一来,本发明就可以用执行于一个或多个可编程计算机系统上的一个或多个计算机程序来实施,所述可编程计算机系统每个包括至少一个处理器、至少一个数据存储系统(包括易失性和非易失性存储器和/或存储元件)、至少一个输入装置或端口以及至少一个输出装置或端口。程序代码被施加到输入的数据,以执行在此描述的功能并生成输出信息。输出信息以已知的方式被施加到一个或多个输出装置。每个这样的程序可以用任何期望的计算机语言(包括机器、汇编或高级程序上的、逻辑的或面向对象的编程语言)来实施以与计算机系统通信。在任何情况下,语言都可以是编译或解释语言。每个这样的计算机程序优选地存储在或下载到可由通用或专用可编程计算机读取的存储介质或装置(例如固态存储器或介质或者磁性或光学介质),用于当存储介质或装置由计算机系统读取时配置和操作计算机以执行在此描述的过程。本发明也可以被认为是被实施为计算机可读存储介质,配置有计算机程序,其中如此配置的存储介质使计算机系统以特定和预定的方式^Mt以执行在此描述的功能。已描述了本发明的若干实施例。尽管如此,将会理解的是,可以在不脱离本发明的精神和范围的情况下进行各种修改。例如,如同样在上面提到的那样,在此描述的步骤中的一些可以是顺序自主的,并且这样一来就可以以与所描述的顺序不同的顺序来执行。权利要求1.一种用于从两个输入的音频信号获得两个环绕声音频通道的方法,其中所述音频信号可以包括通过矩阵编码生成的分量,该方法包括从所述音频信号获得环境信号分量;从所述音频信号获得矩阵解码信号分量;以及对环境信号分量和矩阵解码信号分量进行可控组合以提供所述环绕声音频通道。2.根据权利要求1所述的方法,其中,获得环境信号分量包括向输入的音频信号施加动态变化的环境信号分量增益标度因数。3.根据权利要求2所述的方法,其中,所述环境信号分量增益标度因lbl输入的所述音频信号的交5U目关的测度的函数。4.根据权利要求3所述的方法,其中,所述环境信号分量增益标度因数随着交iU目关度增加而下降,反之亦然。5.根据权利要求3或4所述的方法,其中,交^U目关的所述测Jbl时间平滑的。6.根据权利要求5所述的方法,其中,通过使用信号相关泄漏积分器来4吏交5U目关的所述测度时间平滑。7.根据权利要求5所述的方法,其中,通过使用移动平均来使交叉相关的所述测度时间平滑。8.根据权利要求4-7中任何一项所述的方法,其中,所述时间平滑是信号自适应的。9.根据权利要求8所述的方法,其中,所述时间平滑响应于镨分布的变4t而适应。10.根据权利要求1-9中任何一项所述的方法,其中,获得环境信号分量包括施加至少一个解相关滤波器序列。11.根据权利要求10所述的方法,其中,相同的解相关滤波器序列被施加到输入的所述音频信号中的每一个。12.根据权利要求10所述的方法,其中,不同的解相关滤波器序列被施加到输入的所述音频信号中的每一个。13.根据权利要求1-12中任何一项所述的方法,其中,获得矩阵解码信号分量包括施加矩阵解码至输入的所述音频信号,所述矩阵解码适合于提*个与后环绕声方向相关联的第一和第二音频信号。14.根据权利要求1-13中任何一项所述的方法,其中,所述可控组合包括施加增益标度因数。15.根据从属于权利要求2-14中任何一项时的权利要求14所述的方法,其中,所述增益标度因数包括在获得环境信号分量时施加的动态变化的环境信号分量增益标度因数。16.根据从属于权利要求13-15时的权利要求15所述的方法,其中,所述增益标度因数进一步包括向与后环绕声方向相关联的第一和第二音频信号中的每一个施加的动态变化的矩阵解码信号分量增益标度因数。17.根据权利要求16所述的方法,其中,所述矩阵解码信号分量增益标度因数是输入的所述音频信号的交5U目关的测度的函数。18.根据权利要求17所述的方法,其中,动态变化的矩阵解码信号分量增益标度因数随着交^U目关度增加而增加,并且随着交X^目关度减少而减少。19.根据权利要求18所述的方法,其中,动态变化的矩阵解码信号分量增益标度因数和动态变化的环境信号分量增益标度因数以保存矩阵解码信号分量和环境信号分量的组合能量的方式相对于彼此增加和减少。20.根据权利要求16-19中任何一项所述的方法,其中,所述增益标度因数进一步包括用于进一步控制环绕声音频通道增益的动态变化的环绕声音频通道的增益标度因数。21.根据权利要求20所述的方法,其中,环绕声音频通道的增益标度因lbl输入的所述音频信号的交^U目关的测度的函数。22.根据权利要求21所述的方法,其中,所述函数使环绕声音频通道增益标度因数随着交5U目关的测度减少直到下述值而增加,在所述值之下,环绕声音频通道的增益标度因数减少。23.根据权利要求1-22中任何一项所述的方法,其中,所述方法在时间频率域中执行。24.根据权利要求23所述的方法,其中,所述方法在时间频率域中的一个或多个频带中执行。25.—种适合于执行根据权利要求1-24中任何一项所述的方法的设备。26.—种存储在计算机可读介质上的计算^4呈序,用于使计算机执行根据权利要求1-24中任何一项所述的方法。全文摘要从源音频信号获得环境信号分量,从源音频信号获得矩阵解码信号分量,并且对环境信号分量与矩阵解码信号分量进行可控组合。获得环境信号分量可以包括施加至少一个解相关滤波器序列。相同的解相关滤波器序列可以被施加到输入音频信号中的每一个,或者代替地,不同的解相关滤波器序列可以被施加到输入音频信号中的每一个。文档编号H04S3/00GK101681625SQ200880018896公开日2010年3月24日申请日期2008年6月6日优先权日2007年6月8日发明者查尔斯·基托·鲁宾逊,马克·富兰克林·戴维斯,马克·斯图尔特·文顿申请人:杜比实验室特许公司