多通道音频转换器的利记博彩app

文档序号：2822937阅读：317来源：国知局

专利名称：多通道音频转换器的利记博彩app
现有技术本发明涉及一种多通道音频转换器，包括根据原始音频信号而产生一音频信号的装置，和用于将原始音频信号(x)转换成增强的音频信号(u)的装置。
本发明还涉及一种根据原始音频信号(x)产生音频信号的方法，其中信息信号是根据所述原始音频信号(x)得到的，并用于将所述原始音频信号(x)转换成所述增强的音频信号(u)。
这样一种多通道立体声系统和方法可从EP-A-0757506中得知。该已知系统是一种被称为卡拉OK的系统，其使用在编码处理中嵌入记录介质的环绕声道而构成。
该系统和方法的缺点是，其需要一种专门的方法来编码和解码。并且该系统不能与现有的CD兼容，除非这些CD经过该系统专门的编码方法编码过。
因此本发明的目的是提供一种系统和相应的方法，能够处理现有的音频载体，例如CD，从而使用户能够交互性地处理记录的音频信号。
发明概述因此，根据本发明的多通道转换器特征在于，该转换装置包括确定装置，用于根据原始音频信号(x)来确定基本上相互正交的主信号(y(k))，和一个或多个剩余信号(q(k))；分析装置，用于在至少两个频率范围内分析主信号的频率分量；和用于形成一差异音频信号(yr{y(k)-yB(k))的装置，该差异信号对应于主信号(y(k))减去主信号在一个或多个频率范围内的频率范围分量(yB(k))，和用于将差异音频信号(yr)和剩余信号q(k)转化为所述增强音频信号(u)的装置。
本发明中的转换装置包括根据原始音频信号来确定主信号的装置。通常这些原始信号由左路信号(x1)和右路信号(x2)两个信号构成，即立体声信号。但本发明并不局限于仅使用两路原始的立体声信号的系统，其原始记录可包含多于两路的原始信号(即左路，右路，中路(xc)和环绕信号(xs)或更为复杂的信号)。根据原始音频信号，主信号(y(k))和一个或多个剩余信号(q(k))将被确定。从而主方向也被确定了。主信号可以被定义为原始信号的线性组合y(k)＝∑wixi(k)，其中wi是权重因子且wi＝1。使能量最大化E(y2＝(k))将得到主信号。余下的信号(s)就是剩余信号。有几种公知的方法可执行这个过程。
或者，可以使用权重因子wi(wr，wl，或者ws，wc)，在此情况下，主信号y(k)是由不同的原始音频信号的相对强度决定的。或者，可以由交互用户自己选择权重因子，这样，由用户来决定主方向或主信号。在任何情况下，主信号都是根据原始信号和剩余信号而产生的。
在下一步，主信号的频率分量被分析，其中至少区分出两个频率范围。每个频率范围包括特定的音乐信息。至少产生一个对应于主信号(y)减去该主信号在特定频率范围内的频率分量(yb)的信号，并且最好也产生对应于频谱的剩余部分的其他信号。所述特定的频率范围可以是某个频率之上或之下的所有频率，但最好是一个频带。在这些信号随后的转换中，其转换矩阵不同于差异信号。在实施例中，区分出低，中，高三个频率范围，并且所述特定频率范围是中间的频率范围，即一个频带。简单地说，在简化的实施例中，中频范围从主信号中被除去。最好使用带阻滤波器，即，只有频谱的中间部分被除去。这将除去主信号中大部分的歌唱能量，从而在文字意义上允许“卡拉OK”的实现，即，大部分的歌唱能量从再生的声音中被除去，或者说对于该频率范围的主信号(yb(k))的转换矩阵是0。在此实施例中，只有差异信号被转换。本发明人发现本发明中的装置对于任何记录形式都能够实现很好的自动伴奏录音，即“卡拉OK”。
转换装置最好包括形成频率范围主信号(yb(k))的装置，用于形成对应于主信号在该频率范围分量的频率范围主信号(yb(k))，和用于将差异音频信号(yr{y(k)-yb(k))，以及频率范围主信号(yb(k))和剩余信号q(k)转换成所述增强的音频信号(ul，ur，uc，us)的装置，用于差异音频信号(yr{y(k)-yb(k))的转换矩阵是不同于用于频率范围主信号(yb(k))的转换矩阵的。形成yr的一种方法是向主信号y(k)施加一个带阻滤波器。而不是向“纯粹的卡拉OK”模式那样完全的除去主信号的频率分量，在本发明的实施例中，频率范围主信号(yb(k))以不同于差异信号(yr{y(k)-yb(k))的方式被转换。这将使出现在所述信号yb(k)中的信息能够被更容易的处理，即，将歌唱者的声音从中心处“移动”至边侧的位置。
音频转换器最好包括根据原始信号x得到一信息信号的装置，和根据信息信号得到差异音频信号(yr{y(k)-yb(k))的转换系数的装置。
在本发明更加复杂和优越的实施例中，转换装置还包括交互性地作用于频率范围主信号(yb(k))的转换矩阵的装置。在此优选实施例中，由于频率范围主信号(yb(k))的转换而带来的转换总增益和/或表面声源的位置，可以根据用户而改变。这使得用户能够交互性的处理信号，即与歌唱者一起唱的同时将歌唱者的位置重定位在边侧，而用户自己则在中心的位置。为此，转换装置应包括用于改变频率范围主信号(yb(k))的转换矩阵的装置。
特定的频率范围最好在300Hz到4.5kHz之间。

现在将参照相应的附图和标记来进一步阐述根据本发明的多通道音频转换器及其相应方法的其它优点，其中相同的元件以相同的附图标记来表示。在图中图1表示根据本发明的多通道音频转换器的部分操作，左路(xl)和右路(xr)音频信号振幅的组合所定义的二维状态区域；图2是根据本发明的多通道音频转换器的常规电路；图3是根据本发明的多通道音频转换器的几个实施例的概括；图4更详细地示出了根据本发明的音频转换器的一个实施例；图5至7概括了根据本发明的多通道音频转换器，在产生一个环绕信号时使用矩阵相乘的例子；图8示出了本发明的又一实施例；图9示出了本发明的又一实施例；图10示出了本发明的又一实施例。
优选实施例的详述图1是由即时的左路(xl)和右路(xr)音频信号振幅的所定义的二维状态区域(Lissajous figure)图。延垂直轴线表示左路(xl)音频信号(在本立体声的例子中)的输入信号值，沿水平轴线表示右路(xr)音频信号的输入信号值。区域中的点表示立体声音乐中的大量取样。点区可能具有图示的椭圆形状，方向角为α。可以看出角α是该区域内所有点的平均值所提供的主信号的方向的信息。有几种已知的估计技术来估计主方向。最小平方法是公知的能够提供足够的方向或位置信息的算法。可以定义一个与主信号y正交的剩余信号q，来提供关于与主信号y相交的音频信号的信息。
图2是根据本发明的多通道音频转换器的常规电路。原始信号x被送至确定装置21，其可能是一个专门的电路或是能实现相同功能的软件，用于确定主方向，例如，确定下述的权重因子w。关于x和w的数据被送至装置23，其用于确定送往装置25的系数。装置22确定主信号y和剩余信号q。主信号y被滤波装置24(F)滤波。得到信号yr(即主信号减去该主信号的频率分量)和对应于所述频率分量的信号yb。在装置25中执行一个映射，其中矢量(yr，q)被转换矩阵T(依据系数c)相乘而得到矢量u。
图3是多通道音频转换器1的几种可能的实施例的组合。转换器1包括装置21用于确定信号的主方向，即权重因子wl和wr。这些权重因子指示着主信号的方向。权重因子可使用上述的某种平均方法来推出，或被可选择的列举出，或由用户来选择确定(参见图8)。产生对应于wl，xl和wr，xr的数据。这些数据在装置22种被转换，产生主信号y和剩余信号q，它们可以相互转化。当原始信号x由两个信号xl和xr构成时，该转换等效于坐标系统的旋转，可以表示为y(k)＝wl(k)xl(k)+wr(k)xr(k)q(k)＝wr(k)xl(k)-wl(k)xr(k).
信号y(k)在装置25中被分析频率，产生了差异信号yr{y-yB和信号yb(实施例中)。信号yb对应于主信号y在一个或多个频率范围内的频率分量。符号{用来表示yr和yb基本上是互补的。但是，当使用滤波器(对yr是带阻对yb是带通)时，只有在理想情况下才能实现最佳匹配，实际上使用两个滤波器将带来一些非互补性。信号yr和yb在矩阵乘法器25中被转换为最终的音频信号ul，ur，uc和us。数据xr，wr，xl，wl在此优选实施例中被进一步送至装置23中，用于提供在转换装置25中，特别是在转换矩阵T(见下文)中要用到的转换系数cl，cr，cc，cs。这是优选的实施例，但系数cl，cr，cc，cs也可以被其他的装置确定或是预制好。
图4中更详细的示出了装置25的示意图。在装置25a中，频率范围主信号yb(k)和剩余信号q(k)使用矩阵相乘法进行转换(或任何类似于或等效于矩阵相乘的转换，通常被称为“映射”)。最好该系数(或所述矩阵M的至少一个系数或特性系数或决定系数)至少是部分交互性的由用户确定，如图4的装置26所示。这种交互性的确定可以用于表面强度(例如用于矩阵相乘的总系数)或表面位置。为此在实施例下设定参考标记。差异信号(yr{y(k)-yb(k))和剩余信号在装置25b中以不同的方式被转换。处理结果的两个信号被组合，产生了信号ul，ur，uc，us，如图4所示。
所述矩阵相乘T的例子将参照图5至7进行描述。
如上所述主信号可以表示为y(k)＝wl(k)xl(k)+wr(k)xr(k).
权重wl和wr表示圆周单元上角度为α的一个矢量，如图5所示。为了从左路和右路信号得到一个中心通道，图6中的角度被因数2相乘。从而能够得到右(R)，左(L)，中(C)路通道计算结果的矢量在水平和垂直轴线上的投影，如图6所示。用测量角度的方法，可得到上述投影为cc＝sin(2α)＝2wlwrclr＝cos(2α)＝wr2-wl2利用图6的下半部分可直观的将三个通道扩展为四个通道。这可通过简单的将α乘以因数4来得到。在此可能的情况下，图7示出了映射在四个通道(L，R，C，S)的方式。
一个多通道音频系统的主要目的是向听众提供一种环境效果。这种效果可通过回放输入信号中内在的同相和反相成份的组合来产生。同相成份通常分配给前通道，相反的，反相信号被分配给环绕通道。寻求它们的平衡对于实现理想的效果是很重要的。
一种寻求平衡的方法是使用一种交叉相关技术来测量输入信号的反相和同相成份。可以表示为ρ＝∑(L-L)(R-R)/{∑(L-L)2(R-R)2}1/2其中下划线表示平均值。交叉相关ρ的实际测量或估计可使用任何适当的装置来实现，并且每个信号都可提供立体的量级信息。
找到或计算出输入信号的反相和同相成份的量值后，将该量值合并，进行矢量转换，将图6所示的三个通道变换为四个通道，并保持同相成份分配给L，C，R通道，反相成份分配给环绕通道。实现此目的的一种方法是使用测角的工具，例如以下式定义角度ββ(k)＝arcsin(1-ρ)for 0[ρ[1β(k)＝0 for ρ＜0并将图6所示角度上的矢量从该平面移开。定义该映射后就能计算出转换后的矢量在每个轴线上的投影，从而得到cs，c’lr，c’c。如图7所示。因此对于强相关的输入信号，β将会很小，从而大多数信号将被分为L，R，C通道。另一方面，当输入信号只是弱相关时，β将会很大，则反相成份被分配至环绕通道。这种步骤可由clr和cc的模看出来。当矢量被移开时(即β不等于0)，在图中以c’lr和c’c表示的clr和cc的投影就变短了，并且β增加了。另一方面，若β等于0就可得到其在水平平面的最大投影(即L，R，C)。通过使用这些系数，可实现不同的信号和不同频率范围内信号的矩阵相乘。
一个映射的例子是，已知下面给出的矩阵，产生了矢量u的四个通道输出信号ul，ur，uc，us，以时间取样k的形式表示u&OverBar;=ul(k)ur(k)uc(k)us(k)=cl(k)wr(k)cr(k)-wl(k)c′c00cs(k)yr(k)q(k)+Myb(k)q(k)]]>或是简化式u&OverBar;=Tyr(k)q(k)+Myb(k)q(k)]]>其中且M是一个矩阵，其在简化的实施例中为0，即yB(k)并不作用于所有的最后结果，或者说信号yb(k)被除去了。这形成了“纯粹的卡拉OK模式”。这种实施例可通过使用一个带阻滤波器来实现。在更复杂的实施例中M1=c′c0000000]]>其中频率范围主信号yb(k)被转换为左通道中的一个信号。
类似的频率范围主信号yb(k)也可被转换为右通道中的一个信号，使用矩阵M2=00c′s00000]]>从而矩阵M(在这些实施例中)依赖于频率主信号将被送往的通道。在优选实施例中，通道的分配可被用户设定。一个简单的表盘或是简单表盘的组合就可实现此目的，例如一个表盘指示左-右，另一个表盘指示环绕声的量值。
信号的强度也可被调整或通过与强度因数，即在实际矩阵之前的总因数，的相乘来调整。选择矩阵的系数就可能调整信号yb(k)的表面强度和/或表面位置(通过矩阵将信号yb(k)区分为各种通道)。
通常所数矩阵变换的矩阵系数可根据实际音频信号在基本轴线上的投影而得到，如图7所示的音频信号(R，L，C，S)。这些矩阵系数也可以一定的系数组合，该系数是部分的根据经验而确定的。
通常所述转换被表示为y(k)＝wl(k)xl(k)+wr(k)xr(k)q(k)＝wr(k)xl(k)-wl(k)xr(k).
这里y(k)也被称为主信号，q(k)为剩余信号其中原始音频信号多个两个。
yb(k)是y(k)在一定频率范围内的频率分量(也被称为频率范围主信号)且u&OverBar;=Tyr(k)q(k)+Myb(k)q(k)]]>其中u是增强的音频信号，T是差异信号yr({y(k)-yb(k))和剩余信号的转换矩阵(该定义包括任何映射操作)，M是频率范围主信号yb(k)的转换矩阵。u可能是具有两个，三个，四个或多个分量的矢量。M的最简配置是0，其中频率范围主信号yb被除去。在优选实施例中还设有交互性的控制M的装置，例如，选择有效的表面方向和/或频率范围谐振信号的振幅。装置26可以包括一简单的旋钮，使用户能够选择一个方向，装置25a包括用于将此选择的方向转换为适当矩阵M的装置，用于与矢量(yb(k)，q(k)}相乘。
通过以上参照优选实施例和最佳模式的描述，应当理解这些实施例并不是为了限制所涉及的装置的实施形式，因为本领域的技术人员可知，各种各样的方式，特征和特征的结合都将落在随后的权利要求的保护范围内。特别是在矩阵M中还可包含进一步的特征，例如对信号yb(k)的斜度的改变。频率范围主信号yb(k)的相关频率范围最好高于300Hz并低于4.5kHz。这将留下大部分的低频信号，而这对于记录来说是非常重要的，因为其可以提供未改变的“空间声音”的效果。同样的，钹或其它能产生高频的乐器，它们的位置是固定不变的。在优选实施例中，特定的频率范围是可调的。这将允许实现最佳调谐。这里还可使用一种优于频率滤波器的方式，声音识别系统。
图7和8示出了本发明的多个可能的实施例。在图7的实施例中，示出了两个附加的、可被分别使用的特征。所示装置71被耦合至装置21。这样权重因子wl和wr可被设定。该装置可以是指示方向的一个表盘，其中该表盘所指示的角的cosine和sine分别为权重因子wr和wl。以这种方式主方向可交互性地被用户所设定。此外还可包括装置72。该装置包括一声音识别系统。若声音识别系统不能识别出歌唱部分的存在，滤波装置24就被旁路或设为交互性的。结果当没有识别出歌唱部分时，音乐部分就被未改变的保留下来。这将在歌唱者不发声时该音乐部分被更好的再现出来。该声音识别系统可依据用户的行为而操作，即，有一个开关或任何其他的启动/关闭装置，使用户能够使用或不使用该附加功能。在图8中信号yb由一记录装置(例如麦克风)与信号ym相混合，或者说y’b＝Ayb+Bym比率A/B可以是预制的或由用户设定。信号ym可首先被滤波器滤波，该滤波器与滤波装置24的滤波器等效。
图9示出了本发明更为复杂的一个实施例。在该实施例中，每个信号yb和ym分别被一个矩阵相乘，该矩阵在装置26a和26c中是可调的。则总信号u为u&OverBar;=Tyr(k)q(k)+Myb(k)q(k)+M′ym(k)0]]>
其中T，M和/或M’的系数是由wr和wl推出的，并依赖于用户(通过装置26a和/或26c)的选择(方向和/或相对强度)。例如将麦克风信号加入左通道的选择表示为M'=S10000000]]>其中S是强度因数；选择将麦克风信号输入右通道将引起M'=S00100000]]>这使用户能够将原歌唱者定位在某个位置，或使歌唱者仅在背景乐中才能被听到，并可选择将自己定位在任何希望的位置。若他/她选择MγM’，则他/她可选定一个不同于原歌唱者的位置，例如原歌唱者在右侧而用户在右侧。
简单地说本发明可被表述如下在一种为了由原始音频信号(x，xl，xr)产生增强的音频信号(u，ul，ur，uc，us)的方法和音频转换器中，其中由所述原始音频信号(x)可选择的产生信息信号(cl，cr，cs，cc)(装置23中)，原始音频信号(x)被转换为增强的音频信号(u)。根据此原始音频信号(x，xl，xr)，可确定(在装置21和22中)基本相互正交的一主信号y(k)和一剩余信号(或信号)q(k)。在至少两个频率范围内分析(装置24中)主信号的频率分量，对应于主信号减去该主信号在一个或多个频率范围内的频率范围分量(yb(k))的差异信号yr({y(k)-yb(k))被形成，差异音频信号yr({y(k)-yb(k))和剩余信号q(k)被转换为所述增强的音频信号(装置25中)，即u&OverBar;=Tyr(k)q(k)]]>最好在所述装置中频率范围分量以不同于差异信号的形式也被转换，即，以公式形式，TγMu&OverBar;=Tyr(k)q(k)+Myb(k)q(k)]]>进行转换。
权利要求
1.一种多通道音频转换器，包括用于根据原始音频信号(x)产生一音频信号的装置，和与其相耦合的转换装置，用于将所述原始音频信号(x)转换为增强的音频信号(u)，其特征在于所述转换装置包括确定装置，用于根据原始音频信号(x)来确定基本相互正交的主信号(y(k))和一个或多个剩余信号(q(k))，分析装置(24)，用于在至少两个频率范围内分析主信号的频率分量，形成一差异音频信号(yr{y(k)-yb(k))，该差异信号对应于主信号(y(k))减去主信号在一个或多个选定的频率范围内的频率范围分量(yb(k))，和用于将差异音频信号(y(k)-yb(k))和剩余信号(q(k))转换为所述增强的音频信号(u)的装置(25)。
2.根据权利要求1的多通道音频转换器，其特征在于所述转换装置包括装置(24)，用于形成对应于该主信号的所述频率范围的分量(yb(k))的频率范围主信号(yb(k))，和用于将所述差异音频信号(yr{y(k)-yb(k))，频率范围主信号(yb(k))和剩余信号q(k)转换为所述增强的音频信号(u)的装置，差异音频信号(y(k)-yB(k))的转换矩阵(T，M)不同于频率范围主信号(yb(k))的转换矩阵(TγM)。
3.根据权利要求1或2的多通道音频转换器，其特征在于所述转换装置包括装置(23)，用于根据原始音频信号(x)形成用于音频差异信号(yr)的转换矩阵(T)的信号系数(cl，cr，c’c)。
4.根据权利要求1至3之一的多通道音频转换器，其特征在于所述转换装置包括装置(26)，用于为频率范围主信号(yb(k))而调整转换矩阵(M)。
5.根据权利要求4的多通道音频转换器，其特征在于所述转换装置包括用于调整该频率范围主信号(yb(k))的表面强度的装置。
6.根据权利要求4或5的多通道音频转换器，其特征在于所述转换装置包括用于调整所选择的频率范围信号的表面位置的装置。
7.根据上述任一个权利要求的多通道音频转换器，其特征在于所选择的频率范围其两侧是未被选择的频率范围。
8.根据权利要求6的多通道音频转换器，其特征在于所选择的频率范围大约在300Hz到4至5kHz之间。
9.一种根据原始音频信号(x)产生增强音频信号(u)的方法，其中信息信号(cl，cr，cs，cc)是由原始音频信号得到的，并用于将所述原始音频信号(x)转换为所述增强的音频信号(u)，其特征在于根据原始音频信号(x)可确定基本上相互正交的主信号(y(k))和剩余信号(q(k))，在至少两个频率范围内主信号的频率分量被分析，对应于主信号(y(k))减去该主信号在一个或多个选择的频率范围内的频率范围分量(yb(k))的差异音频信号(yr)被形成，且差异信号(yr)和剩余信号(q(k))被转换为所述增强的音频信号。
全文摘要
一种可由原始音频信号(x，x
文档编号G10K15/04GK1426669SQ01808464
公开日2003年6月25日申请日期2001年12月7日优先权日2000年12月22日
发明者R·欧万, R·M·阿尔茨申请人:皇家菲利浦电子有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：R.欧万;R.M.阿尔茨
技术所有人：皇家菲利浦电子有限公司
我是此专利的发明人

上一篇：倒车警报器的利记博彩app
上一篇：频谱的增强方法和装置的利记博彩app