音频信号分析的利记博彩app

文档序号:8303514阅读:745来源:国知局
音频信号分析的利记博彩app
【技术领域】
[0001] 本发明设及音频信号分析,更具体地,设及音乐韵律分析。
【背景技术】
[0002] 在音乐术语中,音乐韵律包括音乐中强调或重音的循环模式。音乐韵律可W被描 述为包括旋律脉冲(measure pulse)、节拍脉冲和塔特姆脉冲,分别是指在脉冲持续时间方 面最长到最短的脉冲。
[0003] 节拍脉冲提供音乐中的基本时间单位,节拍脉冲的速率(速度)被认为是大多数 人在听到一段音乐时会用脚点地的速率。在许多实际应用中,识别一段音乐中节拍脉冲的 出现或者所谓的节拍跟踪是有利的。该样的应用包括音乐推荐应用,其中,在例如需要播放 列表中的音乐之间的无缝混音转换的电台节目主持人值J)应用中W自动循环技术捜索与 基准音轨相似的音乐。
[0004] 节拍跟踪系统和方法生成节拍序列,其包括在一段音乐或其一部分中节拍的时间 位置。
[0005] W下的术语有助于理解将在后面描述的某些概念。
[0006] 音局;音符的基频(f。)的生理相关性。
[0007] 色度(C虹oma),也称为音高集合;用整数个八度音阶分隔的音乐音高属于常见的 音高集合。在西方音乐中使用12个音高集合。
[000引节拍或节拍法(tactus);音乐中的基本时间单位,它可被认为是大多数人在听到 一段音乐时会用脚点地的速率。该个词也用于表示属于单个节拍的音乐部分。
[0009] 速度;节拍或节拍法脉冲的速率,通常W每分钟节拍(BPM)的单位表示。
[0010] 小节或旋律;定义为指定数量的具有指定持续时间的节拍的时间段。例如,在具有 4/4拍号的音乐中,每个小节包括4个节拍。
[0011] 重音或基于重音的音频分析;分析音频信号W检测音乐中的事件和/或变化,包 括但不限于所有离散声音事件的开始,特别是长而高的声音的开始、音色的响度的突然变 化及和声变化。在下文给出进一步的细节。
[0012] 人们相信人类是通过从重音中推断规律的脉冲模式来感知音乐韵律的,其中重音 是音乐中被强调的时刻。音乐中的不同事件导致重音。示例包括响度或音色的变化、和声变 化W及一般的所有声音事件的开始。特别地,长而高的声音的开始导致重音。自动的速度、 节拍或强拍估计器可尝试在一定程度上模仿人类对音乐韵律的感知。该可包含W下步骤: 测量音乐强调、执行对一个或多个脉冲的周期估计、找出所估计的脉冲的相位、W及选择与 速度对应的韵律水平或者一些其它感兴趣的韵律水平。由于重音与音乐中的事件有关,因 此,基于重音的音频分析是指对音乐中的事件和/或变化的检测。该种变化可能与信号的 响度、频谱和/或音高内容的变化有关。作为一个示例,基于重音的分析可能与例如使用色 度特征从信号中检测频谱变化、从信号中计算新的或起始点检测函数、从信号中检测离散 的起始点或者检测信号的音高和/或和声内容的变化有关。在执行频谱变化检测时,可W 使用各种变换或滤波器组分解,诸如快速傅里叶变换或多速率滤波器组、或者甚至基频f。 或音高突出度估计器。作为简单的示例,重音检测可通过在信号上W短帖计算信号在一组 频带上的短时能量、然后计算每两个相邻帖之间的差(诸如欧几里得距离)来执行。为了 增加针对各种音乐类型的鲁椿性,已经开发了很多不同的重音信号分析方法。
[0013] W下将要描述的系统和方法利用在W下公开物中描述的背景知识,该些公开物在 此通过引用结合。
[0014] [1]Cemgil A. T.等"On tempo tracking:tempogram representation and Kalman filtering. "J. New Music 民esearch, 2001.
[00巧] [2]Eronen,A?和 Klapuri,A.,"Music Tempo Estimation with k_NN regression, "IEEE Trans. Audio, Speech and Language Processing, Vol. 18, No. 1,Jan 2010.
[0016] [3] Seppanen, Kronen,Hiipakka."Joint Beat&Tatum Tracking from Music Signals", International Conference on Music Information 民etrieval, ISMI民 2006and Jarno Seppanen,Antti Kronen,Jarmo Hiipakka:Method, apparatus and computer program product for providing rhythm information from an audio signal. Nokia November 2009:US 7612275.
[0017] [4]Antti Kronen 和 Timo Kosonen"Creating and sharing variations of a music file"-United States Patent Application 20070261537.
[0018] [5] K1 apur i,A.,Eronen, A.,Asto 1 a, J.,"Anal y s i s of the meter of acoustic musical signals,"IEEE Trans.Audio, Speech,and Language Processing, Vol. 14, No. 1,2006.
[0019] [6] Jehan, Oeating Music by Listening, PhD Thesis, MIT, 2005.
[0020] ht化://web. media, mit. edu/ ?tristan/phd/pdf/Tristan_PhD_MIT. pdf
[0021] [7]D. Ellis, "Beat Tracking by Dynamic Programming", J. New Music 民esearch,Special Issue on Beat and Tempo Extraction,vol.36no.1,March 2007,pp. 51-60. (lOpp)DOI:10. 1080/09298210701653344.
[0022] [8]A.Klapuri, "Multiple fundamental frequency estimation by summing harmonic amplitudes, "in Proc.7th Int. Conf. Music Inf.民etrieval(ISMI民一06),Victor ia, Canada, 2006.

【发明内容】

[0023] 本发明的第一个方面提供了一种装置,其包括:
[0024] 第一重音信号模块,用于生成表示音频信号中的音乐重音的第一重音信号(ai);
[0025] 第二重音信号模块,用于生成表示所述音频信号中的音乐重音的不同的第二重音 信号(过2);
[0026] 第一节拍跟踪模块,用于根据所述第一重音信号估计第一节拍时间序列化1);
[0027] 第二节拍跟踪模块,用于根据所述第二重音信号估计第二节拍时间序列化2);臥 及
[002引序列选择器,用于识别所述第一节拍时间序列化1)和所述第二节拍时间序列化2) 中的哪一个与所述重音信号的一个或两者中的峰值最接近一致。
[0029] 该装置提供了用于识别音乐信号中的节拍位置的稳健且在计算上简单的系统和 方法。特别地,该装置提供了在从电子音乐到古典和摇滚音乐的音乐风格的范围上的节拍 跟踪的稳健且准确的方式。特别地,电子舞蹈音乐被更准确地处理。
[0030] 第一重音信号模块可被配置为通过基于基频(f。)突出度分析而提取色度重音特 征,生成第一重音信号(ai)
[0031] 该装置可W进一步包括速度估计器,其被配置为使用第一重音信号(ai)生成音频 信号的估计速度炬PMwt)。
[0032] 第一节拍跟踪模块可被配置为使用第一重音信号(ai)和估计速度炬PMwt)估计第 一节拍时间序列。
[0033] 第二重音信号模块可被配置为使用音频信号的带宽的预定子带生成第二重音信 号枉)。预定子带可W低于200Hz。
[0034] 第二重音信号模块可被配置为通过执行音频信号的多速率滤波器组分解W及使 用来自预定的一个滤波器的输出来生成重音信号,生成第二重音信号(a,)。
[0035] 该装置可进一步包括用于获取估计速度炬PMwt)的整数表示的装置,其中,第二节 拍跟踪模块可被配置为使用第二重音信号(a,)和整数表示来生成第二节拍时间序列化2)。
[0036] 估计速度炬PM,J的整数表示可W使用四舍五入取整的速度估计函数 (round(BPM.J)或者向上取整的速度估计函数(ceil (BPMwt))或者向下取整的速度估计函 数的oor炬PMe日t))来计算。
[0037] 该装置可W进一步包括用于对估计速度BPMwt执行向上取整函数和向下取整函数 W分别生成向上取整的速度估计(ceil 和向下取整的速度估计(floor @PM。^) 的装置,其中,第二节拍跟踪模块可被配置为使用第二重音信号(a,)分别与向上取整的速 度估计和向下取整的速度估计来生成第二节拍时间序列化2)和第S节拍时间序列化3),其 中,序列选择器可被配置为识别第一节拍时间序列、第二节拍时间序列和第=节拍时间序 列中的哪一个与重音信号的一个或两者中的峰值最接近一致。
[003引第二节拍跟踪模块可被配置为对于向上取整的速度估计和向下取整的速度估计 中的每一个,使用所述估计来生成初始节拍时间序列化t),将它与基准节拍时间序列化1) 进行比较,W及使用预定的相似度算法生成第二节拍时间序列和第S节拍时间序列。
[0039] 由第二节拍跟踪模块使用的预定的相似度算法可包括在偏移位置的范围上比较 初始节拍时间序列化t)和基准节拍时间序列化1) W识别该范围内的最佳匹配,所生成的第 二/第S节拍时间序列包括导致最佳匹配的基准节拍时间序列化1)的偏移版本。
[0040] 基准节拍时间序列化1)可具有恒定的节拍间隔。基准节拍时间序列化1)可在t =0, 1/狂/60),2/狂/60)....
当前第1页1 2 3 4 5 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1