计算机系统及音频比对方法

文档序号:8320305阅读:721来源:国知局
计算机系统及音频比对方法
【技术领域】
[0001] 本发明是有关于一种计算机系统及音频比对方法,且特别是有关于一种循序进行 音频比对的计算机系统及音频比对方法。
【背景技术】
[0002] 音频比对是一种快速的音频检索方式,使用者可在噪音环境下录制一段正在播放 的音频片段,并在音频比对系统中找到最符合此音频片段的歌曲、电影、电视节目或广播节 目。
[0003] 然而,已知的音频比对系统在音频比对的正确率、音频比对所需的等待时间以及 执行音频比对的服务器的运算量上仍有许多改进的空间。
[0004] 因此,如何设计一个新的音频比对装置及方法,以解决上述的问题,乃为此一业界 亟待解决的问题。

【发明内容】

[0005] 因此,本发明的一方面是在提供一种计算机系统,用以进行音频比对。计算机系统 包含客户终端以及服务器。
[0006] 客户终端包含分类器、第一地标特征撷取模块、第一编码模块以及整合模块。分类 器用以估算第一音频样本的一第一音频片段的辨识难易度。第一地标特征撷取模块用以根 据辨识难易度,决定地标特征撷取的次数,并对第一音频片段进行相对应次数的地标特征 撷取,以产生多个第一地标特征。第一编码模块用以将第一地标特征编码为多个第一散列 键。整合模块用以整合第一散列键,并产生整合后的多个散列键传送至服务器。
[0007] 服务器包含第二地标特征撷取模块、第二编码模块、散列表、查表模块、分析模块 以及判断模块。
[0008] 第二地标特征撷取模块用以对第二音频样本进行地标特征撷取,以产生多个第二 地标特征。第二编码模块用以将第二地标特征编码为多个第二散列键。散列表用以储存第 二散列键与其所对应的多个散列值。查表模块,用以将客户终端所传送的散列键与散列表 中的第二散列键进行查表比对。分析模块用以分析查表比对的结果。判断模块,用以决定 音频比对结果,并将音频比对结果传送至客户终端。
[0009] 依据本发明一实施例,判断模块还用以测量一信心度,当信心度达到门槛值时,则 决定音频比对结果,并将音频比对结果传送至客户终端。当信心度未达门槛值时,则判断模 块发送请求至客户终端,客户终端配合服务器依据请求对第一音频样本中的一第二音频片 段进行音频处理。
[0010] 依据本发明另一实施例,上述第二音频片段是接续于第一音频片段。
[0011] 依据本发明又一实施例,上述信心度为第一音频片段中每秒比对到的散列键数 目。
[0012] 依据本发明更具有的一实施例,上述第一地标特征与第二地标特征包含一起始频 率、一频率差以及一时间差。
[0013] 依据本发明另具有的一实施例,上述第二散列键的散列值包含一地标特征开始时 间以及一节目数据。
[0014] 依据本发明又具有的一实施例,上述分类器于估算该辨识难易度时,利用第一音 频片段的一绝对音量的平均值、一相对音量的标准差、一三次微分绝对值加总的标准差中 的一者或上述三者的组合估算辨识难易度。
[0015] 依据本发明再具有的一实施例,于上述客户终端中,当两个第一散列键相同时,上 述整合模块还用以删除该两个第一散列键其中之一。
[0016] 依据本发明另又一实施例,上述第一音频样本为一歌曲、一电影、一电视节目或一 广播节目的音频。
[0017] 依据本发明另再一实施例,上述客户终端为一智能手机、一平板电脑、一笔记型电 脑、一智能手表、一智能眼镜、一智能电视,或一数字电视机上盒。
[0018] 本发明的再一方面是在提供一种音频比对方法,包含下列步骤:
[0019] 估算第一音频样本的一第一音频片段的辨识难易度;根据辨识难易度,决定地标 特征撷取的次数,并对第一音频片段进行相对应次数的地标特征撷取,以产生多个地标特 征;将地标特征编码为多个第一散列键;整合第一散列键,并将整合后的多个散列键与散 列表中的多个第二散列键进行查表比对;分析查表比对的结果;以及决定音频比对结果。
[0020] 依据本发明一实施例,音频比对方法还包含下列步骤:测量信心度;当信心度达 到门槛值时,则决定音频比对结果;以及当信心度未达门槛值时,则对第一音频样本的一第 二音频片段重新进行上述音频比对方法。
[0021] 依据本发明另一实施例,上述音频比对方法中,第二音频片段是接续于该第一音 频片段。
[0022] 依据本发明又一实施例,上述音频比对方法中,信心度为第一音频片段中每秒比 对到的散列键数目。
[0023] 依据本发明更具有的一实施例,上述音频比对方法中,各地标特征还包含一起始 频率、一频率差以及一时间差。
[0024] 依据本发明再具有的一实施例,上述音频比对方法中,各第二散列键的散列值还 包含一地标特征开始时间以及一节目数据。
[0025] 依据本发明又具有的一实施例,上述音频比对方法中,估算辨识难易度时,还利用 第一音频片段的绝对音量的平均值、相对音量的标准差、三次微分绝对值加总的标准差中 的一者或其组合或上述三者的组合。
[0026] 依据本发明另具有的一实施例,上述音频比对方法中,整合第一散列键的步骤还 包含:当两个第一散列键相同时,删除该两个第一散列键其中之一。
[0027] 本发明的又一方面是在提供一种计算机可读取记录媒体,储存一计算机程序,用 以执行一种音频比对方法,音频比对方法包含下列步骤:
[0028] 估算第一音频样本的一第一音频片段的辨识难易度;根据辨识难易度,决定地标 特征撷取的次数,并对第一音频片段进行相对应次数的地标特征撷取,以产生多个地标特 征;将地标特征编码为多个第一散列键;整合第一散列键,并将整合后的多个散列键与散 列表中的多个第二散列键进行查表比对;分析查表比对的结果;以及决定音频比对结果。
[0029] 应用本发明的优点在于可依音频片段的音频特征将取样音框平移,并多次计算地 标特征以减少音频片段的取样音框与音频样本的取样音框不对齐的影响,如此可有效提高 音频比对的正确率。另外,使用者可以循序上传音频片段的信息至服务器进行辨识,并在信 心度达到门槛值后即回传比对结果,如此可有效减少音频比对所需的等待时间,并减少服 务器的运算量,而轻易地达到上述的目的。
【附图说明】
[0030] 图1为本发明一实施例中,一种计算机系统的方块示意图。
[0031] 图2为本发明一实施例中,对音频片段进行地标特征撷取的示意图。
[0032] 图3为本发明一实施例中,对音频片段进行地标特征撷取的示意图。
[0033] 图4为本发明一实施例中,一种音频比对方法的流程示意图。
[0034] 图5为本发明另一实施例中,一种音频比对方法的流程示意图。
【具体实施方式】
[0035] 下文是举实施例配合所附附图作详细说明,但所提供的实施例并非用以限制本发 明所涵盖的范围,而结构运作的描述非用以限制其执行的顺序,任何由元件重新组合的结 构,所产生具有均等功效的装置,皆为本发明所涵盖的范围。此外,附图仅以说明为目的,并 未依照原尺寸作图。为使便于理解,下述说明中相同元件将以相同的符号标示来说明。
[0036] 在全篇说明书与权利要求书所使用的用词(terms),除有特别注明外,通常具有每 个用词使用在此领域中、在此揭露的内容中与特殊内容中的平常意义。某些用以描述本揭 露的用词将于下或在此说明书的别处讨论,以提供本领域技术人员在有关本揭露的描述上 额外的引导。
[0037]另外,关于本文中所使用的"耦接"或"连接",均可指二或多个元件相互直接作实 体或电性接触,或是相互间接作实体或电性接触,亦可指二或多个元件
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1