检测自我生成的唤醒声调的利记博彩app_4

文档序号：9794122阅读：来源：国知局

有发生唤醒声调，那么不采取进一步动作。如果定向音频信号中的至少一个中发生唤醒声调，那么执行动作612。动作612包括确定输入音频中何时检测到发生唤醒声调是输出音频中发生和/或由音频装置106的扬声器110产生唤醒声调的结果。动作612至少部分基于由动作608生成的识别参数。
[0084] 在一些实施方案中，可以根据其中发现唤醒声调的定向音频信号的数量或图案来作出确定612。例如，检测到所有或大多数定向音频信号中的唤醒声调可以被视为唤醒声调是由扬声器110生成的指示，而检测到少于大多数定向音频信号中的唤醒声调可以被视为唤醒声调是由位于相对于音频装置106的特定方向上的用户生成的指示。作为另一实例，动作612可以包括识别有可能包括唤醒声调的定向音频信号的数量，及比较所述数量与阈值。更具体地说，如果被识别为有可能包括阈值的定向信号的数量小于或等于1或2的阈值，那么唤醒声调可以被视为由用户发出。
[0085] 作为另一实例，动作612可以包括识别有可能包括唤醒声调的定向音频信号的集合及比较已识别集合与定向音频信号的预定集合，其中预定集合包括当输出音频中发生唤醒声调时被视为包括所述唤醒声调的定向音频信号。预定集合可以在初始化程序或在音频装置106被视为产生唤醒声调的其它时间获取。更特定地说，获取程序可以用于确定当唤醒声调已从扬声器110产生时可预期包括所述唤醒声调的定向音频信号的特定集合。类似地，获取程序可以用于确定当唤醒声调由用户发出时可预期包括所述唤醒声调的定向音频信号的图案或组。
[0086] 作为另一实例，可以分析其中检测到唤醒声调的定向音频信号的图案以确定唤醒声调是否被接收作为全方位输入或其是否接收自对应于用户的位置的单一方向。在一些情况中，用户发出的唤醒声调还可以被接收作为来自反射表面的音频反射。因此，源自于两个相异方向的唤醒声调在一些情况中可以被评估为由用户发出。
[0087] 某些实施方案可以参考参考参数614的集合利用动作612中的更复杂分析。参考参数614可以由系统设计者指定，或可以包括如上文参考图5描述般获取的参数。参考参数可以包括指示哪些定向音频信号包括或有可能包括唤醒声调的声调识别参数。参考参数还可以包括关于语音生成、输出音频生成、回声消除等等的参数。包括神经网络、模糊逻辑和贝叶斯(Bayesian)分类的机器获取技术可以用于配制参考参数和/或执行当前参数与参考参数的比较。
[0088] 在其中由装置扬声器产生或接收自装置扬声器的音频并非全方位的情形中可以使用已获取的参考参数。诸如此的情形可以由声波反射或其它异常现象所致，和/或导致其中装置的扬声器是定向的而非全方位的实施方案。在一些实施方案中，有时候称为条形音响的波束形成扬声器可以用于在特定环境的独特声音特性的背景中针对最优性能定制扬声器输出。例如，扬声器的定向可以被配置来最小化反射和优化检测用户发出的音频的能力。
[0089] 如果动作612确定受检测唤醒声调是由扬声器110产生，那么执行动作516,其包括忽略唤醒声调。否则，如果动作612确定受检测唤醒声调是由用户104发出，那么执行动作 618。动作618包括宣布唤醒事件。音频装置106可以通过解译并作用于随后检测的用户语音来响应于已宣布的唤醒事件。
[0090] 上文描述的实施方案可以编程方式(诸如利用计算机、处理器)实施为数字信号处理器、模拟处理器等等。然而，在其它实施方案中，可以使用专业或专用电路(包括模拟电路和/或数字逻辑电路)实施组件、功能或元件中的一个或多个。如本文中使用的术语"组件" 旨在包括用于实施归属于组件的功能的任何硬件、软件、逻辑或前述组合。
[0091]虽然已按照结构特征所特有的语言描述了本主题，但是应了解，随附权利要求书中定义的主题不一定被限于所描述的具体特征。相反地，具体特征被公开为实施所述权利要求书的说明形式。
[0092] 条款
[0093] 1.-种被配置来响应于由用户发出的触发声调的音频装置，其包括：
[0094] 扬声器，其被配置来生成输出音频；
[0095] 麦克风阵列，其被配置来产生多个输入音频信号；
[0096] 音频波束形成器，其被配置来至少部分基于所述输入音频信号产生多个定向音频信号，其中所述定向音频信号表示来自分别对应于所述音频装置的方向的音频；
[0097] -个或多个语音识别组件，其被配置来检测由所述相应定向音频信号中的每一个表示的所述音频中是否发生预定义声调;和
[0098] 声调检测器，其被配置来(a)如果所述触发声调发生在由少于阈值数量的所述定向音频信号表示的所述音频中，那么确定所述触发声调是由所述用户发出；和(b)如果所述预定义声调发生在由所有所述定向音频信号表示的所述音频中，那么确定所述预定义声调并非由所述扬声器生成。
[0099] 2.根据条款1所述的音频装置，其中所述声调检测器还被配置来在所述触发声调发生于来自在从所述音频装置处的顶点延伸的单一锥角形状内的多个方向的所述音频中时确定所述触发声调是由所述用户发出。
[0100] 3.根据条款1所述的音频装置，其中所述声调检测器还被配置来在所述预定义声调发生于来自在从所述音频装置处的顶点延伸的两个锥角形状内的多个方向的所述音频中时确定所述预定义声调是由所述用户发出。
[0101] 4.根据条款1所述的音频装置，其中所述声调检测器还被配置来在所述预定义声调发生于由多于一半的所述定向音频信号表示的所述音频中时确定所述预定义声调是由所述扬声器生成。
[0102] 5. 一种方法，其包括：
[0103] 在用户环境中产生输出音频；
[0104] 分别从所述用户环境的对应部分接收表示输入音频的多个音频信号；
[0105]生成指示所述定向音频信号中的一个或几个中的哪些定向音频信号包括预定义声调的一个或多个识别参数;和
[0106] 至少部分基于所述一个或多个识别参数确定所述输入音频中发生所述预定义声调是所述输出音频中发生所述预定义声调结果。
[0107] 6.根据条款5所述的方法，其中所述确定包括：
[0108] 确定所述一个或多个识别参数是否指示所有所述音频信号均表示包括所述预定义声调的输入音频;和
[0109] 如果所述一个或多个识别参数指示所有所述输入音频信号均表示包括所述预定义声调的输入音频，那么确定所述输入音频中发生所述预定义声调是所述输出音频中发生所述预定义声调的结果。
[0110] 7 .根据条款5所述的方法，其中所述确定包括：
[0111] 至少部分基于所述识别参数识别表示包括所述预定义声调的输入音频的所述音频信号的数量;和
[0112] 如果所述数量超过阈值，那么确定所述输入音频中发生所述预定义声调是所述输出音频中发生所述预定义声调的结果。
[0113] 8.根据条款5所述的方法，其中：
[0114] 所述识别参数包括分别对应于所述音频信号的个别参数；
[0115] 每一个别参数指示所述对应音频信号是否表示包括所述预定义声调的输入音频；
[0116] 所述确定还包括至少部分基于所述个别参数识别表示包括所述预定义声调的输入音频的所述音频信号的数量;和
[0117] 所述确定还包括如果所述数量超过阈值，那么确定所述输入音频中发生所述预定义声调是所述输出音频中发生所述预定义声调的结果。
[0118] 9.根据条款5所述的方法，其中所述确定包括：
[0119] 识别观察信号集，其中所述观察信号集具有包括所述音频信号中的一个或多个的一个或多个成员，所述音频信号由所述一个或多个识别参数指示为表示包括所述预定义声调的输入首频；
[0120] 如果所述观察信号集和参考信号集具有所述相同的一个或多个成员，那么确定所述输入音频中发生所述预定义声调是所述输出音频中发生所述预定义声调的结果;和 [0121]其中所述参考信号集具有包括所述音频信号中的一个或多个的一个或多个成员，所述音频信号包括所述输出音频中发生所述预定义声调期间的所述预定义声调。
[0122] 10.根据条款9所述的方法，其还包括识别所述输出音频中已知发生所述预定义声调期间的所述参考信号集的所述一个或多个成员，其中所述参考信号集的所述一个或多个成员包括所述音频信号中的一个或多个，所述音频信号由所述一个或多个识别参数指示为表示包括所述输出音频中已知发生所述预定义声调期间的所述预定义声调的输入音频。
[0123] 11.根据条款5所述的方法，其中所述一个或多个识别参数指示以下一项或多项：
[0124] 所述输出音频的响度；
[0125] 所述输出音频是否被视为包括语音；
[0126] 所述输入音频的响度;或
[0127] 所述音频信号的回声特性。
[0128] 12.根据条款11所述的方法，其还包括使用机器获取来执行所述确定。
[01

完整全部详细技术资料下载

当前第4页1 2 3 4 5