专利名称:使用历史数据对联系信息的消歧的利记博彩app
技术领域:
本说明书涉及语音识别。
背景技术:
移动设备的用户可以通过例如在键盘上打字或对麦克风讲话来提供输入。当用户试图使用话音拨号来发起电话呼叫时,如果不同联系人具有相似发音的名字、或如果用户未能指定与联系人相关联的特定地址或位置,则移动设备可能拨打错误的联系人。
发明内容
当移动设备的用户讲出联系人的名字来发起与另一个人的通信时,他们的话语一般必须在至少两个方面被消歧。在被本说明书称为“识别质量”方面的第一方面的消歧涉及将话语的声音与讲话者可能已讲出的词语进行匹配。在一个示例中,在识别质量方面的消歧可以涉及当讲话者讲出在语音上被转录为“呼叫Pill”的话语时,确定他们意在说出“呼叫Bill (比尔)”还是“呼叫Phil (菲尔)”。在被本说明书称为“讲话者意图”方面的第二方面的消歧涉及当讲话者讲出话语时确定讲话者可能的意图。例如,如果假设讲话者已讲出了词语“呼叫Bill”,则在讲话者意图方面的消歧可以涉及确定用户意在呼叫名为“Bill”的多个联系人中的哪个、或讲话者可能意在“呼叫”在家还是工作中名为“Bill”的特定联系人。自动语音识别(“ASR”)引擎可以使用包括在节点之间的赋予权重的转换的语法,诸如话音拨号语法(或更一般地,“通信发起语法”)来在识别质量方面和讲话者意图方面两者使话语消歧。对两个上面的示例进行组合,并且在缺乏其他语境的情况下,当话语“呼叫pill”被讲出时,ASR引擎可以使用通信发起语法来确定用户意在“呼叫在家的Bill”还是“呼叫在他的小区的Phil”。因此,在本说明书中描述的主题的一个有创新性的方面可以在包括以下动作的方法中具体化估计用户意在或使用特定联系信息项发起与特定联系人的通信的概率。概率可以基于以下来估计在用户和特定联系人之间的过去交互;用来发起与联系人的通信的特定联系信息项的过去使用。使用估计的概率来对在通信发起语法中的与特定联系人或与特定联系信息相关联的转换的权重进行修改。最初,如本说明书所使用的,“ 联系信息”(或“联系信息项”)可以是指通信的接收者或目的地的任何编码或未编码的表示,诸如电话号码、电子邮件地址、物理或寄件地址、用户名、个人名字、账户名称、屏幕名称、即时通讯(頂)地址、网站名称或网络地址。“通信”可以是指在两个人类或非人类实体之间的新闻、观点或信息的任何同步或异步传递或交换,诸如消息(例如,电子邮件消息或即时消息)、文档(例如,电子文件或物理邮件)或电话呼叫。此外,“发起通信”是指直接或间接开始、启动、引起、生成或起动通信的动作或操作。在各种语境下,发起通信可以包括拨打电话号码、打开空白或预先写好地址的电子邮件消息、或打开即时通讯会话、或促使计算机执行这些动作。例如,在其他语境下,发起通信包括指示软件应用执行操作,所述操作诸如拨打电话号码、在空白电子邮件消息上写地址、或打开与联系人的即时消息会话。当要使用特定联系信息项来发起通信时,可以将这样的信息例如作为元数据与用来执行通信发起操作的指令一起传递给软件应用。将联系信息项作为元数据传递消除了用户手动输入联系信息的需要。与联系人的“过去交互”可以包括过去发起或实现的通信、或与联系人有关的过去非通信动作。例如,当用户发起或完成与联系人的电话呼叫、或进行持续多于预先确定的持续时间的电话呼叫时,可以发生过去交互。替选地,当用户将联系人添加到地址簿、或读取或访问联系人事先准备好的内容、与关于联系人的第三方通信、被分配给包括联系人的用户群、或被确定为在联系人的物理接近的地方内时,可以发生过去交互。
总的来说,在本说明书中描述的主题的另一个有创新性的方面可以在包括以下动作的方法中具体化接收音频信号;基于用户先前已与和联系信息项相关联的联系人通信的频率,并且进一步,对于两个或更多个联系信息项中的每一个,基于在用户和与该联系信息项相关联的联系人之间的一个或多个过去交互的新近性生成亲密度分值;基于为联系信息项生成的亲密度分值为联系信息项中的每一个推断用户意在使用联系信息项来发起通信的概率;生成包括与联系信息项中的每一个相关联的一个或多个转换的通信发起语法,其中对于联系信息项中的每一个,根据为该联系信息项推断的概率为与该联系信息项相关联的一个或多个转换赋予权重;使用通信发起语法来针对音频信号执行语音识别以选择特定联系信息项;以及使用特定联系信息项来发起通信。该方面的其他实施例包括被配置成执行所述方法的动作、编码在计算机存储设备上的对应系统、装置和计算机程序。这些和其他实施例每一个可以可选地包括下面特征中的一个或多个。例如,基于用户先前已与和联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括确定用户已接受了已拨打了联系人的话音拨打语音识别的结果的频率,并且基于用户已接受了话音拨打语音识别的结果的频率来递增亲密度分值;基于用户先前已与和联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括确定用户已手动拨打了联系人的频率,并且基于用户已手动拨打了联系人的频率来递增亲密度分值;基于用户先前已与和联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括确定用户已向联系人发送了短消息服务(SMS)消息或已从联系人接收了 SMS消息的频率,并且基于用户已向联系人发送了 SMS消息或已从联系人接收了 SMS消息的频率来递增亲密度分值;基于用户先前已与和联系信息项相关联的联系人通信的频率来生成亲密度分值进一步是确定用户已向联系人发送了电子邮件消息或已从联系人接收了电子邮件消息的频率,并且基于用户已向联系人发送了电子邮件消息或已从联系人接收了电子邮件消息的频率来递增亲密度分值;基于在用户和与联系信息项相关联的联系人之间的一个或多个过去交互的新近性来生成亲密度分值进一步包括确定联系人在预先确定的时段内已被添加到用户的地址簿,并且基于确定联系人在预先确定的时段内已被添加到用户的地址簿来递增亲密度分值;所述动作包括接收引用与用户相关联的当前语境的数据;对于在用户和联系人之间的两个或更多个过去交互中的每一个,接收引用与过去交互相关联的语境的数据;将与用户相关联的当前语境和与过去交互相关联的语境进行比较;以及基于将与用户相关联的当前语境和与过去交互相关联的语境进行比较来选择两个或更多个过去交互的子集;仅使用过去交互的子集来生成亲密度分值;对于两个或更多个联系信息项中的每一个,基于用户先前已与和该联系信息项相关联的联系人通信的频率生成亲密度分值进一步包括基于用户先前使用第一通信信道已与和该联系信息项相关联的联系人通信的频率来生成第一部分亲密度分值;基于用户先前使用第二通信信道已与和该联系信息项相关联的联系人通信的频率来生成第二部分亲密度分值;为第一部分亲密度分值和第二部分亲密度分值赋予权重;以及将赋予权重的第一部分亲密度分值与赋予权重的第二部分亲密度分值相组合来生成亲密度分值;对于两个或更多个联系信息项中的每一个,基于在用户和与该联系信息项相关联的联系人之间的一个或多个过去交互的新近性生成亲密度分值进一步包括将指数衰减函数应用到当在用户和与该联系信息项相关联的联系人之间的一个或多个过去交互发生了时引用的数据;对于两个或更多个联系信息项中的每一个,基于在用户和与该联系信息项相关联的联系人之间的一个或多个过去交互的新近性生成亲密度分值进一步包括选择已在预先确定的时段内发生的一个或多个过去交互的子集。可以实现在本说明书中描述的主题的特定实施例来实现下面优势中的一个或多个。可以提高话音发起的通信,诸如 话音拨号的准确性,增强了用户体验并且增加了用户满意度。可以使用用户的自身过去动作来推断其未来动作,从而使预测的动作个性化。可以在服务器端而不是在客户端设备执行语音识别和其他复杂任务,以允许增强的过程最优化并且增加计算效率。在附图和下面的描述中阐述了在本说明书中描述的主题的一个或多个实施例的细节。主题的其他潜在特征、方面和优势从描述、附图和权利要求将变得显而易见。
图1是使用历史数据来对话音输入所引用的联系信息进行消歧的示例系统的图。图2是用于对联系信息进行消歧的示例性过程的流程图。图3示出示例用户界面。在整个附图中,相同参考数字表示对应部分。
具体实施例方式图1是使用历史数据113来对联系信息进行消歧的示例系统100的图。具体地,系统100包括通过一个或多个网络104连接的移动客户端通信设备(“客户端设备”)101 (例如,蜂窝电话、PDA、个人计算机、音乐播放器、平板计算机、电子书阅读器或其他处理设备)和服务器102 (例如,ASR引擎或与搜索引擎相关联的“语音识别器”、或包括一个或多个处理器103的另一个设备)。图1还描绘了状态(a)至(j),其示出了当系统100执行示例联系信息消歧过程时发生的数据流。
通常,状态(a)至(e)涉及估计客户端设备101的用户105将发起与其联系人列表111中的一个或多个联系人的通信(例如,将“话音拨打”所述联系人)的概率,以及状态(f)至(j)涉及对语音识别器进行调整以使用这些概率来对联系信息进行更准确地消歧。实际上,状态(a)至(j)可以按照所图示的序列发生、或它们可以按照不同于所图示的序列的序列发生。在状态(a)期间,客户端设备101的用户105 (“Bob (鲍勃)”)对客户端设备101的麦克风讲出话语106,以指示运行于客户端设备101上的应用发起与在他的联系人列表中的联系人的通信。话语106在语音上被转录为“呼叫pill”。取决于诸如背景噪声或用户105的口音的变量,服务器102可以将话语106解释为使用与联系人“Bill”相关联的多个电话号码中的一个来发起与名为“Bill”的联系人的电话呼叫的话音命令、或使用与“Phil”相关联的多个电话号码中的一个来发起与名为“Phil”的联系人的电话呼叫的命令。由于服务器102可以生成话语106的多个解释或转录,所以在服务器102可以执行话音命令之前,服务器102必须对联系信息进行消歧来推断用户105的意图。在状态(b)期间,通过网络104将数据107从客户端设备101通信到服务器102。数据107可以包括例如对应于话语106的音频信号108 (或“音频文件”、“波形”或“样本”)。例如,客户端设备101可以通过记录话语106来创建声音文件或数据流,并且可以在客户端设备101和服务器102之间建立的通信会话期间通过网络104发送声音文件。替代发送音频信号108本身,客户端设备101可以将引用音频信号108或话语106的信息(例如,存储在服务器102上的文件的名称、超链接或与音频信号108相关联的唯一标识符)包括在数据107 内。数据107还可以包括唯一地标识用户105、或标识用户105被分配给的群、客户端设备101、与客户端设备101相关联的类型或与客户端设备101的组件(即,音频子系统)相关联的类型的标识数据109。标识数据109可以是例如字母数字用户标识符、或用户105或客户端设备101的名称。数据107还可以包括描述在话语 106被讲出时与用户105或客户端设备101相关联的当前语境的语境数据110。语境数据110可以包括音频信号,诸如周围或环境音频的记录。在各种示例中,语境数据110可以引用话语106被讲出、由客户端设备101接收或传输的时间和日期(即“星期二中午”)、可以引用话语106被讲出时客户端设备101的位置、可以引用客户端设备101的类型(即,“移动”)或客户端设备101实现的音频子系统的类型、可以引用在话语106被讲出、由客户端设备101接收或传输时客户端设备101被对接(dock)还是装入套、可以引用当自动或使用特定联系信息发起与特定联系人的通信时用户105是发起接受动作还是取消动作、可以引用用户105是否从m-最佳列表选择话语106的替选识别、或可以引用客户端设备101是否作为到WiFi连接的接入。在状态(C)期间,服务器102使用唯一地标识用户105的数据109来选择与用户105相关联的联系人列表111、亲密度数据112以及可选地通信发起语法118。可以从服务器102所存储的多个联系人列表、亲密度数据集合以及语法中选择与用户105相关联的联系人列表111、亲密度数据112和语法118。亲密度数据112可以包括关于过去交互的历史数据113 (例如,在用户和存储在联系人列表111中的一个或多个联系人之间的通信、或用户105用存储在联系人列表111中的一个或多个联系信息项所发起的过去交互的、或与联系人或联系信息有关的非通信动作)。除标识成功和未成功的电话呼叫完成外,历史数据113还可以标识用户105经由手动发起已选择过的联系信息、用户105曾用来交换文本(SMS)消息的联系信息、或用户105曾用来发送电子邮件或其他类型的消息的联系信息。更详细地,历史数据113可以标识与用户所发起的一个或多个过去交互相关联的时间和日期、和/或与过去交互相关联的权重和乘法器。可以使用与过去交互相关联的时间和日期来生成频率和新近性统计,诸如在指定时段内使用特定联系信息项在用户105和联系人之间已发生的过去交互的数量的频率计数。 可以基于每一个相应的过去交互的类型或质量来分配或生成与在历史数据113中的过去交互相关联的权重。例如,较高权重值可以与对联系人的完成的电话呼叫相关联,以及较低权重值可以与未完成或尝试的电话呼叫相关联。类似地,较高权重值可以与联系人在“至”字段中列出的电子邮件相关联,以及较低权重值可以被分配给联系人仅仅是“CC:’ed”的电子邮件。另外,更高权重(例如,值五)可以与持续长于预先确定的阈值持续时间的IM会话相关联,以及更低权重(例如,值二)可以与持续短于预先确定的阈值持续时间的IM会话相关联。较高权重值还可以与将新的联系人添加到地址簿的动作相关联,其反映用户105可能发起与他们刚刚添加的联系人的通信的念头。权重可以与历史数据113中的过去交互联合被存储、或它们可以响应于接收音频信号108或当另一个事件发生时即时动态地生成。可以使用与过去交互相关联的乘法器来调整频率计数对与过去交互相关联的总体亲密度分值的影响。例如并且如在下面更详细描述的,可以为很久以前发生过的一个或多个过去交互将零值乘法器应用到频率计数,而可以为新近发生的一个或多个过去交互将正的、非零乘法器应用到频率计数。用于非零乘法器的值可以显现出时间衰减影响。除基于时间的乘法器外,可以使用基于语境的乘法器来强调或不再强调频率计数可以对某些过去交互的总体亲密度分值的影响。例如,可以为在服务器102确定为是与用户105的当前语境不相似或十分不相似的语境下已发生的一个或多个过去交互,将低值乘法器(例如,10%)应用到频率计数。相反地,可以为在服务器102确定为是与用户105的当前语境相似或相同的语境下已发生的一个或多个过去交互,将高值乘法器(例如,200%)应用到频率计数。与过去交互相关联的乘法器可以与历史数据113中的过去交互联合被存储、或它们可以响应于接收音频信号108或当另一个事件发生时即时动态地生成。亲密度数据112还可以包括已为存储在联系人列表111中的联系信息生成的当前或过去亲密度分值114。例如,亲密度数据112可以包括每一个相应联系信息项的“累积账”亲密度分值。表115提供了可以被存储在服务器102上的亲密度数据112中、并且可以用来生成亲密度分值120和概率121的数据的一个示例可视化。具体地,表115引用当用户105使用联系人117 (“Bill”)的联系信息116a至116c来发起通信时,以及当用户105使用联系人119 (“Phil”)的联系信息116d至116f来发起通信时已发生的若干过去交互。表115还包括在三个重叠但是不同的时段期间每一个联系信息项116的频率计数。
更详细地,表115示出了联系信息项116a、联系人117的“工作”电子邮件地址在前一周四十六次、在前一月九十四次、以及在上一年一百六十三次被用来发起与联系人117的通信。表115还示出联系信息项116b、联系人117的“住宅”电话号码在前一周十六次、在前一月三十五次、以及在上一年四十次被用来发起与联系人117的通信。此外,表115还示出联系信息项116c、联系人117的“工作”电话号码在前一周十四次、在前一月二十四次、以及在上一年九十次被用来发起与联系人117的通信。表115还示出联系信息项116d、联系人119的“工作”电子邮件地址在前一周十次、在前一月二十七次、以及在上一年五十二次被用来发起与联系人119的通信。而且,表115示出了联系信息项116e、联系人119的“住宅”电话号码在前一周十五次、在前一月二十次、以及在上一年三十四次被用来发起与联系人119的通信。此外,表115示出了联系信息项116f、联系人119的“蜂窝”电话号码在前一周十八次、在前一月二十次、以及在上一年二十一次被用来发起与联系人117的通信。在状态(d)期间,服务器102至少部分基于用户先前已与和联系信息项相关联的联系人通信的频率以及在用户和与联系信息项相关联的联系人之间的一个或多个过去交互的新近性,为联系人列表111中的联系信息项生成亲密度分值。通过基于用户先前已与联系人通信的程度来生成亲密度分值,服务器102更可能偏爱用户与之最频繁通信的联系人来解决话音拨号歧义,从而提高了话音拨号的准确性并且增强了用户105的体验。如表115中所示,可以仅使用在固定持续时间或“滑动窗口”内发生的那些过去交互来生成亲密度分值120。例如,亲密度分值可以使用在前一月内的电话联系的赋予权重的频率计数来生成、通过在前一周内到同一联系人的电子邮件通信的赋予权重的频率计数来增大。通过将没有在固定持续时间内发生的那些过去交互的相应频率计数乘以零值乘法器,可以将滑动窗口应用到历史数据113。如表115中所示,服务器102为联系信息116b计算五十八的亲密度分值120b、为联系信息116c计算四十七的亲密度分值120c、为联系信息116e计算二十五的亲密度分值120e以及为联系信息116f计算二十五的亲密度分值120f。因此,联系信息116b与最高亲密度分值相关联。亲密度分值120与用户105在过去使用特定联系信息项来发起与联系人的通信的程度相互关联。例如,联系信息116b的五十八的亲密度分值120b反映用户105先前使用联系信息116b来发起通信的程度比用户105先前使用联系信息116c来发起通信的程度大,联系信息116c具有四十七的亲密度分值102c。在使用不同评分系统的其他实施方式中,较高亲密度分值可以反映用户105已发起语境的程度比较低亲密度分值的程度小。在状态(e)期间,服务器102推断用户105意在使用每一个联系信息项来发起通信的概率。在一些实施方式中,该概率基于为各个联系信息项生成的亲密度分值120来推断。服务器可以使用任何数量的不同方法来推断概率121。例如,通过将所有亲密度分值120乘以常数因子或将所有亲密度分值120除以常数因子来生成概率,使得所有概率121的总和总共是1. 0,可以将特定联系信息项的概率设置为与亲密度分值120成比例或成反比例。替选地,可以通过将特定联系信息项的亲密度分值除以地址簿中的所有联系信息项的所有概率分值的总和,来确定特定联系信息项的概率。还可以使用基于狄利克雷分布的方法。
如表115中所示,服务器102为联系信息116b推断37%的概率121b、为联系信息116c推断30%的概率121c、以及为联系信息116e和116f中的每一个推断16%的概率121e和121f。正如预期的,联系信息116b与最高亲密度分值相关联,相应地,与最高概率相关联。在状态(f)期间,服务器102生成通信发起语法122。生成通信发起语法122可以包括对先前为用户105生成或选择的通信发起语法118进行更新。通信发起语法122指定用户能够讲出的词的合法序列。例如,语法可以允许诸如“呼叫在家的Bill”或“拨打Phil”等的序列,但是可以不允许诸如“订购批萨”或“Bill应当被呼叫”的其他序列。通信发起语法122包括节点和在节点之间的赋予权重的转换(例如,转换124、126、129、130、132和135)。转换可以被加标签有有效词(例如,标识联系人、命令或联系信息项的词),以及权重可以反映词在句子中将跟随的概率。在通信发起语法122中,根据服务器102为联系信息项推断的概率设置与联系信息项的转换相关联的权重。在状态(g)期间,服务器102上的语音识别器138使用通信发起语法122来对音频信号108执行语音识别,以及在状态(h)期间,选择特定联系信息项。具体地,语音识别器138在通信发起语法122的起始节点123开始,并且沿着第一转换124 (“呼叫”)到第一节点125。语音识别器138然后通过沿着具有六十七的权重的转换125 (“Bill”)到第二节点127,而不是沿着具有三十二的权重的转换129 (“Phil”),来解决在联系人名字“Bill”和“Phil”之间的歧义。另外,语音识别器138然后通过沿着具有三十七的权重的转换130(“住宅”)到节点131,而不是沿着具有三十的权重的转换132到节点134以及沿着具有零的权重的转换135到节点136,来解决在联系人“Bill”的多个联系信息项之间的歧义。即使话语106在联系人名字之后没有指定任何进一步信息,语音识别器138也将沿着与“住宅”位置相关联的转换130行进,因为在转换130、132和135之间,转换130具有最高权重值。当遍历了通信发起语法121时,语音识别器138输出将联系信息116b标识为当用户105讲出话语106时用户105最可能意指的联系信息的数据137。在状态(i)期间,使用所选择的联系信息项116b来发起通信。例如,服务器102可以将引用联系信息116的消息139发送给客户端设备101。消息139可以指示客户端设备101使用联系信息项116b来发起通信。在状态(j)期间, 客户端设备101使用联系信息项116b来发起通信,并且经由讲出的输出140向用户通知已发起通信。通信可以由服务器上的通信应用141发起。图2是用于对联系信息进行消歧的示例过程200的流程图。简单地说,过程200包括接收音频信号;基于用户先前已与和联系信息项相关联的联系人通信的频率,并且进一步对于两个或更多个联系信息项中的每一个,基于在用户和与该联系信息项相关联的联系人之间的一个或多个过去交互的新近性生成亲密度分值;基于为联系信息项生成的亲密度分值为联系信息项中的每一个推断用户意在使用联系信息项来发起通信的概率。过程200还包括生成包括与联系信息项中的每一个相关联的一个或多个转换的通信发起语法,其中对于联系信息项中的每一个,根据为该联系信息项推断的概率为与该联系信息项相关联的一个或多个转换赋予权重;使用通信发起语法来对音频信号执行语音识别以选择特定联系信息项;以及使用特定联系信息项来发起通信。
更详细地,当过程200开始(201)时,接收音频信号(202)。音频信号可以对应于作为对客户端设备上的控件、应用或话音输入法编辑器(“頂E”)的话音输入讲出的话语。在话音拨号语境下,音频信号还可以包括关于用户想要呼叫的号码的类型的一些另外信息,诸如“呼叫马修·史密斯的移动设备”或“呼叫在家的马修·史密斯”。虽然音频信号可以对应于话音拨号命令,然而,在其他实施方式中,用户可以意在发起另一种类型的通信。例如,当客户端设备的用户指示应用编撰并发出另一种形式的电子通信(例如,电子邮件、传真、即时消息、“朋友请求”或社交网络“闲逛(poke)”、或文本消息)时,可以记录音频信号。当客户端设备的用户在讲出话语之前选择控件(例如,麦克风图标),讲出话语,然后释放控件,从而促使客户端设备生成音频信号并且发起过程200时,可以记录音频信号。在另一个示例中,客户端设备的麦克风(例如,使用预测的记录)可能在用户讲话之前已“打开”、或可能处于“永久打开”状态(例如,用户可以只是讲话,而不用“打开”麦克风)。除话语外,诸如周围或环境音频的其他信息也可以以音频信号形式被记录或编码。音频信号可以由服务器接收,该服务器可以是搜索引擎、ASR引擎、听写引擎、对话系统、或在执行任何过程时使用转录的语音、或调用使用转录的语音的软件应用的任何其他引擎或系统。通过将音频信号发送给服务器,客户端设备可以避免必须在本地执行联系信息消歧或语音识别过程,为客户端设备减少了处理需求。然而,在其他示例实施方式中,语音识别或联系信息消歧过程可以由客户端设备执行,以及语音识别或联系信息消歧过程的输出可以进一步由客户端设备处理或通信给服务器。可以通过公共交换电话网络(PSTN)、无线蜂窝网络、无线局域网(WLAN)或W1-Fi网络、第三代(3G)或第四代(4G)移动电信网络、诸如内联网的专用网络、诸如因特网的公用网络或其任何适当组合将音频信号从客户端设备传送给服务器。为多个联系信息项中的每一个生成亲密度分值(204)。亲密度分值可以基于以下来生成用户先前已与和联系信息项相关联的联系人通信的频率;和/或在用户和与联系信息项相关联的联系人之间 的一个或多个过去交互的新近性。用于生成亲密度分值的一个方法是将相等的亲密度分值应用到每一个联系信息项。例如,如果在地址簿中存在N个联系信息项,则给予每一个联系信息项1/N的亲密度分值。然而,这种方法没有从对反映特定联系信息项在过去已被用来发起联系的程度的数据的使用获益。用于生成亲密度分值的另一个方法使用基于频率计数的平滑评分。例如,可以将每一个联系信息项的频率计数(例如,拨打事件、呼叫发起、电子邮件等的数量)赋予权重、按比例调整或另外转变成亲密度分值。虽然这种方法利用了频率计数,然而,其在确定亲密度分值时没有考虑每一个过去交互的新近性的因素。因此,这种方法对其呼叫模式随着时间的推移改变的用户来说,可能更少有益。在上面被称为滑动窗口方法的第三方法通过为在预先确定的时段内已发生的过去交互合计频率计数来生成亲密度分值。例如,可以对最近已使用特定联系信息项来发起的通信的数量进行计数,并且可以将该数量赋予权重并且按比例调整来生成亲密度分值。这样的方法使用频率和新近性信息两者来生成亲密度分值,因此对其呼叫模式随着时间的推移改变的用户来说可以是有用的。
用于生成亲密度分值的第四方法使用指数衰减频率计数,其对于新的联系人增大。使用这种方法,为用户的联系人列表中的每个联系人保存累积亲密度分值。当用户发起与联系人的通信时,频率计数被递增、赋予权重和/或按比例调整,并且亲密度分值随频率计数而递增。随着时间的推移,亲密度分值通过指数衰减因子被持续按比例调整或减少(例如,通过每天将亲密度分值乘以O. 99),使得用户在很长时间没有拨打的联系人具有较低亲密度分值。使用这种方法,新近添加的联系信息可以立即被分配有非零亲密度分值,以给予该联系信息项足够的亲密度分值来指示用户非常可能很快使用该联系信息来发起与他的新朋友的通信。客户端设备可以使亲密度分值或用来生成亲密度分值的历史数据对服务器可用,或服务器可以从第三方(例如,蜂窝网络提供商)检索亲密度分值或用来生成亲密度分值的历史数据。例如,客户端设备或服务器可以联系用户的电子邮件提供商来请求历史数据的最新版本。表I示出了关于特定联系信息项(“BobOHome”)的历史数据、以及用来使用滑动窗口方法和指数衰减频率计数方法两者生成亲密度分值的数据的示例可视化。实际上,表I中所示的数据可以反映较小部分的历史数据,因为用户的历史数据可能引用使用其他联系信息项来发起的过去交互、或与联系人“Bob”一起发生的其他类型的交互。因此,表I中所示的数据可以表示已被过滤来示出使用单个联系信息项发生或仅使用某些类型的交互来发生的过去交互的历史数据版本。表1:使用“滑动窗口”和“衰减亲密度”来生成亲密度分值
权利要求
1.一种系统,包括 一个或多个计算机;以及 耦接到所述一个或多个计算机的计算机可读介质,所述计算机可读介质上存储有指令,所述指令当由所述一个或多个计算机执行时促使所述一个或多个计算机执行操作,所述操作包括 接收音频信号; 对于两个或更多个联系信息项中的每一个,基于用户先前已与和该联系信息项相关联的联系人通信的频率,并且进一步基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性,生成亲密度分值; 对于所述联系信息项中的每一个,基于为该联系信息项生成的亲密度分值推断所述用户意在使用该联系信息项来发起通信的概率; 生成包括与所述联系信息项中的每一个相关联的一个或多个转换的通信发起语法,其中,对于所述联系信息项中的每一个,根据为该联系信息项推断的概率对与该联系信息项相关联的所述一个或多个转换赋予权重; 使用所述通信发起语法来对所述音频信号执行语音识别以选择特定联系信息项;以及 使用所述特定联系信息项来发起所述通信。
2.根据权利要求1所述的系统,其中基于用户先前已与和该联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括 确定所述用户已接受了已拨打了所述联系人的话音拨打语音识别的结果的频率;以及基于所述用户已接受了所述话音拨打语音识别的所述结果的所述频率来递增所述亲密度分值。
3.根据权利要求1所述的系统,其中基于用户先前已与和该联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括 确定所述用户已手动拨打了所述联系人的频率;以及 基于所述用户已手动拨打了所述联系人的所述频率来递增所述亲密度分值。
4.根据权利要求1所述的系统,其中基于用户先前已与和该联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括 确定所述用户已向所述联系人发送了短消息服务(SMS)消息或已从所述联系人接收了SMS消息的频率;以及 基于所述用户已向所述联系人发送了 SMS消息或已从所述联系人接收了 SMS消息的所述频率来递增所述亲密度分值。
5.根据权利要求1所述的系统,其中基于用户先前已与和该联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括 确定所述用户已向所述联系人发送了电子邮件消息或已从所述联系人接收了电子邮件消息的频率;以及 基于所述用户已向所述联系人发送了电子邮件消息或已从所述联系人接收了电子邮件消息的所述频率来递增所述亲密度分值。
6.根据权利要求1所述的系统,其中基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性来生成亲密度分值进一步包括确定所述联系人在预先确定的时段内已被添加到所述用户的地址簿;以及基于确定所述联系人在预先确定的时段内已被添加到所述用户的所述地址簿来递增所述亲密度分值。
7.根据权利要求1所述的系统,其中 所述操作进一步包括 接收引用与所述用户相关联的当前语境的数据; 对于在所述用户和所述联系人之间的两个或更多个过去交互中的每一个,接收引用与该过去交互相关联的语境的数据; 将与所述用户相关联的所述当前语境和与所述过去交互相关联的所述语境进行比较;以及 基于将与所述用户相关联的所述当前语境和与所述过去交互相关联的所述语境进行比较来选择所述两个或更多个过去交互的子集;以及 所述亲密度分值仅使用所述过去交互的所述子集来生成。
8.根据权利要求1所述的系统,其中,对于两个或更多个联系信息项中的每一个,基于用户先前已与和该联系信息项相关联的联系人通信的频率生成亲密度分值进一步包括 基于用户先前使用第一通信信道已与和该联系信息项相关联的联系人通信的频率来生成第一部分亲密度分值; 基于所述用户先前使用第二通信信道已与和该联系信息项相关联的所述联系人通信的频率来生成第二部分亲密度分值; 为所述第一部分亲密度分值和所述第二部分亲密度分值赋予权重;以及将赋予权重的所述第一部分亲密度分值与赋予权重的所述第二部分亲密度分值相组合来生成所述亲密度分值。
9.根据权利要求1所述的系统,其中,对于两个或更多个联系信息项中的每一个,基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性生成亲密度分值进一步包括 将指数衰减函数应用到当发生了在所述用户和与该联系信息项相关联的所述联系人之间的所述一个或多个过去交互时引用的数据。
10.根据权利要求1所述的系统,其中,对于两个或更多个联系信息项中的每一个,基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性生成亲密度分值进一步包括 选择已在预先确定的时段内发生的所述一个或多个过去交互的子集。
11.一种计算机实现的方法,包括 接收音频信号; 对于两个或更多个联系信息项中的每一个,基于用户先前已与和该联系信息项相关联的联系人通信的频率,并且进一步基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性,生成亲密度分值; 对于所述联系信息项中的每一个,基于为该联系信息项生成的所述亲密度分值推断所述用户意在使用该联系信息项来发起通信的概率; 生成包括与所述联系信息项中的每一个相关联的一个或多个转换的通信发起语法,其中,对于所述联系信息项中的每一个,根据为该联系信息项推断的概率为与该联系信息项相关联的所述一个或多个转换赋予权重; 使用所述通信发起语法来对所述音频信号执行语音识别以选择特定联系信息项;以及 使用所述特定联系信息项来发起所述通信。
12.—种编码有计算机程序的计算机存储介质,所述程序包括当由一个或多个计算机执行时促使所述一个或多个计算机执行操作的指令,所述操作包括 接收音频信号; 对于两个或更多个联系信息项中的每一个,基于用户先前已与和该联系信息项相关联的联系人通信的频率,并且进一步基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性,生成亲密度分值; 对于所述联系信息项中的每一个,基于为该联系信息项生成的所述亲密度分值推断所述用户意在使用该联系信息项来发起通信的概率; 生成包括与所述联系信息项中的每一个相关联的一个或多个转换的通信发起语法,其中,对于所述联系信息项中的每一个,根据为该联系信息项推断的概率为与该联系信息项相关联的所述一个或多个转换赋予权重; 使用所述通信发起语法来对所述音频信号执行语音识别以选择特定联系信息项;以及 使用所述特定联系信息项来发起所述通信。
13.根据权利要求12所述的计算机存储介质,其中基于用户先前已与和该联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括 确定所述用户已接受了已拨打了所述联系人的话音拨打语音识别的结果的频率;以及基于所述用户已接受了所述话音拨打语音识别的所述结果的所述频率来递增所述亲密度分值。
14.根据权利要求12所述的计算机存储介质,其中基于用户先前已与和该联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括 确定所述用户已手动拨打了所述联系人的频率;以及 基于所述用户已手动拨打了所述联系人的所述频率来递增所述亲密度分值。
15.根据权利要求12所述的计算机存储介质,其中基于用户先前已与和该联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括 确定所述用户已向所述联系人发送了短消息服务(SMS)消息或已从所述联系人接收了SMS消息的频率;以及 基于所述用户已向所述联系人发送了 SMS消息或已从所述联系人接收了 SMS消息的所述频率来递增所述亲密度分值。
16.根据权利要求12所述的计算机存储介质,其中基于用户先前已与和该联系信息项相关联的联系人通信的频率来生成亲密度分值进一步包括 确定所述用户已向所述联系人发送了电子邮件消息或已从所述联系人接收了电子邮件消息的频率;以及 基于所述用户已向所述联系人发送了电子邮件消息或已从所述联系人接收了电子邮件消息的所述频率来递增所述亲密度分值。
17.根据权利要求12所述的计算机存储介质,其中基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性来生成亲密度分值进一步包括 确定所述联系人在预先确定的时段内已被添加到所述用户的地址簿;以及基于确定所述联系人在预先确定的时段内已被添加到所述用户的所述地址簿来递增所述亲密度分值。
18.根据权利要求12所述的计算机存储介质,其中 所述操作进一步包括 接收引用与所述用户相关联的当前语境的数据; 对于在所述用户和所述联系人之间的两个或更多个过去交互中的每一个,接收引用与该过去交互相关联的语境的数据; 将与所述用户相关联的所述当前语境和与所述过去交互相关联的所述语境进行比较;以及 基于将与所述用户相关联的所述当前语境和与所述过去交互相关联的所述语境进行比较来选择所述两个或更多个过去交互的子集;以及 所述亲密度分值仅使用所述过去交互的所述子集来生成。
19.根据权利要求12所述的计算机存储介质,其中,对于两个或更多个联系信息项中的每一个,基于用户先前已与和该联系信息项相关联的联系人通信的频率生成亲密度分值进一步包括 基于用户先前使用第一通信信道已与和该联系信息项相关联的联系人通信的频率来生成第一部分亲密度分值; 基于所述用户先前使用第二通信信道已与和该联系信息项相关联的所述联系人通信的频率来生成第二部分亲密度分值; 为所述第一部分亲密度分值和所述第二部分亲密度分值赋予权重;以及将赋予权重的所述第一部分亲密度分值与赋予权重的所述第二部分亲密度分值相组合来生成所述亲密度分值。
20.根据权利要求12所述的计算机存储介质,其中,对于两个或更多个联系信息项中的每一个,基于在所述用户和与该联系信息项相关联的所述联系人之间的一个或多个过去交互的新近性生成亲密度分值进一步包括 将指数衰减函数应用到当发生了在所述用户和与该联系信息项相关联的所述联系人之间的所述一个或多个过去交互时引用的数据。
全文摘要
用于对联系信息进行消歧的方法、系统和装置,包括编码在计算机存储介质上的计算机程序。方法包括接收音频信号;基于用户先前已与和联系信息项相关联的联系人通信的频率,并且进一步基于在用户和与联系信息项相关联的联系人之间的一个或多个过去交互的新近性,生成亲密度分值;基于为联系信息项生成的亲密度分值来推断用户意在使用联系信息项来发起通信的概率;以及生成通信发起语法。基本思想通过在执行话音识别过程时考虑带有呼叫接收者或呼叫目的地的呼叫历史的话音识别来发起呼叫的改进的方法。
文档编号H04M1/27GK103039064SQ201180024739
公开日2013年4月10日 申请日期2011年5月18日 优先权日2010年5月19日
发明者马修·I·劳埃德, 维拉德·范·图亚尔·鲁施二世 申请人:谷歌公司