交通工具远程信息处理单元及其操作方法

文档序号:7811988阅读:250来源:国知局
交通工具远程信息处理单元及其操作方法
【专利摘要】提供了交通工具远程信息处理单元及其操作方法。在一个实施例中,一种方法包括:存储从远程信息处理服务用户提供的应用访问码;从交通工具向应用发起呼叫;以及在呼叫期间接收来自所述应用的对访问码的请求。此外,所述方法包括:使用交通工具处的语音识别功能确定所述应用已请求了所述访问码;以及基于语音识别功能的确定向所述应用发送所存储的访问码。
【专利说明】交通工具远程信息处理单元及其操作方法

【技术领域】
[0001]本【技术领域】主要涉及交通工具,并且更特别地涉及操作交通工具远程信息处理单元的方法。

【背景技术】
[0002]交通工具制造商为它们的交通工具配备越来越多的无线通信能力。安装在现代交通工具中的远程信息处理单元被构造成在交通工具与各种接受者比如中心设施或外部呼叫者之间无线地传送语音和数据通信。例如,交通工具远程信息处理单元可以在交通工具处发起和接收电话呼叫。这些呼叫可以通过以下方式发起:使用由交通工具乘员提供的口头命令;或者通过由交通工具承载并由交通工具乘员操控的物理致动输入装置。
[0003]访问和使用由远程信息处理单元提供的各种特征可以取决于提供用户辨识信息,比如用户特定访问码或特定通行码。对于交通工具乘员,提供该信息可能具有挑战性。例如,用户可能需要使用物理键盘输入通行码,而同时尝试操作交通工具。
[0004]因此,希望提供一种改善的交通工具远程信息处理单元以及操作它的方法。另夕卜,希望提供供其使用的方法,其允许用户轻松而安全地访问远程信息处理单元的系统和特征。此外,从后续详细描述和所附权利要求书,结合附图和前述【技术领域】和【背景技术】来理解,本发明的其它所需特征和特性将变得清楚明了。


【发明内容】

[0005]提供了一种关联于交通工具远程信息处理单元的系统。在一个实施例中,所述系统包括:访问码数据库,其被构造成存储从远程信息处理服务用户提供的应用访问码;远程信息处理单元,其被构造成从交通工具向应用发起呼叫;和互动管理器,其被构造成在呼叫期间接收来自所述应用的对访问码的请求。此外,所述系统还包括:语音识别模块,其被构造成确定所述应用已请求了所述访问码;以及电子通信系统,其被构造成基于所述语音识别功能的确定向所述应用发送所存储的访问码。
[0006]提供了一种用于操作交通工具远程信息处理单元的方法。在一个实施例中,所述方法包括:存储从远程信息处理服务用户提供的应用访问码;从交通工具向应用发起呼叫;以及在呼叫期间接收来自所述应用的对访问码的请求。此外,所述方法包括:使用交通工具处的语音识别功能确定所述应用已请求了所述访问码;以及基于语音识别功能的确定向所述应用发送所存储的访问码。
[0007]本公开还提供以下技术方案:
1.一种方法,包括:
存储从远程信息处理服务的用户提供的应用访问码;
使用所述远程信息处理服务来发起呼叫,并在呼叫期间利用用户语音输入签名来访问用户数据,以检验所述用户;
在所述呼叫期间接收来自所述应用的对所述访问码的请求; 使用关联于交通工具的语音识别功能来确定所述应用已请求了所述访问码;以及基于所述语音识别功能的确定来向所述应用发送所存储的应用访问码。
[0008]2.如技术方案I所述的方法,其中,存储应用访问码包括存储用于语音邮件应用的应用访问码。
[0009]3.如技术方案I所述的方法,其中,存储应用访问码包括存储用于电子日历应用的应用访问码。
[0010]4.如技术方案I所述的方法,其中,存储应用访问码包括存储用于银行应用的应用访问码。
[0011]5.如技术方案I所述的方法,其中,向所述应用发送所存储的访问码包括发送呈DTMF格式的所存储的访问码。
[0012]6.如技术方案I所述的方法,进一步包括:从交通工具向应用发起呼叫,其中从交通工具向应用发起呼叫基于接收自交通工具乘员的口头命令。
[0013]7.如技术方案6所述的方法,其中,从交通工具向应用发起呼叫基于预限定的时序安排。
[0014]8.一种系统,包括:
访问码数据库,其被构造成存储从远程信息处理服务用户提供的应用访问码;
远程信息处理单元,其被构造成从交通工具向应用发起呼叫;
互动管理器,其被构造成在呼叫期间接收来自所述应用的对访问码的请求;
语音识别模块,其被构造成确定所述应用已请求了所述访问码;以及电子通信系统,其被构造成基于所述语音识别功能的确定向所述应用发送所存储的访问码。
[0015]9.如技术方案8所述的系统,其中,所述应用访问码包括用于语音邮件应用的访问码。
[0016]10.如技术方案8所述的系统,其中,所述应用访问码包括用于电子日历应用的访问码。
[0017]11.如技术方案8所述的系统,其中,所述应用访问码包括用于银行应用的访问码。
[0018]12.如技术方案8所述的系统,其中,所存储的访问码以DTMF格式发送。
[0019]13.如技术方案8所述的系统,其中,从交通工具向应用发起呼叫基于接收自交通工具乘员的口头命令。
[0020]14.如技术方案8所述的系统,其中,从交通工具向应用发起呼叫基于预限定的时序安排。
[0021]15.一种交通工具,包括:
远程信息处理单元,其与密码管理系统处于可操作的电子通信,所述密码管理系统包括:
访问码数据库,其被构造成存储从远程信息处理服务用户提供的应用访问码,所述远程信息处理单元被构造成从交通工具向应用发起呼叫;
互动管理器,其被构造成在呼叫期间接收来自所述应用的对访问码的请求;
语音识别模块,其被构造成确定所述应用已请求了所述访问码;以及电子通信系统,其被构造成基于所述语音识别功能的确定向所述应用发送所存储的访问码。
[0022]16.如技术方案15所述的交通工具,其中,所述应用访问码包括用于语音邮件应用或电子日历应用的访问码。
[0023]17.如技术方案15所述的交通工具,其中,所述远程信息处理单元辨识说话者,以防止对机密信息的未授权访问。
[0024]18.如技术方案15所述的交通工具,其中,所述应用访问码包括用于银行应用的访问码。
[0025]19.如技术方案15所述的交通工具,其中,所存储的访问码以DTMF格式发送。
[0026]20.如技术方案15所述的交通工具,其中,从交通工具向应用发起呼叫基于接收自交通工具乘员的口头命令或者基于预限定的时序安排。

【专利附图】

【附图说明】
[0027]下面将结合以下附图来描述示例性实施例,附图中相似附图标记表示相似构成元素,并且附图中:
图1是依据一示例性实施例的能够采用本文所公开的方法的通信系统的框图;
图2是依据一示例性实施例的用于ASR系统的示例性结构的框图;
图3是依据一示例性实施例的被提供为关联于ASR系统和通信系统的密码管理系统的示例性结构的框图;
图4-7示出了依据示例性实施例的用于操作密码管理系统的方法。

【具体实施方式】
[0028]以下详细描述本质上仅仅是示例性的,并不旨在限制应用和用途。此外,没有意图被在前面的【技术领域】、【背景技术】、
【发明内容】
或以下详细描述中给出的任何明示或暗示的理论限制。
[0029]参考图1,其中示出了一种示例性操作环境,其包括移动交通工具通信系统10,并且其可以用于实施本文所公开的方法。通信系统10通常包括交通工具12、一个或多个无线载波系统14、陆地通信网络16、计算机18和呼叫中心20。应该明白的是:所公开的方法可以用于任何数量的不同系统,并且并不特别受限于这里示出的操作环境。此外,系统10及其个体部件的结构、构造、设置和操作是本领域中众所周知的。因此,以下段落简单地对一个这种示例性系统10提供简要概述;然而,这里未示出的其它系统也可以采用所公开的方法。
[0030]交通工具12在所示实施例中被示为小客车,但是应该理解的是:也可以使用任何其它交通工具,包括摩托车、卡车、运动型多功能车(SUV)、休闲车(RV)、海洋船舶、航空器等。一部分交通工具电子装置28在图1中大体示出,并且包括远程信息处理单元30、麦克风32、一个或多个按钮或其它控制输入装置34、音频系统36、视觉显示器38、和GPS模块40以及多个交通工具系统模块(VSM) 42。一部分这些装置可以直接连接至远程信息处理单元,比如麦克风32和按钮34,而另一些使用一个或多个网络连接比如通信总线44或娱乐总线46间接地连接。适当网络连接的示例包括但不限于:控制器区域网络(CAN)、媒体导向系统传输(MOST)、局部互连网络(LIN)、局部区域网络(LAN)、和其它适当的连接,比如以太网或符合公知的ISO、SAE和IEEE标准和规格的其它连接,这仅是举几个例子而已。
[0031]远程信息处理单元30可以是OEM安装(嵌入)的或售后装配的装置,其允许通过无线载波系统14以及经由无线网络的无线语音和/或数据通信,使得交通工具12可以与呼叫中心20、其它能够进行远程信息处理的交通工具、或一些其它实体或装置通信。在一个示例中,远程信息处理单元30使用无线电传输来以无线载波系统14建立通信信道(语音信道和/或数据信道),使得语音和/或数据传输可以通过信道被发送和接收。通过提供语音和数据通信,远程信息处理单元30允许交通工具12提供多种不同服务,包括涉及导航、电话通讯、紧急援助、诊断、资讯娱乐等的那些服务。数据可以使用本领域中公知的技术经由数据连接,比如经由通过数据信道的分组数据传输,或者经由语音信道得到发送。对于涉及语音通信(例如,与呼叫中心20的真人顾问或语音响应单元)和数据通信(例如,用以向呼叫中心20提供GPS位置数据或交通工具诊断数据)的组合服务,单元30可以采用通过语音信道的单次呼叫,并根据需要通过语音信道在语音与数据传输之间切换,并且这可以使用本领域技术人员公知的技术来完成。
[0032]根据一个实施例,远程信息处理单元30采用根据GSM或CDMA标准的蜂窝通信,从而包括用于类似免提呼叫的语音通信的标准蜂窝芯片组50、用于数据传输的无线调制解调器、电子处理装置52、一个或多个数字存储装置54和双天线56。应该理解的是:调制解调器可以通过存储在远程信息处理单元中并被处理器52执行的软件来实施,或者它可以是位于远程信息处理单元30之内或之外的单独的硬件部件。调制解调器可以使用任何数量的不同标准或协议来操作,比如EVDO、CDMA、GPRS和EDGE。交通工具12与其它网络装置之间的无线组网也可以使用远程信息处理单元30来实施。为此目的,远程信息处理单元30可以被构造成根据一个或多个无线协议无线地通信,包括但不限于IEEE 802.11协议、WiMAX或蓝牙中的任一个。当用于分组交换数据通信比如TCP/IP时,远程信息处理单元30可以配置有静态IP地址,或者可以被设置用以自动地接收来自网络上的另一装置比如路由器或来自网络地址服务器的所分配IP地址。
[0033]处理器52可以是能够处理电子指令的任何类型的装置,包括微处理器、微控制器、主机处理器、控制器、交通工具通信处理器、和专用集成电路(ASIC)。它可以是只用于远程信息处理单元30的专用处理器,或者可以与其它交通工具系统共享。处理器52执行各种类型的数字地存储的指令,比如存储在存储器54中的软件或固件程序,其允许远程信息处理单元30提供各种各样的服务。例如,处理器52可以执行程序或处理数据,以实施本文所论述方法的至少一部分。
[0034]远程信息处理单元30可以用于提供不同范围的交通工具服务,其涉及去往和/或来自交通工具的无线通信。这些服务包括:逐向引导和其它导航相关服务,其被提供与基于GPS的交通工具导航模块40结合;气囊展开通知和其它紧急或路边援助相关服务,其被提供关联于一个或多个碰撞传感器接口模块比如本体控制模块(未示出);使用一个或多个诊断模块的诊断报告;和资讯娱乐相关服务,其中音乐、网页、电影、电视节目、视频游戏和/或其它信息被资讯娱乐模块(未示出)下载并被存储用于当前或以后回放。以上列举的服务绝不是远程信息处理单元30的所有能力的穷举列表,而是简单地列举远程信息处理单元30能够提供的一部分服务。此外,应该明白的是:至少一部分前述模块可以被实施为保存在远程信息处理单元30之内或之外的软件指令的形式,它们可以是位于远程信息处理单元30之内或之外的硬件部件,或者它们可以彼此或与遍布交通工具12的其它系统集成和/或共享,这只是列出少数可能性。在模块被实施为位于远程信息处理单元30之外的VSM 42的情况下,它们可以采用交通工具总线44来与远程信息处理单元30交换数据和命令。
[0035]GPS模块40接收来自GPS卫星的星座60的无线电信号。从这些信号,模块40可以确定交通工具位置,其被用于向交通工具驾驶员提供导航和其它位置相关服务。导航信息可以呈现在显示器38 (或交通工具12内的其它显示器)上,或者可以用声音呈现,比如像提供逐向导航时那样。导航服务可以使用专用机载导航模块(其可以是GPS模块40的一部分)来提供,或者一部分或全部导航服务可以经由远程信息处理单元30来完成,其中位置信息被发送至远程位置,以便为交通工具12提供导航地图、地图注释(兴趣点、餐厅等)、路线计算等。位置信息可以被供给至呼叫中心20或其它远程计算机系统,比如计算机18,以达到其它目的,比如车队管理。此外,可以经由远程信息处理单元30从呼叫中心20将新的或更新的地图数据下载到GPS模块40。
[0036]除音频系统36和GPS模块40外,交通工具12可以包括呈电子硬件部件形式的其它交通工具系统模块(VSM) 42,其遍布交通工具12,并且通常接收来自一个或多个传感器的输入,并使用传感到的输入来执行诊断、监测、控制、报告和/或其它功能。在一个示例中,VSM 42中的每个通过通信总线44连接至其它VSM,以及至远程信息处理单元30,并且可以被编程以运行交通工具系统和子系统诊断测试。作为示例,一个VSM 42可以是发动机控制模块(ECM),其控制发动机操作的各个方面,比如燃料点火和点火正时,另一 VSM 42可以是动力总成控制模块,其调节交通工具动力总成的一个或多个部件的操作,并且另一 VSM42可以是本体控制模块,其控制遍布交通工具12的各个电气部件,如交通工具的电动门锁和前灯。根据一个实施例,发动机控制模块配备有机载诊断(OBD)特征,其提供无数的实时数据,比如接收自包括交通工具排放传感器的各种传感器的数据,并且提供标准系列的诊断故障代码(DTC),其允许技术人员快速地识别并矫正交通工具内的故障。如本领域技术人员所理解的,以上提及的VSM只是可以用于交通工具12的一部分模块的示例,因为众多其它模块也是可能的。
[0037]交通工具电子装置28还包括多个交通工具用户界面,其为交通工具乘员提供用于提供和/或接收信息的装置,包括麦克风32、按钮34、音频系统36、触觉装置、和视觉显示器38。如本文中所使用的,术语“交通工具用户界面”广义地包括任何适当形式的电子装置,包括硬件和软件部件,其位于交通工具12上,并允许交通工具用户与或通过交通工具12的部件通信。麦克风32向远程信息处理单元提供音频输入,以允许驾驶员或其它乘员提供语音命令并经由无线载波系统14实施免提呼叫。为此目的,它可以连接至采用本领域中公知的人机界面(HMI)技术的机载自动语音处理单元。按钮34允许输入远程信息处理单元30中的人工用户输入,以发起无线电话呼叫并提供其它数据、响应或控制输入。单独的按钮可以用于向呼叫中心20发起紧急呼叫与正常服务援助呼叫。音频系统36向交通工具乘员提供音频输出,并且可以是主交通工具音频系统的专用独立系统或部分。根据这里示出的示例性实施例,音频系统36被操作地联接至交通工具总线44和娱乐总线46两者,并且可以提供AM、FM和卫星广播、CD、DVD和其它多媒体功能。该功能可以被提供联合于或独立于以上描述的资讯娱乐模块。在一个示例中,视觉显示器38是图形显示器,比如仪表板上的触摸屏或由风挡反射的抬头显示器(heads-up display),并且可以用于提供多种输入和输出功能。也可以采用各种其它交通工具用户界面,因为图1的界面只是一个特定实施方式的示例。
[0038]在一个示例中,无线载波系统14是蜂窝电话系统,其包括多个信号塔70 (只有一个被示出)、一个或多个移动交换中心(MSC) 72、以及用以连接无线载波系统14与陆地网络16所需的任何其它组网部件。每个信号塔70包括发送和接收天线以及基站,且来自不同信号塔的基站直接地或经由中间设备比如基站控制器连接至MSC 72。蜂窝系统14可以实施任何适当的通信技术,包括例如:模拟技术,比如AMPS ;或较新的数字技术,比如CDMA (例如,CDMA2000)或GSM/GPRS。如本领域的技术人员将理解的,各种信号塔/基站/MSC机构都是可能的,并且可以用于无线系统14。例如,基站和信号塔可以共同定位在相同地点处,或者它们可以彼此远程地定位,每个基站可以负责单个信号塔,或者单个基站可以服务各个信号塔,并且各个基站可以联接至单个MSC,这仅是举出几种可能配置。
[0039]除使用无线载波系统14外,还可以使用呈卫星通信形式的不同无线载波系统来提供与交通工具12的单向或双向通信。这可以使用一个或多个通信卫星62和上行链路发射站64来完成。单向通信可以是例如卫星广播服务,其中节目内容(新闻、音乐等)被发射站64接收、打包用于上传、然后发送至卫星62,其向订购者广播节目。双向通信可以是例如卫星电话通讯服务,其使用卫星62来在交通工具12与站64之间中继电话通信。如果使用的话,该卫星电话通讯可以被采用来追加于或代替无线载波系统14。
[0040]陆地网络16可以是常规陆基电信网络,其连接至一个或多个陆上线路电话,并将无线载波系统14连接至呼叫中心20。例如,陆地网络16可以包括公用交换电话网络(PSTN),比如用于提供硬连线电话通讯、分组交换数据通信和因特网基础设施的公用交换电话网络(PSTN)。陆地网络16的一个或多个节段可以通过使用以下网络来实施:标准有线网络、光纤或其它光学网络、电缆网络、电力线、其它无线网络比如无线局部区域网络(WLAN)、或提供宽带无线接入(BWA)的网络、或其任意组合。此外,呼叫中心20不必经由陆地网络16连接,而是可以包括无线电话通讯设备,使得它可以直接与无线网络比如无线载波系统14通信。
[0041]计算机18可以是可经由私有或公用网络比如因特网访问的多个计算机之一。每个这种计算机18可以用于一个或多个目的,比如可由交通工具12经由远程信息处理单元30和无线载波14访问的网络服务器。其它这种可访问的计算机18可以是例如:服务中心计算机,在这里可以从交通工具12经由远程信息处理单元30上传诊断信息和其它交通工具数据;客户端计算机,由交通工具所有者或其它订购者使用,以达到比如访问或接收交通工具数据或者设置或配置订购者偏好或者控制交通工具功能等目的;或第三方信息库,对其或从其提供交通工具数据或其它信息,方法是通过与交通工具12或呼叫中心20或两者通信。计算机18还可以用于提供因特网连接,比如DNS服务或者网络地址服务器,其使用DHCP或其它适当的协议来向交通工具12分配IP地址。
[0042]呼叫中心20被设计成为交通工具电子装置28提供多种不同的系统后端功能,并且根据这里示出的示例性实施例,通常包括一个或多个交换机80、服务器82、数据库84、真人顾问86以及自动语音响应系统(VRS) 88,它们均是本领域中公知的。这些各个呼叫中心部件通常经由有线或无线局部区域网络90彼此联接。交换机80,其可以是专用交换分机(PBX)交换机,将传来的信号传递成使得语音传输通常通过正常电话发送至真人顾问86,或使用因特网语音协议(VoIP)发送至自动语音响应系统88。真人顾问电话也可以使用VoIP,如图1中的虚线所指示的。VoIP和通过交换机80的其它数据通信是经由连接在交换机80与网络90之间的调制解调器(未示出)实施的。数据传输经由调制解调器传至服务器82和/或数据库84。数据库84可以存储账户信息,比如订购者验证信息、交通工具识别码、个人资料记录、行为模式、和其它相关的订购者信息。数据传输也可以通过无线系统进行,比如802.1lx, GPRS等。尽管所示实施例已经被描述为它将与使用真人顾问86的有人呼叫中心20联合使用,但应理解的是:呼叫中心可以代之采用VRS 88作为自动顾问、或者可以使用VRS 88和真人顾问86的组合。
[0043]现在转到图2,其中示出了一种用于自动语音识别或ASR系统210的示例性结构,其可以用于实现本文所公开的方法。一般而言,交通工具乘员用声音与ASR系统互动以达到以下基本目的中的一个或多个:训练系统以理解交通工具乘员的特定语音;存储离散的语音,比如语音身份标签或语音控制词语,如数字或关键词;或者识别交通工具乘员的语音,其用于任何适当的目的,比如语音拨号、菜单导航、记录(transcript1n)、服务请求、交通工具装置或装置功能控制、或类似目的。一般来说,ASR从人类语音提取声学数据,比较和对比声学数据与存储的子词数据,选择可以与其它所选子词连结的适当子词,并输出所连结的子词或词语来用于后期处理,比如听写或记录、地址簿拨号、存储到存储器、训练ASR模型或调整参数等。
[0044]ASR系统一般是本领域技术人员公知的,并且图2仅示出了一个特定的示例性ASR系统210。系统210包括:用以接收语音的装置,比如远程信息处理麦克风32 ;和声学接口33,比如远程信息处理单元30的声卡,其具有模拟数字转换器,用以将语音数字化为声学数据。系统210还包括:存储器,比如远程信息处理存储器54,用于存储声学数据并存储语音识别软件和数据库;和处理器,比如电子处理装置52,用以处理声学数据。处理器与存储器一起并且联合以下模块发挥功能:一个或多个前端处理器或预处理器软件模块212,用于将语音的声学数据流解析为参数表达,比如声学特征;一个或多个解码器软件模块214,用于解码声学特征,以得到与输入的语音话语相对应的数码子词或词语输出数据;和一个或多个后处理器软件模块216,用于使用来自解码器模块214的输出数据,其用于任何适当的目的。
[0045]系统210还可以接收来自任何其它适当音频源31的语音,其可以如实线所示那样直接与预处理器软件模块212通信,或者经由声学接口 33间接地与之通信。音频源31例如可以包括比如语音邮件系统等电话音频源、或任何类型的其它电话服务。
[0046]—个或多个模块或模型可以被用作对解码器模块214的输入。首先,语法和/或词素模型218可以提供规则,其控制哪些词语可以在逻辑上跟随其它词语以形成有效的句子。广义地说,语法可以限定出系统210以任何给定ASR模式在任何给定时间预期的词汇体系。例如,如果系统210处于用于训练命令的训练模式,则语法模型218可以包括由系统210已知并使用的所有命令。在另一示例中,如果系统210处于主菜单模式,则有效语法模型218可以包括由系统210预期的所有主菜单命令,比如呼叫、拨号、退出、删除、目录等。其次,声学模型220有助于选择最有可能与来自预处理器模块212的输入相对应的子词或词语。第三,词语模型222和句子/语言模型224在将所选子词或词语置入词语或句子背景中时提供规则、句法、和/或语义。此外,句子/语言模型224可以限定出系统210以任何给定ASR模式在任何给定时间预期的句子体系,和/或可以提供规则等,其控制哪些句子可以在逻辑上跟随其它句子以形成有效的扩展的言语。在这些示例的每个中,相关模型可以被训练为学习由一个或多个自动电话服务员(ATA)形成的语音。例如,由ATA使用的语音的识别性可能不会变化太多,命令的数量也不会。作为结果,语法或词素模型218可以被快速地且容易地准备,以识别由ATA使用的有限数量的已知和已识别的语音以及ATA经常使用的可能词语和/或命令之一。作为一个示例,ATA可以要求呼叫者“请输入您的会议呼叫访问码”。ASR系统210可以被训练为搜索这些词语/短语中的每个和/或有可能说出它们的语音。
[0047]根据一替代示例性实施例,ASR系统210的一部分或全部可以驻留在处于远离交通工具12的位置比如呼叫中心20中的计算设备上,并且使用所述计算设备得到处理。例如,语法模型、声学模型等可以被存储在呼叫中心20中的服务器82和/或数据库84之一的存储器中,并且被传送至交通工具远程信息处理单元30,以进行交通工具内的语音处理。类似地,语音识别软件可以使用呼叫中心20中的服务器82之一的处理器得到处理。换言之,ASR系统210可以驻留在远程信息处理单元30中,或者以任何所需方式分布遍及呼叫中心20和交通工具12。
[0048]首先,声学数据提取自人类语音,其中交通工具乘员向麦克风32中说话,所述麦克风32将话语转换成电信号并将这些信号传送至声学接口 33。麦克风32中的声音响应元件将乘员的语音话语捕捉为空气压力的变化,并将话语转换为模拟电信号比如直流电流或电压的相应变化。声学接口 33接收模拟电信号,其首先被采样以便在离散的时刻捕捉模拟信号的值,然后被量化使得模拟信号的振幅在每个采样时刻被转换为连续的数字语音数据流。换言之,声学接口 33将模拟电信号转换为数字电子信号。数字数据是二进制位元,其被缓存在远程信息处理存储器54中,然后被远程信息处理器52处理,或者可以在它们最初被处理器52实时接收到时受到处理。
[0049]其次,预处理器模块212将连续的数字语音数据流变换为离散序列的声学参数。更具体地,处理器52执行预处理器模块212,以将数字语音数据切分成重叠的语音或声学中贞(acoustic frame),其具有例如10_30毫秒(ms)的持续时间。这些巾贞对应于声学子词,比如音节、半音节、音子(phone)、双音子(diphone)、音素(phoneme)等。预处理器模块212还执行语音分析,以从每个帧内提取来自从乘员的语音的声学参数,比如随时间变化的特征向量。乘员的语音内的话语可以表示为这些特征向量的序列。例如,并且如本领域技术人员公知的,特征向量可以被提取,并且可以包括例如声音音调、能量分布图、频谱属性、和/或倒谱系数,其可以通过以下方式获得:对这些帧执行傅里叶变换,并使用余弦变换和倒谱使声谱解除关联。声学帧和覆盖语音的特定持续时间的相应参数被连结到待解码的语音的未知测试模式中。
[0050]第三,处理器执行解码器模块214,以处理每个测试模式的传来的特征向量。解码器模块214也称为识别引擎或分类器,并使用语音的被存储的已知基准模式。类似测试模式,基准模式被定义为相关声学帧与相应参数的连结。解码器模块214比较和对比待识别的子词测试模式与所存储的子词基准模式的声学特征向量,评估其间的差异或相似性的大小,并最终使用判定逻辑来选择最佳匹配子词作为识别子词。一般而言,最佳匹配子词是这样的子词,其对应于所存储的已知基准模式,其与如由本领域技术人员公知的用以分析和识别子词的各种技术中的任一种确定的测试模式具有最小的差异或者最有可能是该测试模式。这类技术可以包括动态时间规整分类器、人工智能技术、神经网络、自由音素识别器、和/或概率模式匹配器,比如隐马尔可夫模型(HMM)引擎。
[0051]HMM引擎是本领域技术人员公知的,其用于形成声学输入的多个语音识别模型假设。所述假设在最终识别并选择识别输出时被考虑,所述识别输出代表经由语音的特征分析的声学输入的最有可能的正确解码。更具体地,HMM引擎生成呈子词模型假设的“N-best”列表形式的统计模型,所述子词模型假设根据HMM算出的置信度值或声学数据的观测序列的概率来排序,比如通过应用贝叶斯定理来给出一个或另一个子词。
[0052]贝叶斯定理的HMM程序对于给定观测序列的声学特征向量识别与最有可能的话语或子词序列相对应的最佳假设,并且其置信度值可以取决于各种因素,包括关联于传来的声学数据的声学信噪比。HMM还可以包括被称为对角线高斯混合的统计分布,其对于每个子词的每个观测特征向量得到可能得分,所述得分可以用于对假设的N-best列表重新排序。HMM引擎还可以识别并选择这样的子词,其模型可能得分是最高的。
[0053]相似地,用于子词序列的各个HMM可以被连结,以建立单个或多个词语HMM。然后,可以生成并进一步评估单个或多个词语基准模式的N-best列表和相关参数值。
[0054]在一个示例中,语音识别解码器214使用适当的声学模型、语法和算法来处理特征向量,以生成基准模式的N-best列表。如本文中所使用的,术语“基准模式”可与以下基准互换:模型、波形、模板、富信号模型、样本、假设或其它类型的基准。基准模式可以包括表示一个或多个词语或子词的一系列特征向量,并且可以基于特定说话者、说话风格和听觉环境条件。本领域的技术人员将意识到:基准模式可以由ASR系统210的适当基准模式训练来生成,并被存储在存储器中。本领域的技术人员还将意识到:所存储的基准模式可以被操控,其中基准模式的参数值基于基准模式训练与ASR系统210的实际使用之间的语音输入信号的差异而被调整。例如,基于来自不同交通工具乘员或不同声学条件的有限量的训练数据,对于一个交通工具乘员或某些声学条件训练的一组基准模式可以被调整和保存为用于不同交通工具乘员或不同声学条件的另一组基准模式。换言之,基准模式并不一定是固定的,而是可以在语音识别期间被调节。
[0055]使用词表内语法和任何适当的解码器算法和声学模型,处理器从存储器访问解释测试模式的数个基准模式。例如,处理器可以生成N-best词汇结果或基准模式的以及相应参数值的列表,并将之存储至存储器。示例性参数值可以包括词汇及相关节段持续时间的N-best列表中的每个基准模式的置信度得分、可能得分、信噪比(SNR)值和/或类似参数。可以通过使参数值的大小降序来对词汇的N-best列表排序。例如,具有最高置信度得分的词汇基准模式是第一最佳基准模式,以此类推。一旦建立了一串已识别子词后,它们可以被用于通过来自词语模型222的输入来构造词语,并且通过来自语言模型224的输入来构造句子。
[0056]最后,后处理器软件模块216接收来自解码器模块214的输出数据,其用于任何适当的目的。在一个示例中,后处理器软件模块216可以将来自单个或多个词语基准模式的N-best列表的基准模式之一辨识或选择为识别语音。在另一示例中,后处理器模块216可以用于将声学数据转换成文字或数字,以用于ASR系统210或其它交通工具系统的其它方面。在再一示例中,后处理器模块216可以用于将训练反馈提供至解码器214或预处理器212。更具体地,后处理器216可以用于训练用于解码器模块214的声学模型,或者用于训练用于预处理器模块212的调整参数。
[0057]现在转到图3,其中示出了一种用于密码管理系统300的示例性结构,其可以用于实现本文所公开的方法。类似ASR系统210,密码管理系统300的一部分或全部可以驻留在交通工具电子装置28比如远程信息处理单元30上并使用它得到处理;替代地,密码管理系统300的一部分或全部可以驻留在处于远离交通工具12的位置比如呼叫中心20中的计算设备上并使用它得到处理。如此一来,密码管理系统300的各个模块,如以下将更详细地描述的,被设计成与ASR系统210和通信系统10的系统和模块协同地工作。
[0058]密码管理系统300包括说话者辨识模块310、互动管理器320、语音检测模块330、时序安排器模块340和密码数据库350。说话者辨识模块310可以被实施为关联于ASR系统210,并且如本文中所使用的,术语“说话者辨识”是指ASR系统210找出是“谁”在说话,而不是他们在说什么。在说话者辨识模块310中,识别说话者可简化在已经对特定人员的声音受过训练的系统中转换语音的任务,或者它可用于验证或检验说话者的身份,作为安全程序的一部分。存在说话者辨识技术和操作方法的两个主要应用。如果说话者声称为某一身份并且语音用于检验该声称,则这被称为检验或验证。另一方面,辨识是确定未知说话者的身份的任务。在某种意义上,说话者检验为1:1匹配,其中一个说话者的语音匹配于一个模板(也被称为“语音印迹”或“语音模型”),而说话者辨识为1:N匹配,其中语音与N个模板进行比较。每个说话者识别系统具有两个阶段:注册和检验。注册期间,说话者的语音被记录,并且通常多个特征被提取,以形成语音印迹、模板或模型。在检验阶段,语音样本或“话语”与以前生成的语音印迹进行比较。对于辨识系统,话语与多个语音印迹进行比较,以便确定最佳匹配,而检验系统比较话语与单个语音印迹。由于所涉及的程序,检验快于辨识。应进一步指出的是:说话者识别系统可以用于防止对用户个人信息的未授权访问,方法是确保只有特定说话者能通过远程信息处理单元30访问这个说话者的个人信息。
[0059]在再一些实施例中,用户能够定义说话者辨识的程度。例如,基于系统300的用户配置,各个说话者可以与之关联有不同的辨识程度。该功能允许系统300根据特定说话者即根据系统300的特定用户,应用不同程度的说话者辨识。
[0060]互动管理器320被进一步提供关联于ASR系统210和通信系统10。如本文中所使用的“互动”被定义为用户与密码系统300之间的完全交流。互动管理器320管理多个语音应用与用户之间的互动,使得(a)用户明确用户是在向哪个应用说话,以及(b)应用明确哪个应用是激活的。如本文中所使用的,术语“应用(applicat1n) ”可以指任何电子应用,其通过远程信息处理单元30是可访问的并且需要密码或其它通行码来访问它,包括但不限于:语音邮件、电子邮件、电话会议服务、Microsoft Outlook?日历服务、银行服务、礼宾服务、和如本领域的技术人员将想到的其它应用。当应用希望采用ASR系统210时,所述应用向互动管理器320提交互动。提交的互动被置于包含待由ASR系统210处理的互动的互动列表的末尾处。在一个实施方式中,该指示由以下方式进行:通过应用指定特定语法来用于配置为应被立即处理的互动。互动管理器320保持应用知晓属于所述应用的互动的状态。例如,互动管理器320向应用发送消息,比如互动激活消息。互动管理器320掌握由ASR系统210处理的互动,使得ASR系统210 —次只处理一个互动。这样,这些互动以依次方式被处理,其允许多个应用同时在ASR系统210上运行,即使所述多个应用各自使用不同的语法。作为结果,交通工具乘员可更好地与每个应用沟通。
[0061]语音检测模块330被进一步提供关联于ASR系统210和通信系统10。如最初在上方指出的,语音检测模块330可以被实施为ASR系统以达到以下基本目的中的一个或多个:训练系统以理解交通工具乘员的特定语音;存储离散的语音,比如语音身份标签或语音控制词语,如数字或关键词;或者识别交通工具乘员的语音,其用于任何适当的目的,比如语音拨号、菜单导航、记录、服务请求、交通工具装置或装置功能控制;倾听接收自服务的音频并检测来自服务的一组已知句子(例如“请输入您的个人身份号码”或“请输入您的会议号码”);或类似目的。一般来说,语音检测模块330从人类或服务语音提取声学数据,比较和对比声学数据与存储的子词数据,选择可以与其它所选子词连结的适当子词,并输出所连结的子词或词语来用于后期处理,比如听写或记录、地址簿拨号、存储到存储器、训练ASR模型或调整参数等。
[0062]时序安排器模块340被进一步提供关联于ASR系统210和通信系统10。时序安排器模块340被提供用于安排通信事件、向用户显示这些事件的提示、并促进通信事件的发起。通信事件包括通信系统10与一个或多个第三方通信装置通信的事件,其比如包括以下事件:例如,音频电话呼叫、视频电话呼叫和电子信息传送,包括电子邮件和即时文字信息传送以及其它音频和视觉消息。时序安排器模块340可以被实施为比如日历301等一般事件安排应用的一部分。在PDA型装置和个人计算机上使用日历应用来安排和实现提示供比如约会、会议、生日等一般事件是普遍的。这样,密码管理系统300具有能力来预限定时间,其中用户需要发起与特定应用的互动。例如,预限定时间可以包括特定日期和时间。因此,在该情况下,系统300将与时序安排器模块340通信,基于预限定的时序安排通过预选择应用,来设定与用户互动的背景。
[0063]密码数据库350被进一步提供关联于ASR系统210和通信系统10。如以上指出的,通常需要密码或通行码来访问可通过远程信息处理单元30访问的应用中的一个或多个。使用语音检测模块,如以下将更详细地描述的,用户可以说出密码或通行码来访问远程信息处理单元30中的特定应用,或者用户可使用任何其它互动形态比如触觉装置来访问密码数据库。用户还可使用移动装置、PDA和计算机来远程地访问它。这样,用户可输入或存储密码来用于数据库中的各个应用。如本文中所使用的,术语“远程地”是指用装置或使用网络直接通信。密码或通行码是在用户请求访问特定应用之前由系统210学习。密码数据库350因此被采用来存储密码,以便访问各个应用,比如语音邮件、电子邮件、日历、银行账户等。密码数据库350可以被采用关联于说话者辨识模块310,使得只有说出密码的特定用户的语音会获准访问特定应用。
[0064]现在转到图4-7,存在操作交通工具远程信息处理单元30的各种方法。如鉴于本公开能够理解的,方法内的操作顺序并不局限于如图4-7中所示的顺次执行,而是可以按照应用和依据本公开以一个或多个变化的顺序来执行。在多个实施例中,图4-7的方法可被安排成基于预定事件运行,并且/或者可在交通工具12的操作期间连续地运行。图4中示出的方法开始于使交通工具12处的语音识别功能最佳化,以识别由一个或多个自动电话服务员(ATA)使用的一组语音。ATA,其也可被称为互动语音响应(IVR)系统,通常是在不使用人类接待员的情况下将呼叫者转接至他们所需的号码。也就是说,呼叫者可经由语音输出和/或双音多频(DTMF)音调或命令与ATA所使用的计算机互动。其至少一部分可通过使用以上描述的ASR系统210来实现。ASR系统210不仅能接收来自交通工具乘员的语音,而且还能被引导以接收由ATA生成的语音。这样,ASR系统210可被交替地引导以倾听远程信息处理服务订购者/交通工具乘员或ATA,取决于是谁在说话。如本文中所使用的术语“呼叫者”也可被解读为包括“交通工具乘员”或“远程信息处理服务用户”。
[0065]另外,对于使用中的ATA,只有有限数量的不同语音可以用于生成来自ATA的输出。或者换言之,可能只有少数被记录来用于ATA的独特语音。并且可由ATA发出的请求数量可能也受到限制。例如,ATA可被预期读出命令,比如“请说出会议呼叫访问码”或者“请说出通行码”。基于用于设置会议呼叫的对话的背景,可合理地预测这些命令。在给定ATA可生成的有限的短语或命令和/或有限数量的不同语音的情况下,ASR系统210可被编程(例如特别地训练)为预料这些语音和/或命令,如以上论述的。
[0066]如图4中所示,交通工具乘员对于特定用户的语音“训练”ASR系统210,作为说话者辨识模块310的一部分。箭头410表示用户经由麦克风32向说话者识别模块310发送音频(“话语”),以便生成音频签名。然后,在一些实施例中,说话者辨识模块310可以经由交通工具12的音频系统36发送回应信号,以便用返回用户的“提示”的形式表示已为该用户生了成音频签名,如箭头411示出的。这样,模块310能够学习特定用户的语音签名,以便以后在用户需要经由远程信息处理单元30访问特定应用时使用。
[0067]如图5中所示,用户可以通过为用户可能寻求访问的各个应用提供密码,来进一步训练密码管理系统300。在412,用户向说话者识别系统310发送音频以便被辨识。被发送的特定音频可以是任何适当的口头命令或话语,如本领域的技术人员将理解的。若需要的话,为了表示用户已被辨识出,模块310可以在413处经由音频系统36发送回应提示,表示用户已被辨识。在一个实施例中,用户于是可以向ASR系统210 口头地传达用于特定应用的密码。例如,用户可以口头地表示需要密码的应用,而ASR系统210于是可以做出反应以要求口头地表示用于这种应用的密码,这时,密码将使用例如系统300被存储到密码数据库350中。在一替代实施例中,如414表示的,外部密码系统可以用于向密码数据库350传达用于各个应用的密码,例如经由通信系统10,使得用户不需要口头地输入用于每一个所需应用的密码。
[0068]此外,在系统300激活时,用户可以生成他们的在线资料,能够访问他们的Outlook?日历。在线资料可以包括存储在单独背景下的重要信息,比如语音邮件、电信会议系统PIN、银行账户PIN。这些背景可以于在线生成之后被编译为二进制/加密格式,如本领域中公知的。这样,密码和通行码可以被保存到系统300中,用于用户可能需要在驾驶的同时访问的多个应用中的任一个,比如语音邮件、电子邮件、Outlook?日历、电信会议服务和银行账户等,如本领域的技术人员可以想到的。
[0069]如图6中所示,系统300可以在用户进入交通工具12时或者在任何其它适当时间被最初激活。在412,用户向说话者识别系统310发送音频以便被辨识。被发送的特定音频可以是任何适当的口头命令或话语,如本领域的技术人员将理解的。若需要的话,为了表示用户已被辨识出,模块310可以在413处经由音频系统发送回应提示,表示用户已被辨识。这时,如由箭头416指示的,系统300处于“主动倾听模式”,其中系统300连续地监测通过麦克风32接收的音频信号,以获取针对系统300的任何命令。这样,一旦用户最初进入交通工具12后并在驾驶之前,系统300被初始化并准备好获取在用户驾驶期间的任何后续时刻可能由用户输入的任何命令。
[0070]如图7中所示,示出了一种方法,用于在用户操作交通工具12的同时关联于ASR系统210操作密码管理系统300。在420,用户使用远程信息处理单元30发起呼叫或其它互动。呼叫被引向比如语音邮件、电子邮件、电信会议服务、电子日历、银行账户等前述应用700中的一个或多个。为了说明图7中示出的方法,将使用银行账户应用700。在421,发起应用700即银行电话系统与密码管理系统之间的电子通信。如箭头422所示,密码管理系统300依靠经由远程信息处理系统30拨打的号码,被自动地通知关于用户所选的应用700。替代地,用户可以通过口头地说出这种背景来提供背景,这种音频信号通过麦克风32被接收到系统300中,并被语音识别单元330识别。在423,在密码管理系统300内,语音识别模块和/或互动管理器320要求关于来自密码数据库350的相关密码(用于所请求的特定应用700)的信息。在424,从密码数据库350提供密码。然后,在425,系统300可以检测到来自用户的请求,以向用户与之通信的应用700比如银行提供密码。作为回应,在427,系统300向对用户请求做出回应的呼叫中提供DTMF。在一替代实施例中,如426示出的,密码管理系统300检测到来自应用700比如银行的要求例如通行码的提示(例如语音提示或音调提示)。作为回应,在428,系统300向对应用700的请求做出回应的呼叫中提供DTMF。
[0071]这样,用户能够向特定应用发起呼叫,并且一旦该呼叫被放到应用后,密码管理系统300能够向应用提供所需的密码,以便用户使用例如DTMF访问该应用。语音识别允许系统辨识用户,并且先有训练和密码编程允许系统300存储密码,以便用户访问各种应用,比如语音邮件、电子邮件、电信会议服务、电子日历、银行账户等。希望的是,用户能够安全地访问这些应用,而不必在驾驶时手动地输入通行码,从而为用户节省时间,并增强用户的安全和驾驶体验。为了保密性,密码数据库可被存储为加密格式比如编译二进制数据,以确保最佳的网际安全,尤其是在用户密码资料被存储在远程后台服务器上或者甚至是存储在嵌入式平台上时。
[0072]虽然在前面的详细描述中给出了示例性实施例,但是应该理解的是存在大量的变型。还应该理解的是:示例性实施例只是示例,并不旨在以任何方式限制本公开的范围、适用性或构造。相反,前面的详细描述将为本领域技术人员提供便利的线路图来实施示例性实施例。应该明白的是:可以在构成元素的功能和配置中做出各种变化,而不背离如在所附权利要求书及其法律等同方案中给出的本公开的范围。
【权利要求】
1.一种方法,包括: 存储从远程信息处理服务的用户提供的应用访问码; 使用所述远程信息处理服务来发起呼叫,并在呼叫期间利用用户语音输入签名来访问用户数据,以检验所述用户; 在所述呼叫期间接收来自所述应用的对所述访问码的请求; 使用关联于交通工具的语音识别功能来确定所述应用已请求了所述访问码;以及 基于所述语音识别功能的确定来向所述应用发送所存储的应用访问码。
2.如权利要求1所述的方法,其中,存储应用访问码包括存储用于语音邮件应用的应用访问码。
3.如权利要求1所述的方法,其中,存储应用访问码包括存储用于电子日历应用的应用访问码。
4.如权利要求1所述的方法,其中,存储应用访问码包括存储用于银行应用的应用访问码。
5.如权利要求1所述的方法,其中,向所述应用发送所存储的访问码包括发送呈DTMF格式的所存储的访问码。
6.如权利要求1所述的方法,进一步包括:从交通工具向应用发起呼叫,其中从交通工具向应用发起呼叫基于接收自交通工具乘员的口头命令。
7.如权利要求6所述的方法,其中,从交通工具向应用发起呼叫基于预限定的时序安排。
8.一种系统,包括: 访问码数据库,其被构造成存储从远程信息处理服务用户提供的应用访问码; 远程信息处理单元,其被构造成从交通工具向应用发起呼叫; 互动管理器,其被构造成在呼叫期间接收来自所述应用的对访问码的请求; 语音识别模块,其被构造成确定所述应用已请求了所述访问码;以及电子通信系统,其被构造成基于所述语音识别功能的确定向所述应用发送所存储的访问码。
9.如权利要求8所述的系统,其中,所述应用访问码包括用于语音邮件应用的访问码。
10.一种交通工具,包括: 远程信息处理单元,其与密码管理系统处于可操作的电子通信,所述密码管理系统包括: 访问码数据库,其被构造成存储从远程信息处理服务用户提供的应用访问码,所述远程信息处理单元被构造成从交通工具向应用发起呼叫; 互动管理器,其被构造成在呼叫期间接收来自所述应用的对访问码的请求; 语音识别模块,其被构造成确定所述应用已请求了所述访问码;以及电子通信系统,其被构造成基于所述语音识别功能的确定向所述应用发送所存储的访问码。
【文档编号】H04L29/08GK104426998SQ201410414665
【公开日】2015年3月18日 申请日期:2014年8月21日 优先权日:2013年8月21日
【发明者】G.塔尔瓦, R.M.赫奇特, X.赵 申请人:通用汽车环球科技运作有限责任公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1