专利名称:一种移动通信设备及在其中进行语音通信的方法
技术领域:
本发明涉及移动通信设备,更具体地说,涉及一种具有无声会话功能的移动通信设备。
背景技术:
移动通信设备日渐普及。例如但不限于,这些移动通信设备包括蜂窝电话、寻呼机和个人数字助理。移动通信设备给用户提供了在各种环境下进行通信的能力,其中,有一些环境是不适合进行某些类型的通信(如语音通信)的。作为一个非局限性的例子,在需要保持安静的地方(如正在放映电影的电影院、正在开会的会议室、正举行仪式的教堂等),通常不适合进行电话通信。又如作为例子,有时候在嘈杂的环境中(如运动会、建筑工地、喧闹的夜总会等)要进行电话通信是困难的或者是不可行的。
比较本发明后续将要结合附图介绍的系统,现有技术的其它局限性和弊端对于本领域的普通技术人员来说是显而易见的。
发明内容
本发明的各个方面提供一种在移动通信设备中提供无声会话功能的系统和方法,如附图以及权利要求所述。
根据本发明的一方面,提供一种在移动通信设备中进行语音通信的方法,该方法包括建立与第二通信设备通信的无线通信链路;接收用户输入;至少部分地基于所接收的用户输入从多个语音信息中确定一个语音信息;和将所确定的语音信息通过所建立的无线通信链路传送给第二通信设备。
优选地所述移动通信设备包括蜂窝电话;和所述建立与第二通信设备通信的无线通信链路包括在所述移动通信设备与所述第二通信设备之间建立蜂窝通信链路。
优选地,所述接收用户输入包括接收按键输入。
优选地,所述方法还包括产生用于显示一组语音信息的可视输出,其中,所述接收用户输入包括接收指示用户选择了该组语音信息中的一个特定语音信息的用户输入。
优选地,所述确定语音信息包括至少部分地基于用户输入从多个预录制的语音信息中选择语音信息。
优选地,所述多个预录制的语音信号包括预录制的用户真人语音信息。
优选地,所述多个预录制的语音信息包括预录制的基本语句集,使用该语句集合能使双方通话中的一方引导通话进行下去。
优选地,所述发送确定的语音信息包括至少部分地基于用户输入合成所确定的语音信息。
优选地,所述方法还包括在将确定的语音信息发送给第二通信设备之前产生指示所确定的语音信息的音频输出。
优选地,所述方法还包括将所述多组预录制语音信息中的一组预录制语音信息关联到特定的通信上。
优选地,所述方法还包括接收用户的模式输入;和至少部分地基于用户的模式输入,在无声和有声模式之间切换。
优选地,所述方法还包括接收通信设备的信号;和至少部分地基于所接收的信号,在无声与有声模式之间切换。
优选地,所述方法还包括接收第二用户输入;和响应第二用户输入,中断将所确定的语音信息发送给第二通信设备。
根据本发明的一方面,提供一种移动通信设备,包括用于与第二通信设备建立无线通信链路的通信接口模块;用于接收用户输入的用户接口模块;通信地连接到所述通信接口模块和用户接口模块的至少一个模块,其用于使用所述通信接口模块与第二通信设备建立无线通信链路;至少部分地基于通过所述用户接口模块接收的用户输入从多个语音信息中确定语音信息;和使用所述通信接口模块将所确定的语音信息通过所建立的通信链路传送给第二通信设备。
优选地所述通信接口模块包括蜂窝电话收发器模块;和所述通信链路包括蜂窝电话通信链路。
优选地,所述通过用户接口模块接收的用户输入包括按键输入。
优选地,所述至少一个模块用于利用用户接口模块进行以下操作产生用于显示一组语音信息的可视输出;和接收指示用户选择了该组语音信息中的一个特定语音信息的用户输入。
优选地,所述移动通信设备还包括存储器,其存储多个预录制的语音信息,其中所述至少一个模块至少部分地基于用户输入从已存储的多个预录制的语音信息中选择一个语音信息来确定一个语音信息。
优选地,所述多个预录制的语音信号包括预录制的用户真人语音信息。
优选地,所述多个预录制的语音信息包括预录制的基本语句集,使用该语句集合能使双方通话中的一方引导通话进行下去。
优选地,所述至少一个模块还用于至少部分地基于用户输入合成确定的语音信息。
优选地,所述至少一个模块在利用所述通信接口模块将确定的语音信息发送给第二通信设备之前产生,还使用所述用户接口模块来产生指示已确定的语音信息的音频输出。
优选地,所述移动通信设备还包括存储器,其存储多组预录制的语音信息,其中,所述至少一个模块用于将所述多组预录制语音信息中的一组预录制语音信息关联到特定的通信上。
优选地所述用户接口模块用于接收用户的模式输入;和所述至少一个模块至少部分地基于所接收到的用户的模式输入,在无声和有声通信模式之间切换。
优选地所述通信接口模块用于接收操作模式信号;和所述至少一个模块至少部分地基于所接收的操作模式信号,在无声与有声通信模式之间切换。
优选地,所述至少一个模块包括开关电路,该开关电路用于接收至少与移动通信设备的麦克风关联的第一音频信号和与所确定的语音信息关联的第二音频信号作为输入;至少部分地通过选择第一音频信号或第二音频信号来产生被选择的信号;和输出所选择的信号。
优选地,所述至少一个模块包括混合器电路,其用于接收至少与移动通信设备的麦克风关联的第一音频信号和与所确定的语音信息关联的第二音频信号作为输入;至少部分地通过混合第一音频信号和第二音频信号来产生混合信号;和输出该混合信号。
优选地,所述至少一个模块包括混合器电路,其用于接收至少与移动通信设备接收的语音信息关联的第一音频信号和与所确定的语音信息关联的第二音频信号;
至少部分地通过混合第一音频信号和第二音频信号来产生混合信号;和输出该混合信号。
优选地,所述至少一个模块用于响应第二用户输入,中断将所确定的语音信息发送给第二通信设备。
通过以下的描述和附图,可以更深入地理解本发明的各种优点、各个方面、创新特征、及其实施例的细节。
下面将结合附图及实施例对本发明作进一步说明,附图中图1是根据本发明各个方面在移动通信设备中提供无声会话功能的方法的流程图;图2是根据本发明各个方面的具有无声会话功能的移动通信设备的示意图;图3是根据本发明的一个非限制性实施例的具有无声会话功能的移动通信设备的示意图;图4是根据本发明的一个非限制性实施例的具有无声会话功能的移动通信设备的开关和/或混合器部分的示意图;图5是根据本发明另一个非限制性实施例的具有无声会话功能的移动通信设备的开关和/或混合器部分的示意图;图6是根据本发明的一个非限制性实施例的具有无声会话功能的移动通信设备的音频输出部分的示意图;图7是根据本发明另一个非限制性实施例的具有无声会话功能的移动通信设备的音频输出部分的示意图。
具体实施例方式
图1是根据本发明各个方面在移动通信设备中提供无声会话功能的方法100的流程图。所述移动通信设备可包括任何一种移动通信设备的特征。例如但不限于,所述移动通信设备可以包括蜂窝电话的特征。再如,所述移动通信设备可包括具有语音功能的寻呼机、具有语音功能的便携式email设备、具有语音功能的个人数字助理(PDA)或具有移动通信功能的袖珍计算机等。因此,本发明的各个方面的范围不局限于任何特定类型的移动通信设备。
示范方法100从步骤105开始。该示范方法100可因为各种原因而开始执行。例如但不限于,示范方法100可在实施该方法100的移动通信设备启动或重启时开始执行。又如,示范方法100也可以响应用户指令(如,建立通信或回应通信的指令)而开始执行。再如,示范方法100可响应该移动通信设备所接收的来自其他通信设备的信号而开始执行。因此,本发明的各个方面的范围不局限于任何特定的启动原因或条件。
步骤110中,示范方法100可包括与第二通信设备建立通信链路(如无线通信链路)。所述第二通信设备可包括任何一种通信设备的特征。例如但不限于,第二通信设备可包括蜂窝电话、便携式电话或无线电话的特征。又如,所述第二通信设备可包括具有语音功能的寻呼机、具有语音功能的便携式email设备、具有语音功能的个人数字助理(PDA)或具有移动通信能力的袖珍计算机等的特征。因此,本发明各个方面的范围不局限于特定类型的第二通信设备的特征。
所述通信链路可包括任何类型的通信链路的特征。例如但不限于,所述通信链路可包括蜂窝电话通信链路的特征,又如,所述通信链路可包括各种电信和/或计算机通信链路的特征。再如,所述通信链路还可包括任何通信媒介(如无线RF,无缆光波等)的特征。
例如,所述通信链路能够传输语音信息和各种其他类型的信息。例如但不限于,所述通信链路能传输视频、图像、图形、数据和/或文本信息。
例如,步骤110可包括根据任何通信协议和/或标准建立通信链路。例如但不限于,步骤110可包括根据任何蜂窝电信协议和/或标准(如GSM、GPRS、EDGE、HSCSD、CDMA、WCDMA、TDMA、PDC、SMC等)建立通信链路。又如,步骤110可包括根据任何计算机通信协议和/或标准(如WLAN、WiFi、IEEE802.11、IEEE 802.15、蓝牙、超宽带、Zigbee、IP、以太网或IEEE 802.3、X.25、令牌环或IEEE 802.5等)建立通信链路。
通常,步骤110可包括与第二通信设备建立通信链路。因此,本发明的各个方面的范围不局限于任何特定类型的第二通信设备的特征、任何特定类型的通信链路的特征以及建立通信链路的任何特定方式的特征。
要强调的是,虽然本说明一般所提及的是移动通信设备与第二通信设备之间的通信,但这种一对一的通信仅仅用于例举。本发明各个方面的范围不局限于与所述移动通信设备进行通信的通信设备的具体数目。
步骤115中,示范方法100可包括从第二通信设备接收语音通信信息(如,通过步骤110中建立的通信链路)。例如但不限于,步骤115可包括接收与使用第二通信设备的第二用户与该移动通信设备的用户通话相对应的语音通信信息,步骤117中,示范方法100可包括将至少一部分接收到的语音信息传送给用户(例如,以相对于该移动通信设备的用户以外的他人来说基本无声的方式)。例如,步骤117可包括在耳塞(ear speaker)、耳机(earphone)、头戴式耳机和送话器(headset)或其他音频输出设备上产生相应于所接收到的语音信息的音频输出,这样,所产生的音频输出能被该移动通信设备的用户听到,而不会被该移动通信设备附近的其他人听到。进入的语音信息的这种呈现方式能在将语音信息提供给该移动通信设备的用户而不对其他人产生噪声干扰。
步骤120中,示范方法100包括接收用户输入(例如,由使用该移动通信设备进行通话的人发出)。所述用户输入可包括任何的用户输入的特征。例如但不限于,该用户输入可包括按键信号(如,关联于在数字键盘或字母-数字键盘上的按键操作)。又如,用户输入可包括用户触摸屏选择的信号指示。再如,所述用户输入可包括显示指针移动和/或选择(如,触摸板、指轮、箭头键、选择按钮等)信号。本发明各个方面的范围不局限于移动通信设备所接收的特定类型的用户输入的特征。
步骤120可包括以各种方式接收用户输入。例如但不限于,步骤120可包括被动地接收用户的输入。又如,步骤120可包括主动请求用户的输入。例如,步骤120可包括产生标识一组语音信息的可视输出(如菜单)以供用户选择。例如,所述语音信息可包括预录制的语音信息(如,具有合成语音或用户的真人语音的特征)。例如,预录制的语音信息可以是用户用真人语音预录制的一组语音信息。
语音信息的菜单(如可视菜单)可包括任何菜单的特征。例如,该菜单可包括与特定词或语音信息关联的关键字或者图标。又如,该菜单可包括与特定词或语音信息关联的关键字母、数字或其它符号。所述关键字、符号、字母、数字或其他符号可预先设定,或者是可定义的(例如,用户可选择的或可设计的)。
在各种非局限性的示范方案中,步骤120可包括将多组预录制的语音信息中的一组关联到具体的通信上。例如,第一组预录制的语音信息可包括用第一语言录制的信息,第二组预录制的语音信息可包括用第二语言录制的信息。在另一个实施例中,第一组预录制的语音信息可包括用于职业通话的信息,第二组预录制的语音信息可包括用于私人通话的信息。在又一个实施例中,第一组预录制的语音信息可包括用于与第一个人(第一群组的人)通话的语音信息,第二组预录制的语音信息可包括用于与第二个人(第二群组的人)通话的语音信息。
在一非局限性的示范方案中,有多组预录制的语音信息,步骤120可包括以任何方式将多组预录制的语音信息中的一组关联到具体的通信上。例如但不限于,步骤120可包括至少部分地基于第二通信设备或该第二通信设备的用户的身份将一组预录制的语音信息关联到特定的通信上。又如,步骤120可包括至少部分地基于用户输入(例如,步骤120或其他步骤中获得的)的用于指示用户所选择的特定组的信息,将一组预录制的语音信息关联到特定的通信上。再如,步骤120可包括至少部分地基于日期、时间、地理位置、移动通信设备当前用户,将一组预录制的语音信息关联到特定的通信上。总之,在各种非局限性示范方案中,步骤120可包括将特定的一组预录制语音信息关联到特定的通信上。因此,本发明各个方面的范围不局限于特定的预录制语音信息组的特征或将特定的预录制语音信息组关联到某特定通信的特定方式的特征。
总之,步骤120可包括接收用户输入。因此,本发明的各个方面的范围不局限于特定的用户输入、接收用户输入的特定方式或为接收用户输入而与用户交互的特定方式的特征。
步骤130中,示范方法100包括至少部分地基于用户输入(例如,步骤120中接收的)从多个语音信息中确定一个语音信息(例如,与第二通信设备通信,步骤110中已经建立了与该第二通信设备的通信链路)。
步骤130可包括以任何方式确定语音信息。例如但不限于,步骤130包括至少部分地基于用户输入(如,在步骤120中接收)从一组语音信息中选择一个语音信息。例如,所述语音信息可包括预录制的语音信息(例如,用合成语音或用户真人语音录制的)。例如,一组预录制的语音信息可包括基本的(例如,逻辑上完整的)语句集合,使用该语句集合使得基本的双方通话中的一方能够引导通话进行下去。例如但不限于,预录制语音信息的语句可包括“是”、“否”、“可能”、“我在听,但我现在不方便说话”、“我会尽快给你回电”、“我明白”、“请留言,我以预录制的信息回复”、“稍后”、“明天”、“打其他人的电话”、“自己决定”、“请稍等,我在去一个更适合通话的位置”、“我得挂电话了”、“请继续”、“你好”、“再见”、“谢谢”、“请重复一遍”、“正在键入回复,请稍等”等语句。
例如,步骤130可包括通过至少部分地基于用户输入(如,在步骤120中接收)所确定的将要被合成的语音信息来确定语音信息。例如但不限于,步骤130可包括至少部分地基于用户输入确定将要通过文字到语音(text tospeech)和看字读音到语音(phonics to speech)合成的语音信息。例如,在步骤120中,用户可拼写词或短语,或者根据读音构造词或短语的发音;之后,在步骤130中至少部分地基于该输入的拼写或语音表达确定将要合成的词或短语。
在一非局限性的示范方案中,步骤130可包括产生表示被选择的语音信息的音频输出。例如,步骤130可包括通过耳塞(ear speaker)、耳机(earpiece)、头戴式耳机和送话器(headset)或其它音频输出设备将所述音频输出传送给移动通信设备的用户,使该移动通信设备附近的人听不到该音频输出;或者以一种最大限度地不受用户周边外部噪声影响的方式将所述音频输出传送给用户。这样,用户能听到所确定的语音信息。例如但不限于,步骤130可包括产生与所确定的语音信息对应的音频输出,以及为用户提供确认所述确定的语音信息的机会,或者在将所述确定的语音信息发送给第二通信设备(如,在步骤140。下面会阐述之)之前,给用户提供确定替换语音信息的机会。又如,步骤130可包括在将所确定的语音信息发送给第二通信设备的同时产生与该确定的语音信息对应的音频输出。在一示范性方案中,所确定的语音信息被输出给用户,步骤130包括将该确定的语音信息与将被提供给用户的其他音频(如,与从第二通信设备呼入的语音信息关联的音频)混合。
总之,步骤130可包括至少部分地基于用户输入(如,在步骤120中接收)从多个语音信息中确定一个语音信息。因此,本发明各个方面的范围不局限于确定语音信息的任何特定方式(如,从一组中选择或确定将要合成的语音信息)或向用户反馈以通知用户所确定的语音信息的任何特定方式。
步骤140中,示范方法100包括将所确定的语音信息(如,在步骤130中确定)通过通信链路(如,在步骤110中建立)发送给第二通信设备。步骤140可包括以任何方式将所确定的语音信息发送给第二通信设备(例如,取决于该第二通信设备的特征和/或与该第二通信设备建立的通信链路)。如前有关步骤110的描述,所述第二通信设备可包括任何通信设备类型的特征,所述通信链路可包括任何种类的通信链路的特征。因此,本发明各个方面的范围不局限于发送语音信息的任一特定方式的特征。
例如但不限于,步骤140可包括产生对应于所确定的语音信息的音频信号。例如,步骤140包括以任何方式产生音频信号。例如但不限于,步骤140可包括从存储器中提取与所确定的语音信息对应的语音信息,并处理所提取的语音信息以产生音频信号。又如,步骤140可包括实施任何语音合成技术(如基于文本或读音的语音合成技术)来产生音频信号。本发明各个方面的范围不局限于产生音频信号的任何特定方式的特征。
例如但不限于,步骤140包括在移动通信设备的麦克风发出的语音信号和所述产生的语音信号(如,对应于步骤130中确定的语音信号)中选择,并发送所选择的语音信号。步骤140可替换地包括混合移动通信设备的麦克风发出的语音信号和所述产生的语音信号(如,对应于步骤130中确定的语音信号),并发送混合后的语音信号。总之,步骤140可包括将确定的语音信号(如步骤130中所确定的)至少发送给第二通信设备。因此,本发明各个方面的范围不局限于发送确定的语音信号的任何特定方式的特征。
步骤150中,示范方法100包括执行后续的处理行为。步骤150可包括执行任何的处理行为。例如但不限于,所述处理行为可包括与移动通信关联的处理行为。
例如,步骤150(或另一步骤)可包括与用户交互以定义一组语音信息。例如,所述交互可包括与用户交互以录制一个或多个预录制语音信息。又如,所述交互可包括定义可视标记(如文本、图标、数字等)以在移动通信设备的输出显示屏上显示各种预录制的语音信息。
又如,在包括多组预录制语音信息的非局限性的示范方案中,步骤150(或另一步骤)可包括与用户交互以定义多组语音信息。例如,所述交互可包括与用户交互,以将一个或多个特定的选择特征(如用户输入、通信设备ID、呼叫方ID、用户ID、语言、日期、时间、位置等)关联到一组特定的语音信息上。例如,所述关联用于将一组特定的语音信息关联到特定通信上。
要说明的是,所述交互的各个部分可由所述移动通信设备执行,也可由连接到该移动通信设备的其他的设备(如个人计算机)执行。
例如,步骤150可包括接收与移动通信设备的操作有关的设定或改变的用户输入(如模式输入),即从无声通信模式(如按照步骤115-140进行通信)到有声通信模式(用户正常地对着移动通信设备说话),反之亦然。例如,步骤150包括基于所接收的用户输入在无声与有声通信模式间切换。在一非限制性的示范方案中,所述切换可包括发送信息到另外的通信设备,表示模式已经切换。
例如,步骤150可包括接受来自另外的通信设备的与移动通信设备在无声通信模式(如按照步骤120-140通信)和有声通信模式(用户正常地对着移动通信设备说话)之间的设定或改变操作有关的信号。例如,步骤150包括基于所接收的信号在无声通信模式与有声通信模式之间切换。
例如,除语音信息之外,步骤150还包括在移动通信设备与第二通信设备之间传送各种信息。例如但不限于,步骤150可包括在移动通信设备和第二通信设备之间传送视频信息和/或文本信息。例如,步骤150包括与用户交互以进入特定操作模式,在该操作模式中,用户能够使用移动通信设备向第二通信设备传送包括文字与数字的符号(alphanumeric characteristics)(或者,其可听形式)。再如,步骤150可包括向第二通信设备传送数据信息(如文件信息)。
另外,步骤150可包括接收第二用户输入,以及响应该第二用户输入,在步骤140中中断向另外的设备发送所确定的语音信息。在一局限性的示范方案中,用户可确定步骤140中正发送的不正确的或不需要的长信息,用户可输入第二用户输入以停止发送该错误的或不需要的长信息。例如,示范方法100的执行可返回到步骤120中以接收另外的用户输入。
总之,步骤150可包括执行任何后续处理行为。因此,本发明各个方面的范围不局限于任何特定的后续处理的特征。
示范方法100用于对本发明的一般更宽方面进行说明。因此,本发明各个方面的范围不局限于示范方法100的特征。
图2是根据本发明各个方面的具有无声会话功能的移动通信设备200的示意图。例如但不限于,移动通信设备200共有图1所示的及上述的示范方法100的各种功能特征。
移动通信设备200可包括任何移动通信设备类型的特征。例如但不限于,该移动通信设备可包括蜂窝电话的特征。又如,移动通信设备200可包括具有语音功能的寻呼机、具有语音功能的便携式email设备、具有语音功能的个人数字助理(PDA)或具有移动通信功能的袖珍式计算机等的特征。因此,本发明各个方面的范围不局限于任何特定类型的移动通信设备的特征。
示范移动通信设备200可包括一个或多个通信接口模块210、一个或多个操作控制模块220、一个或多个用户接口模块230和存储器240。例如,通信接口模块210可包括第一通信接口模块212和第二通信接口模块214。例如,操作控制模块220可包括通用通信控制模块222和语音信息产生模块224。下面将对上述模块的各个非局限性方面进行阐述。
示范移动通信设备200可包括第一通信接口模块212。第一通信接口模块212可包括任何通信接口模块的特征。例如但不限于,第一通信接口模块212可共有图1所示的及上述的示范方法100的步骤110的各种功能特征。
例如,第一通信接口模块212可用于与至少一个第二通信设备建立通信链路(如,无线通信链路)。所述第二通信设备可包括任何通信设备的特征。例如但不限于,所示第二通信设备可包括蜂窝电话、便携式电话或有线电话的特征。又如,所述第二通信设备可包括具有语音功能的寻呼机、具有语音功能的便携式email设备、具有语音功能的个人数字助理或具有移动通信功能的袖珍计算机等的特征。因此,本发明各个方面的范围不局限于特定类型的第二通信设备的特征。
所述通信链路可包括任何类型的通信链路的特征。例如但不限于,所述通信链路可包括蜂窝电话通信链路的特征。又如,所述通信链路可包括任何的电信和/或计算机通信链路的特征。例如,所述通信链路还包括任何通信媒介(如无线RF、无缆光波等)的特征。
例如,所述通信链路还用于传送语音信息和任何其他信息类型。例如但不限于,所述通信链路能够传送视频、图像、图形、数据和/或文字信息。
例如,第一通信接口模块212可用于根据任何通信协议和/或标准建立通信链路。例如但不限于,第一通信接口模块212可用于根据任何蜂窝电信协议和/或标准(如GSM、GPRS、EDGE、HSCSD、CDMA、WCDMA、TDMA、PDC、SMS等)建立通信链路。又如,第一通信接口模块212可用于根据任何的计算机通信协议和/或标准(如WLAN、WiFi、IEEE 802.11、IEEE 802.15、蓝牙、超宽带、Zigbee、IP、以太网或IEEE 802.3、X.25、令牌环或IEEE 802.5等)建立通信链路。
总之,第一通信接口模块212可用于与至少一个第二通信设备建立通信链路。因此,本发明各个方面的范围不局限于任何特定类型的第二通信设备的特征、任何特定类型的通信链路的特征,或建立通信链路的特定方式或机制的特征。
要说明的是,虽然本说明书常参考示范移动通信设备200与一个第二通信设备之间的通信,但这种一对一的通信仅仅用于说明。本发明各个方面的范围不局限于与移动通信设备200通信的通信设备的任何特定数量的特征。
例如,通用通信控制模块222(下面将对其进行讨论)使用第一通信接口模块212以接收来自第二通信设备的语音信息(如,通过已建立的通信链路)。例如但不限于,通用通信控制模块222可使用第一通信接口模块212来接收与使用所述第二通信设备的第二个人跟移动通信设备200的用户通话相对应的语音信息。
又如,例如,通用通信控制模块222可使用用户接口模块230(下面将对其进行讨论)将至少一部分所接收的语音信息传送给用户(例如以相对于该移动通信设备的用户以外的他人而言基本无声的方式)。例如,通用通信控制模块222可使用用户接口模块230在耳塞(ear speaker)、耳机(earphone)、头戴式耳机和送话器(headset)或其他的音频输出设备上产生相应于所接收语音信息的音频输出,这样,所产生的音频输出能被该移动通信设备200的用户听到,而不会被该移动通信设备200附近的人听到。呼入的语音信息的这种呈现方式能将语音信息提供给该移动通信设备的用户而不对其他人产生噪声干扰。
如上所述,示范移动通信设备200可包括一个或多个用户接口模块230。用户接口模块230可包括任何用户接口的特征。例如但不限于,用户接口模块230可共有图1所示的及上述的示范方法100中步骤115-120的各种功能特征。
例如,用户接口模块230可用于接收用户输入(例如,接收使用该移动通信设备200进行通话的人的输)。所述用户输入可包括任何用户输入的特征。例如但不限于,该用户输入可包括按键信号(如,关联于在数字键盘或字母-数字键盘上的按键操作)。又如,用户输入可包括用户触摸屏选择的信号指示。再如,所述用户输入可包括显示指针移动和/或选择(如,触摸板、指轮、箭头键、选择按钮等)信号。本发明各个方面的范围不局限于移动通信设备200所接收的特定类型的用户输入的特征。
用户接口模块230可用于以各种方式接收用户输入。例如但不限于,用户接口模块230可用于被动地接收用户的输入。又如,用户接口模块230可用于主动请求用户的输入。例如,用户接口模块230可用于产生标识一组语音信息(如存于存储器240中的)的可视输出(如菜单)以供用户选择。例如,所述语音信息可包括预录制的语音信息(如,具有合成语音或用户的真人语音的特征)。例如,预录制的语音信息可以是用户用真人语音预录制的一组语音信息。
语音信息的菜单(如可视菜单)可包括任何菜单的特征。例如,该菜单可包括与特定词或语音信息关联的关键字或者图标。又如,该菜单可包括与特定词或语音信息关联的关键字母、数字或其它符号。所述关键字、符号、字母、数字或其他符号可预先设定,或者是可定义的(例如,用户可选择的或可设计的)。
在各种非局限性的示范方案中,用户接口模块230可用于将多组预录制的语音信息(如,其可存储在存储器240中)中的一组关联到特定的通信上。例如,第一组预录制的语音信息可包括用第一语言录制的信息,第二组预录制的语音信息可包括用第二语言录制的信息。在另一个实施例中,第一组预录制的语音信息可包括用于职业通话的信息,第二组预录制的语音信息可包括用于私人通话的信息。在又一个实施例中,第一组预录制的语音信息可包括用于与第一个人(第一群组的人)通话的语音信息,第二组预录制的语音信息可包括用于与第二个人(第二群组的人)通话的语音信息。
在一非局限性的示范方案中,有多组预录制的语音信息(如,其可存储在存储器240中),用户接口模块230可用于以任何方式将多组预录制的语音信息中的一组关联到特定的通信上。例如但不限于,用户接口模块230可用于至少部分地基于第二通信设备(例如,移动通信设备200正与其通信)或该第二通信设备的用户的身份将多组预录制的语音信息中的一组关联到特定的通信上。又如,用户接口模块230可用于至少部分地基于用户输入的用于指示用户所选择的特定组的信息,将一组预录制的语音信息关联到特定的通信上。又如,用户接口模块230可用于至少部分地基于日期、时间、地理位置、移动通信设备200的当前用户等,将多组预录制的语音信息中的一组关联到特定的通信上。总之,在各种非局限性示范方案中,用户接口模块230可用于将多组预录制的语音信息中的一组关联到特定的通信上。因此,本发明各个方面的范围不局限于预录制语音信息组的特征或将特定的预录制语音信息组关联到某特定通信的特定方式的特征。
总之,用户接口模块230可用于接收用户输入。因此,本发明的各个方面的范围不局限于特定的用户输入、接收用户输入的特定方式或为接收用户输入而与用户交互的特定方式的特征。
如上所述,移动通信设备200可包括语音信息产生模块224。语音产生模块224可用于至少部分地基于用户输入(例如,由用户接口模块230接收的)确定和/或产生语音信息。例如但不限于,语音信息产生模块224可共有图1所示的及上述的示范方法100中的步骤130和步骤140的各种功能特征。
语音信息产生模块224可用于以任何方式确定和/或产生语音信息。例如但不限于,语音信息产生模块224可用于至少部分地基于用户输入(如,用户接口模块230接收的),从一组语音信息(如,其可被存储在存储器240中)中选择一个语音信息。例如,所述语音信息可包括预录制的语音信息(例如,用合成语音或用户真人语音录制)。如上面示范方法100的步骤130中所述,一组预录制的语音信息可包括基本的(例如,逻辑上完整的)语句集合,使用该语句集合使得基本的双方通话中的一方能够引导通话进行下去。例如但不限于,预录制语音信息组的语句可包括“是”、“否”、“可能”、“我在听,但我现在不方便说话”、“我会尽快给你回电”、“我明白”、“请留言,我以预录制的信息回复”、“稍后”、“明天”、“打其他人的电话”、“自己决定”、“请稍等,我在去一个更适合通话的位置”、“我得挂电话了”、“请继续”、“你好”、“再见”、“谢谢”、“请重复一遍”、“正在键入回复,请稍等”等语句。
例如,语音信息产生模块224通过至少部分地基于用户输入(如,用户接口模块230接收的)确定将要被合成的的语音信息,接着合成所确定的信息,从而产生语音信息。例如但不限于,语音信息产生模块224可用于至少部分地基于用户输入执行文字到语音(text to speech)和看字读音到语音(phonics to speech)的合成。例如,所述用户可使用用户接口模块230拼写词或短语,或者根据读音构造词或短语的发音;接着,语音信息产生模块224至少部分地基于该输入的拼写或语音表达确定将要合成的词或短语。
在一非局限性的示范方案中,语音信息产生模块224可用于产生表示被选择的语音信息的音频输出(如,使用用户接口模块230)。例如,语音信息产生模块224可用于通过耳塞(ear speaker)、耳机(earpiece)、头戴式耳机和送话器(headset)或其他输出设备将所述音频输出传送给移动通信设备200的用户,使该移动通信设备200附近的人听不到该音频输出;或者以一种最大限度地不受用户周边外部噪声影响的方式将所述音频输出传送给用户。这样,用户能听到所确定的语音信息。例如但不限于,语音信息产生模块224能够使用用户接口模块230产生与所确定的语音信息对应的音频输出,以及为用户提供确认所述确定的语音信息的机会,或者在将所述确定的语音信息发送给第二通信设备(如,通过第一通信接口模块212,下面将对其进行讨论)之前,给用户提供确定替换语音信息的机会。又如,语音信息产生模块224能够在将所确定的语音信息发送给第二通信设备的同时产生与该确定的语音信息对应的音频输出。在一示范性方案中,所确定的语音信息被输出给用户,语音信息产生模块224能够将该确定的语音信息以及将要通过用户接口模块230提供给用户的其他音频(如,与从第二通信设备呼入的语音信息关联的音频)混合。
总之,语音信息产生模块224能够至少部分地基于用户输入(如,通过用户接口模块230接收)确定和/或产生一个语音信息。因此,本发明各个方面的范围不局限于确定或产生语音信息(如,选择或合成语音信息)的任何特定方式(或机制)或向用户反馈以通知用户所确定的语音信息的任何特定方式(或机制)。
如上所述,移动通信设备200可包括通用通信控制模块222。通用通信控制模块222能管理用户与其它通信设备(或及其用户)之间的信息传送。例如但不限于,通用通信控制模块222可共有上述图1所示的示范方法100中的步骤110-140的各种功能特征。
例如,通用通信控制模块222能使用用户接口模块212将语音信息(和/或其他信息)传送到移动通信设备200的用户以及接收来自移动通信设备200的用户的语音信息(和/或其他信息)。又如,通用通信控制模块222能够使用第一通信接口模块212将语音信息(和/或其他信息)传送到其他移动通信设备的用户以及接收来自其他移动通信设备的用户的语音信息(和/或其他信息)。
例如,通用通信控制模块222能够使用第一通信接口模块212将所确定的语音信息(如,通过语音信息产生模块224确定和/或产生)通过通信链路(如,通过第一通信接口模块212建立)发送给第二通信设备。通用通信控制模块222能够使用第一通信接口模块212以任何方式将所确定的语音信息发送给第二通信设备(例如,取决于该第二通信设备的特征和/或与该第二通信设备建立的通信链路的特征)。如上所述,所述第二通信设备可包括任何通信设备类型的特征,所述通信链路可包括任何种类的通信链路的特征。因此,本发明各个方面的范围不局限于传送语音信息的任一特定方式的特征。
如上所述,取决于设备的配置,示范移动通信设备200可(或选择地)包括第二通信接口模块214和另外的通信接口模块。所述第二通信接口模块214与第一通信接口模块212可以相同,也可以不同(如,以不同的方式通信)。在一非限制性的示范方案中,第一通信接口模块212可用于通过电信网络与其他通信设备通信,第二通信接口模块214可用于通过计算机网络进行通信。本发明各个方面的范围不受是否存在这样的第二通信接口模块214的限制,也不受任何特定类型的通信接口模块的特征的限制。
如上所述,示范移动通信设备200可包括存储器240。例如,存储器240可用于存储预录制的语音信息相关的信息(如,与数字化语音信息取样相关的信息,或者与语音合成处理相关的信息)。例如,存储器240也可用于存储软件指令,该软件指令可由移动通信设备200的处理器执行。存储器240可包括任何存储器类型的特征。因此,本发明各个方面的范围不局限于任何特定类型的存储器的特征。
另外,例如但不限于,操作控制模块220可用于响应特定的用户输入,中断将已确定的语音信息发送给第二通信设备。在一非限制性示范方案中,用户能确定正在向另外的通信设备发送不正确的或不需要的长信息,且能输入特定的用户输入以停止发送该错误的或不需要的长信息。
示范移动通信设备200用于对本发明一般更宽的方面进行举例说明。因此,本发明各个方面的范围不局限于示范移动通信设备200的特征。
图3是根据本发明各个方面的具有无声会话功能的非限制性的示范的移动通信设备300的示意图。例如但不限于,示范移动通信设备300可共有图2所示的及上述的示范移动通信设备200的各种功能特征。又如,移动通信设备300可共有图1所示的示范方法100以及上述的各种功能特征。
示范移动通信设备300可包括无线前端305和/或有线/带缆前端306。无线前端305和有线/带缆前端306被通信地连接到通信接口模块310。示范移动通信设备300示出一组非限制性的示范通信接口模块310集合,包括蓝牙接口模块、IEEE 802.11接口模块、IEEE 802.15接口模块、GSM/GPRS/EDGE接口模块、CDMA/WCDMA接口模块、TDMA/PDC接口模块、调制解调模块、USB模块、火线模块和存储器接口模块(如,用于与片外或可移动存储器接口连接)。例如但不限于,无线前端305、有线/带缆前端306和通信接口模块310可共有图2所示的以及上述的示范移动通信设备200的通信接口模块210(如,包括第一通信接口模块212和第二通信接口模块214)的各种功能特征。
示范移动通信设备300可包括任何的用户接口模块330。例如但不限于,用户接口模块330可共有图2所示的以及上述的示范移动通信设备200各种功能特征。示范移动通信设备300示出了一组非限制型的示范用户接口模块(或子模块)集合。例如,用户接口模块330可包括任何的视频/图像处理模块、音频处理模块、触觉信号(tactile signal)处理模块。例如,移动通信设备300可包括对应于各种用户接口模块330的兼容用户接口设备(如视频显示器、照相机、扬声器、麦克风、触摸屏、键盘、振动器等)。
所示的示范移动通信设备300具有一组非限制的示范信号处理模块,可根据当前的信号处理需要对其进行选择使用。例如,所述信号处理模块315可包括各种视频、音频、文字和触觉信号处理模块。例如,所述信号处理模块315通常包括处理移动通信设备300的前端305、306、通信接口模块310以及移动通信设备300的用户接口模块330之间传送的信息。
示范移动通信设备300可包括通用处理器320(和/或数字信号处理器)和板载存储器340。通用处理器320可以是基带处理器,其和存储器340能执行移动通信设备300的任何操作任务。例如但不限于,通用处理器320和存储器340可共有图2所示的以及上述的示范移动通信设备200的操作控制模块220和存储器240的各种功能特征。
示范移动通信设备300用于对本发明一般更宽范围进行说明。因此,本发明各个方面的范围不局限于示范移动通信设备300的特征。
要说明的是,上述示范移动通信设备200、300的各种模块可以通过硬件、软件,或者软、硬件结合来实现。而且,各种模块可共享部分硬件和软件。例如,第一和第二模块可共享一个或多个硬件组件和/或一个或多个软件程序。因此,本发明各个方面的范围不局限于实现各种模块的任何特定硬件或软件的特征以及各种模块之间的任何硬件和软件边界。
另外,示范移动通信设备200、300的各种模块可以各种集成程度实现。例如但不限于,可将所有的模块集成到单个芯片上。又如,可在单个电路板的不同芯片上实现各种模块。因此,本发明各个方面的范围不局限于各种模块的任何特定的实现以及集成水平的特征。
图4是根据本发明各个方面的具有无声会话功能的移动通信设备的非限制性的示范开关和/或混合器部分400的示意图。例如但不限于,开关和/或混合器部分400可共有图2所示的以及上述的示范移动通信设备200的组件的各种功能特征。
例如,麦克风410、放大器420和模拟-数字转换器(ADC)430可共有示范移动通信设备200的用户接口模块230的各种特征。又如,语音产生器440可共有示范移动通信设备200的语音信息产生模块224各种特征。再如,数字开关(或混合器)450和数字语音处理器460可共有示范移动通信设备200的通用通信控制模块222的各种特征。
在一非局限性的示范方案中,模拟音频信息由麦克风410产生,经放大器420放大,经ADC 430数字化,数字化的音频信号被传送给数字开关(或混合器)450。语音产生器440可(如,通过播放预录制的语音信息或通过合成语音信息)产生数字化语音信号并将所产生的数字语音信号提供给数字开关(或混合器)450。在第一个例子中,数字开关450可选择数字音频信号(audiosignal)或数字语音信号(voice signal),并将所选择的信号传送给数字语音处理器460以进行进一步的处理(如,用于与其他通信设备通信)。在第二个例子中,数字开关(混合器)450混合数字音频信号和数字语音信号,并将混合后的信号传送给数字语音处理器460以进行进一步的处理(如,用于与其他通信设备通信)。
图5是根据本发明各个方面的具有无声会话功能的移动通信设备的非限制性的示范开关和/或混合器部分500的示意图。例如但不限于,开关和/或混合器部分500的各组件可共有图2所示的以及上述的示范移动通信设备200的组件的各种功能特征。
例如,麦克风510、放大器520可共有示范移动通信设备200的用户接口模块230的各种特征。又如,语音产生器540和数字-模拟转换器(DAC)545可共有示范移动通信设备200的语音信息产生模块224各种特征。再如,模拟开关(或混合器)550、ADC 555和数字语音处理器560可共有示范移动通信设备200的通用通信控制模块222的各种特征。
在一非局限性的示范方案中,模拟音频信息由麦克风510产生,经放大器520放大,然后被传送给模拟开关(或混合器)550。语音产生器540可(如,通过播放预录制的语音信息或通过合成语音信息)产生数字语音信号,该数字语音信号被DAC 545转换,然后提供给模拟开关(或混合器)550。在第一个例子中,模拟开关550可选择模拟音频信号(audio signal)或模拟语音信号(voice signal),ADC 555将所选择的信号数字化,该数字化的信号被传送给数字语音处理器560以进行进一步的处理(如,用于与其他通信设备通信)。在第二个例子中,模拟混合器550混合模拟音频信号和模拟语音信号,并将数字化的混合模拟信号传送给数字语音处理器560以进行进一步的处理(如,用于与其他通信设备通信)。
图6是根据本发明各个方面的具有无声会话功能的移动通信设备的非限制性的示范音频输出部分600的示意图。例如但不限于,音频输出部分600的各种组件可共有图2所示的和是上述的示范移动通信设备200的组件的各种特征。
例如,数字语音处理器610可共有示范移动通信设备200的通用通信控制模块222的各种特征。又如,语音产生器620可共有示范移动通信设备200的语音信息产生模块224的各种特征。再如,数字混合器630和DAC 640可共有示范移动通信设备200的通用通信控制模块222的各种特征。又如,放大器650和扬声器660可共有示范移动通信设备200的用户接口模块230的各种特征。
在一非局限性的示范方案中,自其他通信设备接收的数字音频信息经数字语音处理器610处理,传送给数字混合器630。另外,语音产生器620可(如,通过播放预录制的语音信息或通过合成语音信息)产生数字语音信号,并将所产生的数字语音信号传送给数字混合器630。例如,接着,数字混合器630可将数字音频信息和该数字语音信号混合,并将混合后的数字信号输出给DAC640。然后DAC 640将混合后的数字信号转换成混合模拟信号,该混合模拟信号经放大器650放大并通过扬声器660输出给用户。
图7是根据本发明各个方面的具有无声会话功能的移动通信设备的非限制性的示范音频输出部分700的示意图。例如但不限于,音频输出部分700的各种组件可共有图2所示的和是上述的示范移动通信设备200的组件的各种特征。
例如,数字语音处理器710和DAC 715可共有示范移动通信设备200的通用通信控制模块222的各种特征。又如,语音产生器720和DAC 725可共有示范移动通信设备200的语音信息产生模块224各种特征。再如,模拟混合器730可共有示范移动通信设备200的通用通信控制模块222的各种特征。又如,放大器750和扬声器760可共有示范移动通信设备200的用户接口模块230的各种特征。
在一非局限性的示范方案中,自其他通信设备接收的数字音频信息经数字语音处理器710处理,被DAC 715转换成模拟音频信号并传送给模拟混合器730。另外,语音产生器720可(如,通过播放预录制的语音信息或通过合成语音信息)产生数字语音信号,所产生的数字语音信号被DAC 725转换成模拟语音信号并传送给模拟混合器730。例如,接着,模拟混合器730可将模拟音频信息和该模拟语音信号混合,并将混合后的模拟信号输出给放大器750,放大后混的模拟信号再输出到扬声器760,以向用户放送。
图4-7所示的示范移动通信设备的部分400、500、600和700用于对本发明一般更宽的方面提供说明。因此,本发明各个方面的范围不局限于示范移动通信设备的部分400、500、600和700的特征。
总而言之,本发明的各个方面提供一种在移动通信设备上提供无声会话功能的系统和方法。虽然本发明是通过一些实施例进行描述的,本领域技术人员知悉,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本申请的权利要求范围内的实施例都属于本发明的保护范围。
权利要求
1.一种在移动通信设备中进行语音通信的方法,该方法包括建立与第二通信设备通信的无线通信链路;接收用户输入;至少部分地基于所接收的用户输入从多个语音信息中确定一个语音信息;和将所确定的语音信息通过所建立的无线通信链路传送给第二通信设备。
2.根据权利要求1所述的方法,其特征在于所述移动通信设备包括蜂窝电话;和所述建立与第二通信设备通信的无线通信链路包括在所述移动通信设备与所述第二通信设备之间建立蜂窝通信链路。
3.根据权利要求1所述的方法,其特征在于,所述接收用户输入包括接收按键输入。
4.根据权利要求1所述的方法,其特征在于,所述方法还包括产生用于显示一组语音信息的可视输出,其中,所述接收用户输入包括接收指示用户选择了该组语音信息中的一个特定语音信息的用户输入。
5.根据权利要求1所述的方法,其特征在于,所述确定语音信息包括至少部分地基于用户输入从多个预录制的语音信息中选择语音信息。
6.根据权利要求5所述的方法,其特征在于,所述多个预录制的语音信息包括预录制的用户真人语音信息。
7.一种移动通信设备,包括用于与第二通信设备建立无线通信链路的通信接口模块;用于接收用户输入的用户接口模块;通信地连接到所述通信接口模块和用户接口模块的至少一个模块,其用于使用所述通信接口模块与第二通信设备建立无线通信链路;至少部分地基于通过所述用户接口模块接收的用户输入从多个语音信息中确定语音信息;和使用所述通信接口模块将所确定的语音信息通过所建立的通信链路传送给第二通信设备。
8.根据权利要求7所述的移动通信设备,其特征在于所述通信接口模块包括蜂窝电话收发器模块;和所述通信链路包括蜂窝电话通信链路。
9.根据权利要求7所述的移动通信设备,其特征在于,所述通过用户接口模块接收的用户输入包括按键输入。
10.根据权利要求7所述的移动通信设备,其特征在于,所述至少一个模块用于利用用户接口模块进行以下操作产生用于显示一组语音信息的可视输出;和接收指示用户选择了该组语音信息中的一个特定语音信息的用户输入。
全文摘要
本发明涉及一种在移动通信设备中提供无声通信功能的系统和方法。本发明的各方面包括在所述移动通信设备与第二通信设备之间建立无线通信链路。该移动通信设备接收用户输入。至少部分地基于所接收的用户输入从多个语音信息中确定一个语音信息。例如,这种确定包括从多个预录制的语音信息中选择一个语音信息和/或确定一个将要合成的语音信息。然后将所确定的语音信息传送给第二通信设备。例如,以所述移动通信设备附近的人听不到所确定的语音信息的方式,将所确定的语音信息发送给第二通信设备。
文档编号H04Q7/38GK1878415SQ20061009151
公开日2006年12月13日 申请日期2006年6月6日 优先权日2005年6月7日
发明者罗辉 申请人:美国博通公司