交互服务器及用于控制服务器的方法

文档序号:10579036阅读:421来源:国知局
交互服务器及用于控制服务器的方法
【专利摘要】提供一种交互服务器及其控制方法。控制交互服务器的方法包括:从用户终端接收与用户语音相对应的数据,确定用户语音的表达类型,响应于确定用户语音的表达类型是集成表达类型,生成响应于用户语音的搜索响应和聊天响应,并通过组合所生成的搜索响应和所生成的聊天响应来生成集成响应,以及向用户终端发送生成的集成响应。
【专利说明】
交互服务器及用于控制服务器的方法
技术领域
[0001]符合示例实施例的装置和方法涉及交互服务器和用于控制交互服务器的方法,并更具体地涉及响应于输入用户语音通过组合搜索响应和聊天响应来提供组合响应的交互服务器,以及控制交互服务器的方法。
【背景技术】
[0002]近来,提供了一种主动提供对用户语音的响应的交互系统。具体地,如果用户终端识别用户语音并向外部交互服务器发送识别的用户语音,交互服务器确定用户语音的表达类型,根据表达类型生成响应,并向用户终端发送响应。
[0003]例如,如果输入了用户语音“请推荐恐怖电影”,则交互服务器可以确定用户语音的表达类型是搜索表达类型并响应于用户语音向用户终端发送搜索响应“找到了 17个恐怖电影”。在另一示例中,如果输入了用户语音“我很饿”,则交互服务器可以确定用户语音的表达类型是聊天表达类型并响应于用户语音向用户终端发送搜索响应“我也在节食”。
[0004]S卩,相关技术交互系统仅输出关于用户语音的搜索响应和聊天响应之一。然而,可能存在难于确定用户语音是搜索表达类型还是聊天表达类型的情况。在这种情况下,可以响应于具有类似含义的一些用户表达输出搜索响应,并且可以响应于其他用户表达输出聊天响应,导致用户体验的不一致。

【发明内容】

[0005]问题的解决方案
[0006]—个或更多个示例实施例涉及当难于确定用户语音的表达类型时能够提供将搜索响应与聊天响应相组合的响应的交互服务器及其控制方法。
[0007]根据示例实施例的一方面,提供了一种控制交互服务器的方法,包括:接收与用户语音相对应的数据;确定用户语音的表达类型;响应于确定用户语音的表达类型是集成表达类型,生成响应于用户语音的搜索响应和聊天响应,并通过组合所生成的搜索响应和所生成的聊天响应来生成集成响应,以及向用户终端发送所生成的集成响应。
[0008]确定所述用户语音的表达类型可以包括:使用基于搜索表达建立的搜索语言模型来计算用户语音的表达类型是搜索表达类型的概率;以及使用基于聊天表达建立的聊天语言模型来计算用户语音的表达类型是聊天表达类型的概,计算用户语音的表达类型是搜索表达类型的概率与用户语音的表达类型是聊天表达类型的概率之间的差异值,以及响应于差异值小于预定值,确定用户语音的表达类型是集成表达类型。
[0009]确定用户语音的表达类型还可以包括:响应于差异值超过预定值,当用户语音的表达类型是搜索表达类型的概率大于用户语音是聊天表达类型的概率时,确定用户语音是搜索表达类型,以及当用户语音的表达类型是搜索表达类型的概率小于用户语音是聊天表达类型的概率时,确定用户语音是聊天表达类型。
[0010]所述方法可以包括:响应于确定用户语音的表达类型是搜索表达类型,生成对用户语音的搜索响应,以及响应于确定用户语音的表达类型是搜索表达类型,生成对用户语音的搜索响应,并向用户终端发送响应于用户语音生成的搜索响应和聊天响应之一。
[0011]所述生成可以包括:响应于用户语音生成搜索响应和聊天响应,通过确定搜索响应和聊天响应的语句类型以及是否包括公共信息,确定是否可能对搜索响应和聊天响应进行组合,当对搜索响应和聊天响应进行组合是可能的时,确定搜索响应和聊天响应的组合顺序,以将搜索响应与聊天响应组合,修改搜索响应和聊天响应中的至少一个,以及根据所确定的组合顺序,对经过修改的搜索响应和聊天响应进行组合。
[0012]所述方法可以包括:当对搜索响应与聊天响应进行组合是不可能的时,发送搜索响应和聊天响应之一。
[0013]所述确定组合顺序可以包括:通过比较用户语音的表达类型是聊天表达类型的概率与用户语音的表达类型是搜索表达类型的概率来确定搜索响应和聊天响应的组合顺序。
[0014]所述修改可以包括修改搜索响应和聊天响应中的至少一个的结尾。
[0015]根据另一示例实施例的一方面,提供了一种交互服务器,包括:输入单元,被配置为从用户终端接收与用户语音相对应的数据;确定器,被配置为响应于通过输入单元输入用户语音,确定用户语音的表达类型;响应生成器,被配置为响应于确定用户语音的表达类型是集成表达类型,生成响应于用户语音的搜索响应和聊天响应,并通过组合所生成的搜索响应和所生成的聊天响应来生成集成响应;以及发射机,被配置为向用户终端发送所生成的集成响应。
[0016]所述确定器可以包括:概率计算器,被配置为使用基于搜索表达建立的搜索语言模型计算用户语音的表达类型是搜索表达类型的概率,并使用基于聊天表达建立的聊天语言模型计算用户语音的表达类型是聊天表达类型的概率;差异计算器,被配置为计算用户语音的表达类型是搜索表达类型的概率与用户语音的表达类型是聊天表达类型的概率之间的差异值,以及表达类型确定器,被配置为响应于差异值小于预定值,确定用户语音是集成表达类型。
[0017]所述表达类型确定器:响应于差异值超过预定值,当用户语音的表达类型是搜索表达类型的概率小于用户语音的表达类型是聊天表达类型的概率时,可以确定用户语音的表达类型是搜索表达类型;以及当用户语音的表达类型是搜索表达类型的概率大于用户语音的表达类型是聊天表达类型的概率时,可以确定用户语音的表达类型是聊天表达类型。
[0018]响应于确定用户语音的表达类型是搜索表达类型,所述响应生成器可以生成对用户语音的搜索响应,以及响应于确定用户语音的表达类型是聊天表达类型,所述响应生成器可以生成对用户语音的聊天响应。发射机可以向用户终端发送响应于用户语音所生成的搜索响应和生成的聊天响应之一。
[0019]所述响应生成器可以包括:搜索响应生成器,被配置为生成对用户语音的搜索响应;聊天响应生成器,被配置为生成对用户语音的聊天响应;组合确定器,被配置为通过确定搜索响应和聊天响应的语句类型以及在搜索响应和聊天响应中是否包括公共信息确定是否可能对搜索响应和聊天响应进行组合;组合顺序确定器,被配置为当组合搜索响应和聊天响应是可能的时,确定搜索响应和聊天响应的组合顺序;响应修改器被配置为:为了组合搜索响应和聊天响应,修改搜索响应和聊天响应中的至少一个;以及响应组合器,被配置为根据所确定的组合顺序对经过修改的搜索响应和聊天响应进行组合。
[0020]当对搜索响应与聊天响应进行组合是不可能的时,发射机可以发送搜索响应和聊天响应之一。
[0021]组合顺序确定器可以:通过比较用户语音的表达类型是聊天表达类型的概率与用户语音的表达类型是搜索表达类型的概率,确定搜索响应和聊天响应的组合顺序。
[0022 ]响应修改器可以修改搜索响应和聊天响应中的至少一个的结尾。
[0023]根据另一示例实施例的一方面,提供了一种控制交互服务器的方法,包括:接收用户语音;生成响应于用户语音的搜索响应和聊天响应;确定用户语音的表达类型;响应于确定用户语音的表达类型是集成表达类型,通过组合所生成的搜索响应和所生成的聊天响应来生成集成响应;以及向用户终端发送所生成的集成响应。
[0024]根据示例实施例的交互服务器包括:输入单元,被配置为从用户终端接收用户语音;响应生成器,被配置为生成响应于用户语音的搜索响应和聊天响应;确定器,被配置为确定用户语音的表达类型;集成响应生成器,被配置为响应于确定用户语音的表达类型是集成表达类型,通过组合所生成的搜索响应与所生成的聊天响应来生成集成响应,以及发射机,被配置为向用户终端所发送生成的集成响应。
[0025]发明的有益效果
[0026]根据示例实施例,当用户语音的表达类型模糊不清时,可以提供组合了搜索响应和聊天响应的集成响应,并且因此可以为用户提供一致的交互服务。
【附图说明】
[0027]通过参照附图描述特定示例性实施例,上述和/或其他方面将更加显然,在附图中:
[0028]图1是示出了根据示例实施例的交互系统的视图;
[0029]图2是示出了根据示例实施例的交互服务器的配置的框图;
[0030]图3是示出了根据示例实施例的图2的确定器的配置的框图;
[0031]图4是示出了根据示例实施例的图2的语音生成器的配置的框图;
[0032]图5是用于解释根据示例实施例的控制交互服务器的方法的流程图;
[0033]图6是用于解释根据示例实施例的确定用户语音的表达类型的方法的流程图;
[0034]图7是用于解释根据示例实施例的生成集成响应的方法的流程图;
[0035]图8是说明了根据另一示例实施例的交互服务器的配置的框图;以及
[0036]图9是用于解释根据另一示例实施例的控制交互服务器的方法的流程图。
【具体实施方式】
[0037]在以下的描述中,不同附图中所示出的相同附图标记表示类似的部件。在描述中定义的事项(例如,详细的构造和要素)被提供以辅助对示例性实施例的全面理解。因此,清楚的是可以实现示例性实施例而不需要那些具体定义的事项。此外,不详细描述相关领域熟知的功能或要素,因为它们将可能用不必要的细节使示例实施例不够突出。
[0038]在本公开中,例如第一和第二的关系术语可以用于将一个实体与另一个实体区分开,而不必须暗示这些实体之间的任何实际关系或顺序。
[0039]以下说明中使用的术语用于解释具体的示例性实施例,而并非意在限制权利范围。单个术语包括复数形式,除非有意那样写。说明书的术语“包括”、“包含”、“被配置为”等用于指示存在特征、编号、步骤、操作、元素、部分及其组合,并且它们不应当排除一个或更多个特征、编号、步骤、操作、元素、部分及其组合的组合或添加的可能性。
[0040]在示例实施例中,“模块”或“单元”执行至少一个功能或操作,并可以实现为硬件、软件或者硬件与软件的组合。此外,除应当用特定硬件实现的“模块”或“单元”以外,多个“模块”或多个“单元”可以被集成到至少一个模块中并且可以实现为至少一个处理器(未示出)。
[0041]根据以下结合附图对实施例的描述,以上特征和/或其他方面和优点将变得更加清楚并且更易于理解,其中:
[0042]图1是示出了根据示例性实施例的交互系统的视图。如图1所示,交互系统1包括交互服务器100和用户终端200。在这种情况下,用户终端200可以被实现为图1中所述的智能电视,但这仅是一个示例。用户终端200可以被实现为各种移动或固定的用户终端,例如智能电话、平板个人计算机(PC)、笔记本PC、台式PC等。
[0043]用户终端200接收输入的用户语音。后续地,用户终端200针对输入用户语音执行语音识别,并获得用户语音的相应文本数据。在这种情况下,用户终端200可以针对直接输入的用户语音执行语音识别,但这仅是一个示例。用户终端200可以使用外部服务器执行语音识别。具体地,用户终端200可以向外部语音识别服务器发送与输入用户语音相对应的语音数据,外部语音识别服务器通过针对输入语音数据执行语音识别来生成文本数据并向用户终端200发送文本数据。此外,根据另一示例实施例,用户终端200可以向交互服务器100发送与用户语音相对应的语音数据,并直接执行语音识别。
[0044]用户终端200向交互服务器100发送与输入用户语音相对应的文本数据。
[0045]交互服务器100使用与输入用户语音相对应的文本数据来确定用户语音的表达类型。在这种情况下,用户语音的表达类型可以包括搜索表达类型、聊天表达类型和集成表达类型。
[0046]具体地,交互服务器100可以使用基于搜索表达建立的搜索语言模型来计算用户语音是搜索表达类型的概率,并使用基于聊天表达建立的聊天语言模型来计算用户语音是聊天的聊天表达类型的概率。后续地,交互服务器100计算用户语音是搜索表达类型的概率和用户语音是聊天表达类型的概率之间的差异值。如果差异值小于预定值,即如果难以确定用户语音是搜索表达类型还是聊天表达类型,则交互服务器100可以确定用户语音是集成表达类型。然而,如果差异值超过预定值,并且用户语音是搜索表达类型的概率大于用户语音是聊天表达类型的概率,则交互服务器100可以确定用户语音是搜索表达类型;以及如果用户语音是搜索表达类型的概率小于用户语音是聊天表达类型的概率,则交互服务器100可以确定用户语音是聊天表达类型。
[0047]如果确定用户语音的表达类型是搜索表达类型,则交互服务器100生成对用户语音的搜索响应,并且如果确定用户的表达类型是聊天表达类型,则交互服务器100可以生成对用户语音的聊天响应。交互服务器100可以向用户终端200发送生成的搜索响应和聊天响应之一O
[0048]备选地,如果确定用户语音的表达类型是集成表达类型,则交互服务器100可以对用户语音生成搜索响应和聊天响应,并通过组合所生成的搜索响应和聊天响应来生成集成响应。
[0049]具体地,如果确定用户语音的表达类型是集成表达类型,则交互服务器100可以针对用户语音生成搜索响应和聊天响应二者。后续地,交互服务器100可以通过确定搜索响应和聊天响应的语句类型以及是否包括公共信息,来确定对搜索响应和聊天响应进行组合是否是可能的。例如,如果搜索响应和聊天响应均是陈述句,则交互服务器100可以确定组合两个响应是不可能的。如果对搜索响应和聊天响应进行组合是可能的,则交互服务器100可以确定搜索响应和聊天响应的组合顺序,并可以修改搜索响应和聊天响应的至少一个以组合两个响应。后续地,交互服务器100可以通过根据确定的顺序组合经过修改的搜索响应和聊天响应来生成集成的响应。交互服务器100可以向用户终端200发送生成的集成响应。
[0050]用户终端200可以向从交互服务器100发送的用户语音输出搜索响应、聊天响应和集成响应之一。
[0051]根据上述交互系统10,如果用户语音表达类型模糊,则提供组合了搜索响应和聊天响应的集成响应,因此可以为用户提供一致的交互服务。
[0052]在以上示例实施例中,交互服务器100确定用户语音的表达类型,并且然后生成与表达相对应的响应,但这仅是一个示例。交互服务器100可以生成对用户命令的搜索响应和聊天响应二者,确定表达类型,并且然后基于确定的表达类型向用户终端200发送对用户语音的响应。
[0053]下文中,将参照图2至4更详细地描述交互服务器100。图2是示出了根据示例实施例的交互服务器100的配置的框图。如图2中所示,交互服务器100包括输入单元110、确定器120、响应生成器130、发射机140、搜索语言模型150和聊天语言模型160。
[0054]输入单元110从用户终端200接收用户语音。在这种情况下,输入单元110可以接收文本数据形式的用户语音,但这仅是一个示例。输入单元110可以接收采用语音数据形式的用户语音。如果输入了采用语音数据形式的用户语音,则输入单元110可以通过针对用户语音执行用户识别来提取文本数据。
[0055]确定器120使用搜索语言模型150和聊天语言模型160确定用户语音的表达类型。在这种情况下,通过使用由收集的搜索表达组成的语料(corpus)生成搜索语言模型150,并通过使用由收集的聊天表达组成的语料生成聊天语言模型160。
[0056]例如,如果输入用户语音“我们打算观看哪个恐怖电影?”和“提供美味食物的附近餐馆”,则确定器120可以确定用户语音是搜索表达类型,以及如果输入用户语音“我漂亮吗?”和“我感觉很郁闷”,则确定器120可以确定用户语音是聊天表达类型。备选地,如果输入用户语音“我喜欢恐怖电影”或“今天天气很好”,则确定器120可以确定用户语音是集成表达类型。
[0057]将参照图3描述确定器120确定用户语音的表达类型的详细方法。具体地,确定器120可以包括概率计算器121、差异值计算器120和表达类型确定器125。
[0058]概率计算器121可以使用搜索语言模型150计算用户语音是搜索表达类型的概率(LA(S)),并可以使用聊天语言模型160计算用户语音是聊天表达类型的概率(LB(S))。在这种情况下,用户语音是搜索表达类型的概率(LA(S))指在搜索语言模型150中存在与用户语音相对应的文本数据的概率,并且用户语音是聊天表达类型的概率(LB(S))指在聊天语言模型160中存在与用户语音相对应的文本数据的概率。
[0059]差异值确定器123可以使用以下式I来计算用户语音是搜索表达类型的概率(LA
(S))与用户语音是聊天表达类型的概率(LB(S))之间的差异值。
[0060][式I]
[0061]f(s)= ILa(S)-Lb(S)
[0062]表达类型确定器125可以使用用户语音是搜索表达类型的概率(LA(S))、用户语音是聊天表达类型的概率(LB(S))和两个概率之间的差异值来确定用户语音的表达类型。在这种情况下,表达类型可以包括搜索表达类型、聊天表达类型和集成的表达类型。当难于确定用户语音是聊天表达类型还是搜索表达类型时,集成表达类型通过组合聊天响应和搜索响应来提供集成的响应。
[0063]首先,表达类型确定器125可以通过比较差异值与以下式2中示出的预定值(Θ)来确定用户语音是搜索表达类型的概率与用户语音是聊天表达类型概率之间的差异值。
[0064][式2]
[0065]f(s)〈 = 9:集成表达类型
[0066]f (S) >θ:搜索表达类型或聊天表达类型
[0067]S卩,如果差异值小于预定值(Θ),则表达类型确定器125可以确定用户语音是集成表达类型,并且如果差异值超出预定值(Θ),则表达类型确定器125可以确定用户语音是聊天表达类型或搜索表达类型。
[0068]具体地,如以下式3所示,如果差异值超过预定值(Θ),并且用户语音是搜索表达类型的概率(LA(S))大于用户语音是聊天表达类型的概率(LB(S)),则表达类型确定器125可以确定用户语音的表达类型是搜索表达类型,并且如果用户语音是搜索表达类型的概率(LA(S))小于用户语音是聊天表达类型的概率(LB(S)),则表达类型确定器125可以确定用户语音是聊天表达类型。
[0069][式3]
[0070]La(S) >Lb(S):搜索表达类型
[0071]La(S)〈Lb(S):聊天表达类型
[0072]可以由系统开发商任意地设置预定值(Θ),但这仅是一个示例。可以基于测试语句计算预定值(Θ)。为了基于测试语句设置预定值(Θ),可以设置不对模糊语句进行归类并仅基于信息搜索表达和聊天表达对语句进行归类的归类器。在这种情况下,当(l)f(S)大于或等于O时,归类器可以将语句归类为信息搜索表达,并且当(2)f (S)小于O时,归类器可以将语句归类为聊天表达。将N个测试语句输入到表达类型归类器中,并收集发生表达类型中归类错误的测试语句的语言模型分数。可以通过计算错误发生的语句的均值(m)和f(S)的标准差(σ)来计算预定值(Θ)。
[0073]再次参照图2,确定器120可以向响应生成器130输出关于确定的用户语音表达类型的信息。
[0074]响应生成器130可以根据用户语音的所确定的表达类型生成并输出搜索响应、聊天响应和集成响应的至少一个。具体地,如果确定用户语音是搜索表达类型,则响应生成器130可以生成对用户语音的搜索响应。如果确定用户语音是聊天表达类型,则响应生成器130可以生成对用户语音的聊天响应。如果确定用户语音是集成表达类型,则响应生成器130可以生成对用户语音的集成响应。
[0075]以下,将参考图4更详细描述响应生成器130。如图中所示4,响应生成器130包括搜索响应生成器131、聊天响应生成器132、组合确定器133、组合顺序确定器134、响应修改器135和响应组合器136。
[0076]如果确定用户语音是搜索表达类型或集成表达类型,则搜索响应生成器131可以生成对用户语音的搜索响应。例如,如果输入了搜索表达类型的用户语音“我们要看什么恐怖电影?”,则搜索响应生成器131可以响应于用户语音生成搜索响应“找到10个推荐的恐怖电影”,并且如果输入集成表达类型的用户语音“今天天气很好”,则搜索响应生成器131可以生成搜索响应“今天天气晴朗,并且下午高温将是25°C”。
[0077]具体地,如果用户语音是搜索表达类型,则搜索响应生成器131可以直接向发射机140输出所生成的搜索响应,并且如果用户语音是集成表达类型,则搜索响应生成器131可以向组合确定器133输出所生成的搜索响应。
[0078]如果确定用户语音是聊天表达类型或集成表达类型,则聊天响应生成器132可以生成对用户语音的聊天响应。例如,如果输入聊天表达类型的用户语音“我漂亮吗?”,则聊天响应生成器132可以响应于用户语音生成聊天响应“你看起来真漂亮”。备选地,如果输入了集成表达类型的用户语音“今天天气真好”,则聊天响应生成器132可以生成聊天响应“今天天气真好”。
[0079]具体地,如果用户语音是聊天表达类型,则聊天响应生成器132可以直接向发射机140输出所生成的搜索响应,并且如果用户语音是集成表达类型,则聊天响应生成器132可以向组合确定器133输出所生成的聊天响应。
[0080]组合确定器133可以确定对分别从搜索响应生成器131和聊天响应生成器132输出的搜索响应和聊天响应进行组合是否可能。具体地,组合确定器133可以基于搜索响应和聊天响应的语句类型、是否包括公共信息、是否生成搜索响应和聊天响应等确定是否可以组合响应。例如,如果输入了集成表达类型的用户语音“你叫什么名字”,则搜索响应生成器131可以生成搜索响应“当前广播的节目是‘无限挑战’”,而聊天响应生成器132可以生成聊天响应“我的名字是智能电视”。在这种情况下,生成的搜索响应和聊天响应二者均是陈述句,并且不存在公共信息,因此,组合确定器133可以确定对响应进行组合是不可能的。在另一示例中,如果没有生成搜索响应和聊天响应之一,则尽管用户语音是集成表达类型,组合确定器133也可以确定对搜索响应和聊天响应进行组合是不可能的。
[0081]如果确定搜索响应和聊天响应的组合是不可能的,则组合确定器133可以向发射机140输出生成的搜索响应生成的聊天响应之一。例如,如果输入了集成表达类型的用户语音“你叫什么名字”,则组合确定器133可以确定不可以组合搜索响应和聊天响应,并可以仅向发射机140输出聊天响应“我的名字是智能电视”。
[0082]如果确定组合是可能的,则组合确定器133可以向组合顺序确定器134输出所生成的搜索响应和所生成的聊天响应。
[0083]组合顺序确定器134可以确定搜索响应和聊天响应的组合顺序。在这种情况下,组合顺序确定器134可以通过比较用户语音是聊天表达类型的概率与用户语音是搜索表达类型的概率来确定搜索响应和聊天响应的组合顺序。即,如果用户语音是聊天表达类型的概率大于用户语音是搜索表达类型的概率,则组合顺序确定器134可以将聊天表达类型放在搜索表达类型之前,以及如果用户语音是搜索表达类型的概率大于用户语音是聊天表达类型的概率,则组合顺序确定器134可以将搜索表达类型放在聊天表达类型之前,例如,如果输入集成表达类型的用户语音“我喜欢恐怖电影”,则搜索响应生成器131可以生成搜索响应“找到共10个恐怖电影”,并且聊天响应生成器132可以生成聊天响应“我也喜欢恐怖电影”。在这种情况下,如果用户语音是聊天表达类型的概率大于用户语音是搜索表达类型的概率,则组合顺序确定器134可以确定组合顺序,使得聊天响应在搜索响应之前。
[0084]然而,如上所述通过比较概率确定组合顺序仅是一个示例,并且可以根据用户设置将聊天响应和搜索响应之一放在第一位。
[0085]响应修改器135可以修改搜索响应和聊天响应之一,使得可以组合搜索响应和聊天响应。具体地,响应修改器135可以修改搜索响应和聊天响应的至少一个的结尾。例如,如果输入了集成表达类型的用户语音“我喜欢恐怖电影”,则搜索响应生成器131可以生成搜索响应“找到共10个恐怖电影”,并且聊天响应生成器132可以生成聊天响应“我也喜欢恐怖电影” ο在这种情况下,响应修改器135可以改变搜索响应的结尾,使得聊天响应和搜索响应的结尾可以彼此一致。在另一示例中,响应修改器135可以在聊天响应和搜索响应之间放置连词。
[0086]响应组合器136可以对根据组合顺序确定器134确定组合顺序修改的聊天响应和搜索响应来生成集成响应。例如,如果输入了集成表达类型的用户语音“我喜欢恐怖电影”,则搜索响应生成器131可以生成搜索响应“找到共10个恐怖电影”,并且聊天响应生成器132可以生成聊天响应“我也喜欢恐怖电影”。后续地,组合顺序确定器134可以确定组合顺序,使得聊天响应在搜索响应之前,并修改搜索响应的结尾。因此,作为用户语音的响应,响应组合器136可以生成集成响应“我也喜欢恐怖电影。找到了共10个恐怖电影”。
[0087 ]再次参照图2,响应生成器130向发射机140输出生成的响应。
[0088]发射机140再次向用户终端200发送生成的响应。
[0089]输入单元110和发射机140可以使用各种通信网络向用户终端200发送用户语音并从用户终端200接收生成的响应。例如,输入单元110和发射机140可以通过各种通信网络(例如2G(第二代)网络、4G(第四代)网络、B4G(超4G)网络、5G(第5代)网络、W1-Fi网络、IP(互联网协议)网络、终端之间的直接通信网络等)执行与用户终端200的通信。
[0090]用户终端200可以输出从发射机140发送的响应。在这种情况下,用户终端200可以向用户语音显示视觉响应,并可以通过扬声器输出音频响应。
[0091]根据上述交互服务器100,当用户语音表达类型模糊时,可以提供对搜索响应和聊天响应进行组合的组合响应。因此,用户可以享受到一致的交互服务。
[0092]下文将参照图5至7描述用于控制交互服务器100的方法。图5是用于解释根据示例实施例的控制交互服务器100的方法的流程图。
[0093]首先,交互服务器100接收向用户终端输入的用户语音(S505)。在这种情况下,用户语音可以采用文本数据形式,但这仅是一个示例。用户语音可以采用语音数据的形式。如果用户语音是语音数据的形式,则交互服务器100可以通过执行语音识别生成与用户语音相对应的文本数据。
[0094]后续地,交互服务器100确定用户语音的表达类型(S510)。在这种情况下,交互服务器100可以使用搜索语言模型150和聊天语言模型160确定用户语音的表达类型。
[0095]如果用户语音是集成表达类型(S515-Y),则交互服务器100生成搜索响应和聊天响应,并通过组合搜索响应和聊天响应生成集成响应(S520)。具体地,交互服务器100可以响应于用户语音生成搜索响应和聊天响应二者,并确定是否可以对搜索响应和聊天响应进行组合。如果可以组合搜索响应和聊天响应,则交互服务器100可以确定搜索响应和聊天响应的组合顺序,确定是否为了进行组合而修改搜索响应和聊天响应,并根据确定的组合顺序通过对经过修改的搜索响应和聊天响应进行组合来生成集成响应。
[0096]后续地,交互服务器100向用户终端200发送集成响应(S525)。
[0097]如果确定用户语音不是集成表达类型(S515-N)而是搜索表达类型(S530-Y),则交互服务器100生成搜索响应(S535),并向用户终端200发送生成的搜索响应(S540)。
[0098]如果确定用户语音不是集成表达类型(S515-N)并且也不属于搜索表达类型(S530-N),则交互服务器100确定用户语音的表达类型是聊天表达类型(S545),生成聊天响应(S550),并向用户终端200发送生成的聊天响应(S555)。
[0099]图6是用于解释根据示例实施例的确定交互服务器100的用户语音表达类型的方法的流程图。
[0100]首先,交互服务器100计算用户语音是搜索表达类型的概率和用户语音是聊天表达类型的概率(S610)。具体地,交互服务器100可以使用基于搜索表达建立的搜索语言模型150来计算用户语音的表达类型是搜索表达类型的概率,并使用基于聊天表达建立的聊天语言模型160来计算用户语音是聊天表达类型的概率。
[0101]后续地,交互服务器100计算用户语音是搜索表达类型的概率和用户语音是聊天表达类型的概率之间的差异值(S620)。
[0102]交互服务器100确定计算的差异值是否小于预定值(S630)。在这种情况下,可以由系统开发商设置预定值,但这仅是一个示例。可以使用测试语句设置预定值。
[0103]如果差异值小于预定值(S630-Y),则交互服务器100确定用户语音的表达类型是集成表达类型(S640)。
[0104]然而,如果差异值超过预定值(S630-N),则交互服务器100确定用户语音是搜索表达类型的概率是否大于用户语音是聊天表达类型的概率(S650)。
[0105]如果用户语音是搜索表达类型的概率大于用户语音是聊天表达类型的概率(S650-Y),则交互服务器100确定用户语音的表达类型是搜索表达类型(S660)。然而,如果用户语音是搜索表达类型的概率小于用户语音是聊天表达类型的概率(S650-N),则交互服务器100确定用户语音的表达类型是聊天表达类型(S670)。
[0106]图7是用于解释根据示例实施例的生成集成响应的方法的流程图。
[0107]首先,交互服务器100响应于用户语音生成搜索响应和聊天响应(S710)。
[0108]交互服务器100确定是否可以组合搜索响应和聊天响应(S720)。在这种情况下,交互服务器100可以基于搜索响应和聊天响应的语句类型以及是否包括公共信息确定是否可以组合搜索响应和聊天响应。
[0109]如果可以组合搜索响应和聊天响应(S720-Y),则交互服务器100确定搜索响应和聊天响应的组合顺序(S730)。在这种情况下,交互服务器100可以通过比较用户语音是搜索表达类型的概率与用户语音是聊天表达类型的概率来确定搜索响应和聊天响应的组合顺序。
[0110]交互服务器100修改搜索响应和聊天响应的至少一个(S740)。在这种情况下,交互服务器100可以修改搜索响应和聊天响应之一的结尾或在聊天响应和搜索响应之间放置连
?.κ| ο
[0111]后续地,交互服务器100通过组合搜索响应和聊天响应生成集成响应(S750)。
[0112]如果对搜索响应和聊天响应进行组合是不可能的(S720-N),则交互服务器100向用户终端200发送搜索响应和聊天响应之一(S760)。在这种情况下,交互服务器200可以比较用户语音是搜索表达类型的概率与用户语音是聊天表达类型的概率,并向用户终端200发送与具有更大概率的表达类型相对应的响应。
[0113]根据上述各示例实施例,如果用户语音的表达类型模糊,则提供对搜索响应和聊天响应进行组合的集成响应,并且因此可以为用户提供一致的交互服务。
[0114]在图2-图7中,首先确定用户语音的表达类型,然后生成与用户语音相对应的响应,但这仅是一个示例。可以在生成与用户语音相对应的响应之后确定表达类型,以下将参照图8和9对其进行描述。然而,将不再次描述与以上描述的那些特征重叠的图8和9中的特征。
[0115]图8是说明了根据另一示例实施例的交互服务器800的配置的框图。如图中所示8,交互服务器800包括输入单元810、响应生成器820、确定器830、集成响应生成器840和发射机850。
[0116]输入单元810从用户终端200接收用户语音。
[0117]响应生成器820响应于用户语音生成搜索响应和聊天响应二者。
[0118]确定器830使用参照图3的上述相同方法确定用户语音的表达类型。如果确定用户语音是搜索表达类型,则确定器830可以向发射机850输出所生成的搜索响应,以及如果确定用户语音是聊天表达类型,则确定器830可以向发射机850输出所生成的聊天响应。如果确定用户语音是集成表达类型,则确定器830可以向集成响应生成器840输出搜索响应和聊天响应。
[0119]集成响应生成器840通过组合搜索响应和聊天响应生成集成响应。具体地,集成响应生成器840可以确定组合搜索响应和聊天响应是否是可能的。如果组合搜索响应和聊天响应是可能的,则集成响应生成器840可以确定搜索响应和聊天响应的组合顺序,确定是否为了进行组合而修改搜索响应和聊天响应,并根据确定的组合顺序通过组合修改的搜索响应和聊天响应来生成集成响应。后续地,集成响应生成器840可以向发射机850输出生成的集成响应。
[0120]发射机850向用户终端200发送输出响应。
[0121]图9是用于解释根据另一示例实施例的控制交互服务器800的方法的流程图。
[0122]首先,交互服务器800接收用户语音(S910)。
[0123]交互服务器800响应于用户语音生成搜索响应和聊天响应(S920)。
[0124]交互服务器800确定用户语音的表达类型(S930)。在这种情况下,交互服务器800可以使用与以上已经描述的图3的方法相同的方法来确定用户语音表达类型。
[0125]如果确定用户语音是集成表达类型(S940-Y),则交互服务器800通过组合生成的搜索响应和聊天响应来生成集成响应(S950)。交互服务器800向用户终端200发送生成的集成响应(S960)。
[0126]如果确定用户语音不属于集成表达类型(S940-N)而是搜索表达类型(S970-Y),则交互服务器800向用户终端200发送生成的搜索响应(S980)。如果确定用户语音不属于集成表达类型(S940-N)并且是搜索表达类型(S970-N),则交互服务器800确定用户语音是聊天表达类型,并向用户终端200发送生成的聊天响应(S990)。
[0127]根据示例实施例,当用户语音的表达类型模糊不清时,可以提供组合了搜索响应和聊天响应的集成响应,并且因此可以为用户提供一致的交互服务。
[0128]根据示例性实施例的用户终端可以包括用户接口设备(例如,处理器),存储并执行程序数据的存储器、包括磁盘驱动器的永久性存储单元、与外部装置通信的通信端口、触摸面板、按键、按钮等。实现为软件模块或算法的方法可以存储在记录介质中,记录介质能够由计算机可读,作为由处理器上可执行的计算机可读的指令或程序。这里,计算机可读的记录介质可以包括磁存储介质(例如,只读存储器(R0M)、随机存取存储器(RAM)、软盘、硬盘等)、光学读取介质(例如,CD-ROM、数字多功能盘(DVD))等。计算机可读的记录介质可以分发给通过网络连接的计算机系统,并且可以存储并通过分发方法执行可由计算机读取的代码。介质可被计算机读取、存储在存储器中,并被处理器执行。
[0129]示例性实施例可以由功能块配置和各种处理步骤来表示。这种功能块可以用执行特定功能的各种数字实现为硬件和/或软件配置。例如,示例实施例可以部署直接电路配置(例如,存储器、处理器、逻辑、查找表等),其可以通过一个或更多个微处理器或其他控制装置的控制来执行各种功能。由于通过软件编程或软件元件执行配置,示例性实施例包括被实现为数据结构、过程、例程或组合其它编程配置组合的各种算法,并且可以用编程语言或脚本语言(例如,C、C++、Java和汇编器等)来实现。可以通过在一个或多个处理器中执行的算法实现功能方面。此外,示例性实施例可以采用的电子环境设置,信号处理和/或数据处理等的常规技术。可广泛使用术语“机制”、“元件”、“装置”和“配置”,并且它们不限于机械和物理的元件。术语可以指与处理器连接的一系列软件例程等。
[0130]示例性实施例中的具体执行仅提供作为示例,并且不通过任何方法限制任何技术范围。对于本说明书的简单性,可以省略传统电子配置、控制系统、软件和系统的其他功能方面。此外,作为示例,在附图中示出的元件或连接元件之间的线的连接表示功能连接和/或物理或电路连接,可以替代那些连接,可以添加各种功能,或连接可被表示为在实际装置中的物理连接或电路连接。
[0131]在该说明书中(具体地,在权利要求中),术语“所述”和用类似方式使用的其他指示术语可以指单数元素和复数元素二者。此外,如果引用范围,范围包括其属于范围内(如果用其他方式引用)的独立值,并且可以看出构成该范围内的每个独立值在详细说明中引用。最后,除非有关于方法的步骤的明确顺序,可以用适当顺序执行的步骤,但不限于此。此夕卜,本发明概念的示例性实施例的描述意欲作为示意而不会限制权利要求的范围,多种备选方案、修改和变体对于本领域技术人员是显而易见的。
【主权项】
1.一种控制交互服务器的方法,所述方法包括: 在交互服务器处从用户终端接收与用户语音相对应的数据; 基于接收到的数据确定用户语音的表达类型; 响应于确定用户语音的表达类型是集成表达类型,生成响应于用户语音的搜索响应和聊天响应,并通过组合所生成的搜索响应和所生成的聊天响应来生成集成响应;以及 向用户终端发送所生成的集成响应。2.根据权利要求1所述的方法,其中,确定用户语音的表达类型包括: 使用基于搜索表达建立的搜索语言模型计算用户语音的表达类型是搜索表达类型的概率; 使用基于聊天表达建立的聊天语言模型计算用户语音的表达类型是聊天表达类型的概率; 计算用户语音的表达类型是搜索表达类型的概率与用户语音的表达类型是聊天表达类型的概率之间的差异值;以及 响应于差异值小于预定值,确定用户语音的表达类型是集成表达类型。3.根据权利要求2所述的方法,其中,确定用户语音的表达类型还包括: 响应于差异值超过预定值并且用户语音的表达类型是搜索表达类型的概率大于用户语音的表达类型是聊天表达类型的概率,确定用户语音是搜索表达类型;以及 响应于差异值超过预定值并且用户语音的表达类型是搜索表达类型的概率小于用户语音的表达类型是聊天表达类型的概率,确定用户语音的表达类型是聊天表达类型。4.根据权利要求3所述的方法,还包括: 响应于确定用户语音的表达类型是搜索表达类型,生成对用户语音的搜索响应,并向用户终端发送搜索响应;以及 响应于确定用户语音的表达类型是聊天表达类型,生成对用户语音的聊天响应,并向用户终端发送聊天响应。5.根据权利要求1所述的方法,其中,生成集成响应包括: 通过确定搜索响应和聊天响应的语句类型以及在搜索响应和聊天响应中是否包括公共信息,确定是否可能对搜索响应和聊天响应进行组合; 响应于确定对搜索响应和聊天响应进行组合是可能的,确定搜索响应和聊天响应的组合顺序; 修改搜索响应和聊天响应中的至少一个;以及 根据所确定的组合顺序,对搜索响应和聊天响应进行组合,其中,搜索响应和聊天响应中的至少一个已经被修改。6.根据权利要求5所述的方法,还包括:响应于确定对搜索响应与聊天响应进行组合是不可能的,向用户终端发送搜索响应和聊天响应之一。7.根据权利要求5所述的方法,其中,确定组合顺序包括:通过比较用户语音的表达类型是聊天表达类型的概率与用户语音的表达类型是搜索表达类型的概率来确定搜索响应和聊天响应的组合顺序。8.根据权利要求5所述的方法,其中,修改搜索响应和聊天响应中的至少一个包括修改搜索响应和聊天响应中的至少一个的结尾。9.根据权利要求1所述的方法,其中,所述与用户语音相对应的数据是文本数据。10.根据权利要求1所述的方法,其中,所述与用户语音相对应的数据是语音数据, 所述方法还包括:针对用户语音的语音数据执行语音识别,以获得用户语音的相应文本数据。11.一种交互服务器,包括: 输入单元,被配置为从用户终端接收与用户语音相对应的数据; 确定器,被配置为基于所述数据确定用户语音的表达类型, 响应生成器,被配置为响应于确定用户语音的表达类型是集成表达类型,生成响应于用户语音的搜索响应和聊天响应,并通过组合所生成的搜索响应和所生成的聊天响应来生成集成响应;以及 发射机,被配置为向用户终端发送所生成的集成响应。12.根据权利要求11所述的交互服务器,其中,确定器包括: 概率计算器,被配置为使用基于搜索表达建立的搜索语言模型计算用户语音的表达类型是搜索表达类型的概率,并使用基于聊天表达建立的聊天语言模型计算用户语音的表达类型是聊天表达类型的概率; 差异计算器,被配置为计算用户语音的表达类型是搜索表达类型的概率与用户语音的表达类型是聊天表达类型的概率之间的差异值;以及 表达类型确定器,被配置为响应于差异值小于预定值,确定用户语音的表达类型是集成表达类型。13.根据权利要求12所述的交互服务器,其中,表达类型确定器被配置为:响应于差异值超过预定值并且用户语音的表达类型是搜索表达类型的概率大于用户语音的表达类型是聊天表达类型的概率,确定用户语音的表达类型是搜索表达类型,以及响应于差异值超过预定值并且用户语音的表达类型是搜索表达类型的概率小于用户语音的表达类型是聊天表达类型的概率,确定用户语音的表达类型是聊天表达类型。14.根据权利要求13所述的交互服务器,其中,响应生成器被配置为:响应于确定用户语音的表达类型是搜索表达类型,生成对用户语音的搜索响应,以及响应于确定用户语音的表达类型是聊天表达类型,生成对用户语音的聊天响应, 其中发射机被配置为向用户终端发送所生成的搜索响应和所生成的聊天响应之一。15.根据权利要求11所述的交互服务器,其中,响应生成器包括: 搜索响应生成器,被配置为生成对用户语音的搜索响应; 聊天响应生成器,被配置为生成对用户语音的聊天响应; 组合确定器,被配置为通过确定搜索响应和聊天响应的语句类型以及在搜索响应和聊天响应中是否包括公共信息确定是否可能对搜索响应和聊天响应进行组合; 组合顺序确定器,被配置为响应于确定对搜索响应和聊天响应进行组合是可能的,确定搜索响应和聊天响应的组合顺序; 响应修改器,被配置为修改搜索响应和聊天响应中的至少一个;以及响应组合器,被配置为根据所确定的组合顺序,对搜索响应和聊天响应进行组合,其中,搜索响应和聊天响应中的至少一个已经被修改。
【文档编号】G06F17/27GK105940394SQ201580006257
【公开日】2016年9月14日
【申请日】2015年2月12日
【发明人】金倞德
【申请人】三星电子株式会社
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1