基于语音交互的富媒体展示方法及系统的利记博彩app

文档序号:10660824阅读:600来源:国知局
基于语音交互的富媒体展示方法及系统的利记博彩app
【专利摘要】本发明公开了一种基于语音交互的富媒体展示方法,包括:获取用户输入的语音数据;对语音数据进行频域变换处理,得到语音数据的频谱特征,根据频谱特征查找预设的用户属性列表,得到用户的属性;将语音数据进行语义识别,获得语音数据的语义信息,根据语义信息查找并获取与语义信息相关的富媒体信息;按照预设的与用户属性对应的展示规则进行富媒体信息的展示。本发明还公开了一种基于语音交互的富媒体展示系统。所述基于语音交互的富媒体展示方法及系统,通过对语音数据进行频域变换处理,得到用户属性,使得能够根据用户属性实现语音交互的差异化处理,使富媒体的展示更具有针对性。通过获取语音相关的富媒体信息,提高语音交互的效率。
【专利说明】
基于语音交互的富媒体展示方法及系统
技术领域
[0001]本发明涉及语音处理及富媒体的展示技术领域,特别是指一种基于语音交互的富媒体展示方法及系统。【背景技术】
[0002]随着信息技术的不断发展,用户交互技术得到了广泛的应用。而语音交互作为继键盘交互、鼠标交互及触摸屏交互后的新一代用户交互模式,以其方便快捷的特点,逐渐被广大用户认可且有被大规模推广的潜在前景,而在这些相关的应用中,智慧语音业务及其相关功能相当具有吸引力。比如,智能移动终端上与语音相关的应用越来越多,而智能电视厂商也通过引用语音交互技术替换掉传统的手持遥控器。现有技术中语音交互基于语音识别技术,也即,语音交互系统在接收到一段语音后,首先对语音数据进行内容识别,得到内容识别结果,并根据该内容识别结果获知用户意图。之后,语音交互系统根据用户意图进行与该语音相对应的操作,或向终端用户返回与该语音相对应的信息。
[0003]但是,现有的语音交互系统,一方面只能够识别语音数据中包含语义的差别,不能够实现对不同用户的差异化处理,另一方面,现有的语音交互系统其交互显示的效果非常单一,只有语音或者只有文字的交互,这对于那些想要获取更多信息资源的用户来说,功能和效果都不是特别理想。尤其针对于儿童的培养或教育方面,现有的交互系统无法满足儿童用户的使用需求。
【发明内容】

[0004]有鉴于此,本发明的目的在于提出一种基于语音交互的富媒体展示方法及系统, 使富媒体的展示更具有针对性,提高语音交互展示的效果。
[0005]基于上述目的本发明提供的一种基于语音交互的富媒体展示方法,包括:
[0006]获取用户输入的语音数据;
[0007]对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;
[0008]将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;
[0009]按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。
[0010]优选的,所述获得所述语音数据的语义信息的步骤之后还包括:
[0011]将所述语音数据转换为文字信息,在预设的时间内,将所述文字信息显示于界面中。
[0012]优选的,所述对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征的步骤之前还包括:
[0013]根据所述语音数据判断当前用户是否为系统用户,
[0014]若为系统用户,则获取与当前用户对应的预设用户信息;将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;按照预设的与所述用户信息对应的展示规则进行富媒体信息的展示;
[0015]若当前用户不是系统用户,则执行对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征的步骤。
[0016]优选的,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息展示的步骤包括:
[0017]按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示的方式。
[0018]优选的,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示的步骤之后还包括:
[0019]根据所述富媒体信息,播放预设的语音引导信息;
[0020]获取用户输入的新的语音数据;[0021 ]根据所述新的语音数据,展示所述新的语音数据对应的富媒体信息。
[0022]优选的,所述根据所述语义信息查找并获取与所述语义信息相关的富媒体信息的步骤还包括:
[0023]根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;[〇〇24]按照富媒体信息的属性特征以及用户的属性,查找并判断所述富媒体是否属于该用户属性下预设的屏蔽信息;[〇〇25]若是,则过滤掉所述富媒体信息。[〇〇26]本发明还提供了一种基于语音交互的富媒体展示系统,包括:
[0027]数据获取模块,用于获取用户输入的语音数据;将获得得到的语音数据发送给属性查找模块和信息获取模块;
[0028]属性查找模块,用于接收所述数据获取模块发送的语音数据,对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;将得到的用户属性信息发送给信息展示模块;[〇〇29]信息获取模块,用于接收所述数据获取模块发送的语音数据,将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;将获取的富媒体信息发送给信息展示模块;
[0030]信息展示模块,用于接收所述属性查找模块发送的用户属性信息以及所述信息获取模块发送的富媒体信息,按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。[0031 ]优选的,所述系统还包括文字展示模块;
[0032]所述数据获取模块还用于,将得到的语音数据发送给所述文字展示模块;
[0033]所述文字展示模块用于,接收所述数据获取模块发送的语音数据并将所述语音数据转换为文字信息,在预设的时间内,将所述文字信息显示于界面中。[〇〇34]优选的,还包括:用户判断模块,
[0035]所述数据获取模块还用于,将得到的语音数据发送给所述用户判断模块;
[0036]所述用户判断模块用于,接收所述数据获取模块发送的语音数据,根据所述语音数据判断当前用户是否为系统用户,若为系统用户,则获取与当前用户对应的预设用户信息;将所述预设用户信息发送给信息展示模块;若当前用户不是系统用户,则将所述语音数据发送给属性查找模块;
[0037]所述信息展示模块还用于,接收所述用户判断模块发送的预设用户信息,按照预设的与所述预设用户信息对应的展示规则进行富媒体信息的展示。
[0038]优选的,所述信息展示模块还用于,[〇〇39]按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示的方式。
[0040]优选的,还包括:引导模块;[〇〇41]所述信息展示模块还用于,根据所述富媒体信息向引导模块发送引导指令;
[0042]所述引导模块用于,接收信息展示模块发送的引导指令,播放预设的语音引导信息;
[0043]所述数据获取模块还用于,获取用户输入的新的语音数据;将所述新的语音数据发送给所述信息展示模块;
[0044]所述信息展示模块还用于,接收所述数据获取模块发送的新的语音数据,根据所述新的语音数据,展示所述新的语音数据对应的富媒体信息。
[0045]优选的,所述信息获取模块还用于,
[0046]根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;
[0047]按照富媒体信息的属性特征以及用户的属性,查找并判断所述富媒体是否属于该用户属性下预设的屏蔽信息;[〇〇48]若是,则过滤掉所述富媒体信息。
[0049]从上面所述可以看出,本发明提供的基于语音交互的富媒体展示方法及系统,通过对语音数据进行频域变换处理,并利用频域变换处理得到的频谱特征获得用户的属性, 进而能够根据用户的不同属性,实现语音交互的差异化处理,使富媒体的展示更具有针对性。也即,能够根据用户的不同属性,进而按照不同的展示规则进行富媒体的展示。同时,所述基于语音交互的富媒体展示方法及系统通过语义识别,能够查找并获取得到与语音数据相关的富媒体信息,进而提高了语音交互展示的信息数量和类型,使得语音交互展示的效率和效果大大提高。【附图说明】
[0050]图1为本发明提供的基于语音交互的富媒体展示方法的一个实施例的流程图;
[0051]图2为本发明提供的基于语音交互的富媒体展示方法的另一个实施例的流程图; [〇〇52]图3为本发明提供的基于语音交互的富媒体展示系统的一个实施例的流程图; [〇〇53]图4为本发明提供的基于语音交互的富媒体展示系统的另一个实施例的流程图。【具体实施方式】
[0054]为使本发明的目的、技术方案和优点更加清楚明白,以下结合具体实施例,并参照附图,对本发明进一步详细说明。
[0055]需要说明的是,本发明实施例中所有使用“第一”和“第二”的表述均是为了区分两个相同名称非相同的实体或者非相同的参量,可见“第一” “第二”仅为了表述的方便,不应理解为对本发明实施例的限定,后续实施例对此不再一一说明。[〇〇56]参照图1所示,为本发明提供的基于语音交互的富媒体展示方法的一个实施例的流程图。所述基于语音交互的富媒体展示方法包括:[〇〇57]步骤101,获取用户输入的语音数据;[〇〇58]其中,这里所述的语音数据是根据用户的语音输入产生的语音数据,语音输入是指用户在终端或相关设备的语音接收部位说出需要进行交互的语音指令,例如:用户想要搜索苹果,则需要说出“苹果”的口语发音。此外,用户还可以采用已经录制好的语音数据作为用户的语音输入,例如:使用另一个播放设备将用户预先录制好的语音播放出来。终端或者交互系统将根据所述语音数据与用户进行语音交互。
[0059]步骤102,对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;
[0060]其中,所述频域变换处理是指将获得得到的语音数据进行频域分析,得到语音的频域信息,进而获得语音数据的频谱特性。所述用户属性列表是指预先设置的用于将不同的用户属性与频谱特征相互对应的关系列表,通过得到的频谱特征查找所述用户属性列表,就能够确定所述语音数据对应的用户属性。所述用户属性包含用户的年龄、性别、人种等属性。当然,还可以根据频谱特征获取能够区分用户属性的其他区别。
[0061]步骤103,将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;
[0062]其中,所述将所述语音数据进行语义识别通常首先将所述语音数据进行语音识另IJ,然后根据语音识别的结果进行语义识别。所述语音识别是指确定所述语音数据中的文字内容,所述语义识别是指识别话语中的意境和含义。所述富媒体包括:文字、图片、视频、 音频等各类多媒体信息。
[0063]步骤104,按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。 [〇〇64]其中,所述用户属性对应的展示规则是指每一类用户均分别对应有一个展示规贝1J,所述展示规则包括展示界面的布局、富媒体展示的顺序、富媒体展示的形式等等。
[0065]由上述实施例可知,所述基于语音交互的富媒体展示方法通过对用户输入的语音数据进行频域变换处理,然后利用频域变换处理得到的频谱特征得到用户的属性,进而能够根据用户的不同属性,实现语音交互的差异化处理,使富媒体的展示更具有针对性。也即,针对不同类型的用户,交互系统或终端能够实现不同的交互过程,使得能够根据用户的不同属性,进而按照不同的展示规则进行富媒体的展示。同时,所述基于语音交互的富媒体展示方法通过语义识别,能够查找并获取得到与语音数据相关的富媒体信息,进而提高了语音交互展示的信息数量和类型,也即大大提高了语音交互展示的效率和效果。尤其针对于儿童领域或者是教育领域的语音交互,本发明所述的基于语音交互的富媒体展示方法使得用户通过语音交互不仅能够获得更加丰富的信息资源,而且通过富媒体的交互展示,能够大大提高用户的体验度,吸引用户注意力的同时也能够加深用户的印象,提高培养和教育的效果。
[0066]作为本发明一些优选的实施例,所述获得所述语音数据的语义信息的步骤之后还包括:将所述语音数据根据语义识别的结果转换为文字信息,在预设的时间内,将所述文字信息显示于界面中。通过将语音数据转换为文字信息,一方面,能够使得用户确认交互系统或终端所识别的语音是否正确,另一方面,也使得用户对于交互结果的展示更为直观。通常,将文字信息在界面中展示一定时间后需要隐藏,以避免给富媒体的展示带来干扰。所述文字信息的展示方式既可以展示在界面最顶层,也可以将所述文字信息展示在界面的某一个角落中,例如界面的右下角,其显示方式可以根据需要相应选定。这样,不仅提高了语音交互中语音信息的准确性,而且针对于视力不好的用户来说,能够进一步确定自己输入的语音是否准确,同时,也方便其他旁观的用户识别进行语音交互的用户输入的语音信息。
[0067]作为本发明另一个较佳的实施例,所述对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征的步骤之前还包括:
[0068]根据所述语音数据判断当前用户是否为系统用户,
[0069]若为系统用户,则获取与当前用户对应的预设用户信息;将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;按照预设的与所述用户信息对应的展示规则进行富媒体信息的展示;
[0070]若当前用户不是系统用户,则执行对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征的步骤。
[0071]其中,所述系统用户是指系统中预存的具有账户的用户,还可以称为会员用户。例如,对于某一个手机终端来说,可以在手机上预先存储手机拥有者的频谱信息,并记录该用户的更多详细信息,这里,手机拥有者即为系统用户。这样,通过判断当前用户是否为系统用户能够进一步区分系统用户和非系统用户。而且,通过预设用户信息,能够获得更加详细的系统用户相关的信息,进而针对系统用户实现更加准确的富媒体展示。
[0072]在一些优选的实施例中,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息展示的步骤包括:按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示的方式。所述富媒体内容包括:视频、音频、文字、动画,甚至一些可以执行的应用程序。当然,富媒体的内容并不限于上述列举的内容,可以按照需要相应的添加,此处不再复述。所述展示规则或展示规则的体现包含但不限于如下方式:播放视频,播放音频,音频视频顺序播放,图片展示,背景展示音频,动画,或者类似的互媒体展示的其他规则或方式,应用的展示方式等等。例如:多张图片既可以依次滑动展示,也可以像在PPT中一样展示。所述富媒体可以包括展示规则,也可以不包含展示规则,当不包括展示规则时, 可以在系统中默认设置默认规则,将默认规则作为展示规则。这样,能够针对富媒体实现不同规则的展示,提高了富媒体展示的多样性。而且,通过将展示规则添加到富媒体信息中, 使得能够在系统中针对每一种搜索类型设定相应的展示规则,进而实现更加丰富的展示方式。
[0073]进一步,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示的步骤之后还包括:
[0074]根据所述富媒体信息,播放预设的语音引导信息;[〇〇75]获取用户输入的新的语音数据;
[0076]根据所述新的语音数据,展示所述新的语音数据对应的富媒体信息。
[0077]这样,用户能够根据所述引导信息进一步引导用户再次选择后续相应的富媒体, 然后展示用户后续选择的富媒体文件,使得交互的展示过程更加灵活,提高用户的体验度。
[0078]作为本发明另一个较佳的实施例,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息展示的步骤104包括:根据用户属性,查找预设的用户属性与展示规则的对应关系列表,得到当前用户的展示规则,所述展示规则包含富媒体信息的排序;将所述富媒体信息按照所述展示规则中的顺序自动播放展示。其中,所述将所述富媒体信息按照所述展示规则中的顺序自动播放展示是指将富媒体按照展示规则中的顺序分别播放或者展示出来。这里,针对于音频和视频信息来说,所述播放是指直接播放音频或视频文件;对于文字或者图片信息来说,所述播放是指采用雷士幻灯片的方式进行播放,当然,也可以采用其他的播放形式进行播放。这样,使得用户根据语音数据获得的所有富媒体能够自动向用户展示出来,而且展示的顺序是基于用户自身属性所对应的展示规则,不仅提高了用户交互的体验度,而且增强了富媒体信息进行展示的效果,进而提高了语音交互的效率。
[0079]作为本发明进一步的实施例,所述按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示的步骤还包括:判断当前展示的富媒体信息是否为语音或视频信息; 若当前展示的富媒体信息为语音或视频信息,则不执行任何操作;若当前展示的富媒体信息不是语音或视频信息,则获取与所述富媒体信息绑定的语音信息,并将所述语音信息与富媒体信息同时展示。针对于不是语音或视频信息的信息文件,需要预先设定一个绑定的语音信息,这样,在进行图片或者文字等信息展示时,也能够达到语音展示的效果,例如:展示的是关于平板电脑的图片,那么,针对于每一个电脑图片都将有一个大致的语音信息进行介绍,例如:品牌平板”。当然,所述语音信息还可以是交互系统或终端根据富媒体信息解析获得的语音信息,例如:富媒体为文字信息,那么交互系统在后台可以将这些文字信息转化为语音信息,并与这些文字信息进行绑定。这样,不仅增强了语音交互的多样性,而且进一步提高了用户的体验度。
[0080]在一些可选的实施例中,所述根据所述语义信息查找并获取与所述语义信息相关的富媒体信息的步骤103还包括:根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;按照富媒体信息的属性特征以及用户的属性,查找并判断所述富媒体是否属于该用户属性下预设的屏蔽信息;若是,则过滤所述富媒体信息。其中,所述属性特征一般指富媒体信息的类型,例如:某一个视频文件可以分为文艺、色情、暴力、凶杀、冒险、科幻等等类型,某一个图片可以分为血腥、清新、恶心等等类型。针对不同的用户属性,预先分别设定了一个屏蔽信息的列表。例如:对于儿童来说,屏蔽信息为:游戏、暴力、凶杀、色情等不适宜的信息,而对于成年人来说,屏蔽信息为:某些特定的宗教、犯罪等等信息。还可以根据需要, 针对不同性别的人群设定不同的屏蔽信息列表。这样,有利于进一步提高语音交互的效率, 避免一些错误或者不适宜信息的展示,对于教育领域,通过屏蔽信息能够将许多分散儿童注意力的信息屏蔽掉,使得儿童的语音交互过程更为健康、有效。
[0081]参照图2所示,为本发明提供的基于语音交互的富媒体展示方法的另一个实施例的流程图。所示基于语音交互的富媒体展示方法包括:[〇〇82]步骤201,获取用户输入的语音数据;[〇〇83]步骤202,判断当前用户是否为系统用户,若是,则执行步骤204,否则,执行步骤 203;
[0084]步骤203,对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性
[0085]步骤204,获取与当前用户对应的预设用户信息;
[0086]步骤205,将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;[〇〇87]步骤206,将所述语音数据转换为文字信息,在预设的时间内,将所述文字信息显示于界面的最顶层;[〇〇88]步骤207,根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;
[0089]步骤208,判断所述富媒体是否属于该用户属性下预设的屏蔽信息;若是,则执行步骤210,否则执行步骤209;
[0090]步骤209,根据步骤208,所述富媒体不属于该用户属性下预设的屏蔽信息,则保留所示富媒体信息;
[0091]步骤210,根据步骤208,所述富媒体属于该用户属性下预设的屏蔽信息,则过滤掉所述富媒体信息,也即提出这一类富媒体信息;
[0092]步骤211,将所述富媒体信息按照所述展示规则中的顺序自动播放展示。
[0093]由上述实施例可知,所述基于语音交互的富媒体展示方法通过将语音信息转化为文字信息并显示,提高了语音交互的准确性,通过获取富媒体信息的特征信息能够针对相应的用户属性排除预设的屏蔽信息,使得所有富媒体的展示过程更加稳定和可靠,提高了语音交互的展示效果。因此,本发明所述的基于语音交互的富媒体展示方法不仅提高了语音交互的准确性,而且提高了交互的效果,给用户带来更好的交互体验。[〇〇94]参照图3所示,为本发明提供的基于语音交互的富媒体展示系统的一个实施例的流程图。所述基于语音交互的富媒体展示系统,包括:
[0095]数据获取模块301,用于获取用户输入的语音数据;将获得得到的语音数据发送给属性查找模块302和信息获取模块303;[〇〇96]属性查找模块302,用于接收所述数据获取模块301发送的语音数据,对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;将得到的用户属性信息发送给信息展示模块304;[〇〇97]信息获取模块303,用于接收所述数据获取模块301发送的语音数据,将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的富媒体信息;将获取的富媒体信息发送给信息展示模块304;[〇〇98]信息展示模块304,用于接收所述属性查找模块302发送的用户属性信息以及所述信息获取模块303发送的富媒体信息,按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。
[0099]由上述实施例可知,所述基于语音交互的富媒体展示系统通过所述数据获取模块 301获取用户输入的语音数据,通过所述属性查找模块302确定用户的属性,通过所述信息获取模块303得到语音数据对应的富媒体信息,最后通过所述信息展示模块304将富媒体信息按照预设的展示规则进行展示。这样,不仅使得交互系统能够根据用户的不同属性进行差异化的交互处理,而且大大提高了用户进行语音交互的效率和效果。
[0100]在本发明一些优选的实施例中,参照图4所示,所述基于语音交互的富媒体展示系统还包括文字展示模块305;所述数据获取模块301还用于,将得到的语音数据发送给所述文字展示模块305;所述文字展示模块305用于,接收所述数据获取模块发送的语音数据并将所述语音数据转换为文字信息,在预设的时间内,将所述文字信息显示于界面中。
[0101]在本发明另一些优选的实施例中,还包括:用户判断模块306,[〇1〇2]所述数据获取模块301还用于,将得到的语音数据发送给所述用户判断模块306; [〇1〇3]所述用户判断模块306用于,接收所述数据获取模块301发送的语音数据,根据所述语音数据判断当前用户是否为系统用户,若为系统用户,则获取与当前用户对应的预设用户信息;将所述预设用户信息发送给信息展示模块304;若当前用户不是系统用户,则将所述语音数据发送给属性查找模块302;[〇1〇4]所述信息展示模块304还用于,接收所述用户判断模块306发送的预设用户信息, 按照预设的与所述预设用户信息对应的展示规则进行富媒体信息的展示。
[0105]在本发明进一步的实施例中,所述信息展示模块304还用于,按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示的方式。
[0106]在本发明可选的实施例中,还包括:引导模块307;[〇1〇7]所述信息展示模块304还用于,根据所述富媒体信息向引导模块307发送引导指令;[〇1〇8]所述引导模块307用于,接收信息展示模块304发送的引导指令,播放预设的语音引导信息;
[0109]所述数据获取模块301还用于,获取用户输入的新的语音数据;将所述新的语音数据发送给所述信息展示模块304;
[0110]所述信息展示模块304还用于,接收所述数据获取模块301发送的新的语音数据, 根据所述新的语音数据,展示所述新的语音数据对应的富媒体信息。
[0111]作为本发明一个较佳的实施例,所述信息获取模块303还用于,根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;按照富媒体信息的属性特征以及用户的属性, 查找并判断所述富媒体是否属于该用户属性下预设的屏蔽信息;若是,则过滤掉所述富媒体信息。
[0112]参照图4所示,为本发明提供的基于语音交互的富媒体展示系统的另一个实施例的流程图。所述基于语音交互的富媒体展示系统包括:数据获取模块301、属性查找模块 302、信息获取模块303、信息展示模块304、文字展示模块305、用户判断模块306和引导模块 307〇
[0113]所属领域的普通技术人员应当理解:以上任何实施例的讨论仅为示例性的,并非旨在暗示本公开的范围(包括权利要求)被限于这些例子;在本发明的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本发明的不同方面的许多其它变化,为了简明它们没有在细节中提供。[〇114]另外,为简化说明和讨论,并且为了不会使本发明难以理解,在所提供的附图中可以示出或可以不示出与集成电路(1C)芯片和其它部件的公知的电源/接地连接。此外,可以以框图的形式示出装置,以便避免使本发明难以理解,并且这也考虑了以下事实,即关于这些框图装置的实施方式的细节是高度取决于将要实施本发明的平台的(即,这些细节应当完全处于本领域技术人员的理解范围内)。在阐述了具体细节(例如,电路)以描述本发明的示例性实施例的情况下,对本领域技术人员来说显而易见的是,可以在没有这些具体细节的情况下或者这些具体细节有变化的情况下实施本发明。因此,这些描述应被认为是说明性的而不是限制性的。
[0115]尽管已经结合了本发明的具体实施例对本发明进行了描述,但是根据前面的描述,这些实施例的很多替换、修改和变型对本领域普通技术人员来说将是显而易见的。例如,其它存储器架构(例如,动态RAM(DRAM))可以使用所讨论的实施例。
[0116]本发明的实施例旨在涵盖落入所附权利要求的宽泛范围之内的所有这样的替换、 修改和变型。因此,凡在本发明的精神和原则之内,所做的任何省略、修改、等同替换、改进等,均应包含在本发明的保护范围之内。
【主权项】
1.一种基于语音交互的富媒体展示方法,其特征在于,包括:获取用户输入的语音数据;对所述语音数据进行频域变换处理,得到所述语音数据的频谱特征,根据所述频谱特 征查找预设的用户属性列表,得到用户的属性;将所述语音数据进行语义识别,获得所述语音数据的语义信息,根据所述语义信息查 找并获取与所述语义信息相关的富媒体信息;按照预设的与所述用户属性对应的展示规则进行富媒体信息的展示。2.根据权利要求1所述的方法,其特征在于,所述获得所述语音数据的语义信息的步骤 之后还包括:将所述语音数据转换为文字信息,在预设的时间内,将所述文字信息显示于界面中。3.根据权利要求1所述的方法,其特征在于,所述对所述语音数据进行频域变换处理, 得到所述语音数据的频谱特征的步骤之前还包括:根据所述语音数据判断当前用户是否为系统用户,若为系统用户,则获取与当前用户对应的预设用户信息;将所述语音数据进行语义识 另IJ,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相关的 富媒体信息;按照预设的与所述用户信息对应的展示规则进行富媒体信息的展示;若当前用户不是系统用户,则执行对所述语音数据进行频域变换处理,得到所述语音 数据的频谱特征的步骤。4.根据权利要求1所述的方法,其特征在于,所述按照预设的与所述用户属性对应的展 示规则进行富媒体信息展示的步骤包括:按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含 富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示 的方式。5.根据权利要求1所述的方法,其特征在于,所述按照预设的与所述用户属性对应的展 示规则进行富媒体信息的展示的步骤之后还包括:根据所述富媒体信息,播放预设的语音引导信息;获取用户输入的新的语音数据;根据所述新的语音数据,展示所述新的语音数据对应的富媒体信息。6.根据权利要求1所述的方法,其特征在于,所述根据所述语义信息查找并获取与所述 语义信息相关的富媒体信息的步骤还包括:根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;按照富媒体信息的属性特征以及用户的属性,查找并判断所述富媒体是否属于该用户 属性下预设的屏蔽信息;若是,则过滤掉所述富媒体信息。7.—种基于语音交互的富媒体展示系统,其特征在于,包括:数据获取模块,用于获取用户输入的语音数据;将获得得到的语音数据发送给属性查 找模块和信息获取模块;属性查找模块,用于接收所述数据获取模块发送的语音数据,对所述语音数据进行频 域变换处理,得到所述语音数据的频谱特征,根据所述频谱特征查找预设的用户属性列表,得到用户的属性;将得到的用户属性信息发送给信息展示模块;信息获取模块,用于接收所述数据获取模块发送的语音数据,将所述语音数据进行语 义识别,获得所述语音数据的语义信息,根据所述语义信息查找并获取与所述语义信息相 关的富媒体信息;将获取的富媒体信息发送给信息展示模块;信息展示模块,用于接收所述属性查找模块发送的用户属性信息以及所述信息获取模 块发送的富媒体信息,按照预设的与所述用户属性对应的展示规则进行富媒体信息的展不。8.根据权利要求7所述的系统,其特征在于,所述系统还包括文字展示模块;所述数据获取模块还用于,将得到的语音数据发送给所述文字展示模块;所述文字展示模块用于,接收所述数据获取模块发送的语音数据并将所述语音数据转 换为文字信息,在预设的时间内,将所述文字信息显示于界面中。9.根据权利要求7所述的系统,其特征在于,还包括:用户判断模块,所述数据获取模块还用于,将得到的语音数据发送给所述用户判断模块;所述用户判断模块用于,接收所述数据获取模块发送的语音数据,根据所述语音数据 判断当前用户是否为系统用户,若为系统用户,则获取与当前用户对应的预设用户信息;将 所述预设用户信息发送给信息展示模块;若当前用户不是系统用户,则将所述语音数据发 送给属性查找模块;所述信息展示模块还用于,接收所述用户判断模块发送的预设用户信息,按照预设的 与所述预设用户信息对应的展示规则进行富媒体信息的展示。10.根据权利要求7所述的系统,其特征在于,所述信息展示模块还用于,按照富媒体信息中的展示规则进行富媒体文件的展示,其中,所述富媒体信息中包含 富媒体文件信息和相应的展示规则信息,所述展示规则包括富媒体文件展示的顺序和展示 的方式。11.根据权利要求7所述的系统,其特征在于,还包括:引导模块;所述信息展示模块还用于,根据所述富媒体信息向引导模块发送引导指令;所述引导模块用于,接收信息展示模块发送的引导指令,播放预设的语音引导信息; 所述数据获取模块还用于,获取用户输入的新的语音数据;将所述新的语音数据发送 给所述信息展示模块;所述信息展示模块还用于,接收所述数据获取模块发送的新的语音数据,根据所述新 的语音数据,展示所述新的语音数据对应的富媒体信息。12.根据权利要求7所述的系统,其特征在于,所述信息获取模块还用于,根据查找得到的富媒体信息,获取所述富媒体信息的属性特征;按照富媒体信息的属性特征以及用户的属性,查找并判断所述富媒体是否属于该用户 属性下预设的屏蔽信息;若是,则过滤掉所述富媒体信息。
【文档编号】G10L15/30GK106027485SQ201610279818
【公开日】2016年10月12日
【申请日】2016年4月28日
【发明人】吴建国, 张珩, 沈韡, 刘超华
【申请人】乐视控股(北京)有限公司, 乐意互联智能科技(北京)有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1