图像文件处理及语音控制方法

文档序号：10624901阅读：266来源：国知局

图像文件处理及语音控制方法
【专利摘要】本发明公开了一种图像文件处理及语音控制方法，其中语音控制方法，包括：S210接收语音信息，并提取该语音信息中的语音特征信息和语音内容信息；S220查找到与该语音特征信息相对应的图像数据信息、音频信息、文本信息组合；S230根据语音内容信息，依次显示图像数据、文本数据以及播放音频数据。本发明通过图像文件处理和语音控制功能，可实现图像，不但可实现图像增强现实处理，还可实现通过语音控制来实现虚拟与现实之间的互动，3D模型之间会相互学习和影响，给用户增加更强的趣味性和易用性。
【专利说明】
图像文件处理及语音控制方法
技术领域
[0001]本发明涉及电子信息领域，尤其涉及图像文件处理方法及语音控制方法。
【背景技术】
[0002]增强现实(Augmented Reality，简称AR)，是在虚拟现实的基础上发展起来的新技术，也被称之为混合现实。是通过计算机系统提供的信息增加用户对现实世界感知的技术，将虚拟的信息应用到真实世界，并将计算机生成的虚拟物体、场景或系统提示信息叠加到真实场景中，从而实现对现实的增强。
[0003]现有技术中的增强现实的功能，不能通过语音进行控制，无自成长和学习功能。如果通过图像文件处理和语音控制功能，可实现图像，不但可实现图像增强现实处理，还可实现通过语音控制来实现虚拟与现实之间的互动，3D模型之间会相互学习和影响，将给用户增加更强的趣味性和易用性。

【发明内容】

[0004]本发明的目的是提供一种图像文件处理方法及语音控制方法。
[0005]本发明所提供的图像文件处理方法，包括:S110获取记载有虚拟图像信息的第一数据；S120获取记载有现实图像信息的第二数据；S130将第一数据和第二数据进行结合处理，从而得到记载有虚拟图像和现实图像的第三数据。
[0006]本发明所提供的语音控制方法，包括:S210接收语音信息，并提取该语音信息中的语音特征信息和语音内容信息；S220查找到与该语音特征信息相对应的图像数据信息、音频信息、文本信息组合；S230根据语音内容信息，依次显示图像数据、文本数据以及播放音频数据。
[0007]本发明通过图像文件处理和语音控制功能，可实现图像，不但可实现图像增强现实处理，还可实现通过语音控制来实现虚拟与现实之间的互动，3D模型之间会相互学习和影响，给用户增加更强的趣味性和易用性。
【附图说明】
[0008]图1为本发明实施例一所述的图像文件处理方法流程示意图；
[0009]图2为本发明实施例一所述的图像文件处理方法中所述S120所述获取记载有现实图像信息的第二数据的步骤的示意图；
[0010]图3为本发明实施例二所述的语音控制方法流程示意图；
[0011]图4为本发明实施例二所述的语音控制方法中所述查找到与该语音特征信息相对应的图像数据信息组合的流程示意图；
[0012]图5为本发明实施例二所述的语音控制方法中所述根据语音内容信息依次显示图像数据的流程示意图；
[0013]图6为本发明实施例二所述的语音控制方法中信息反馈步骤的流程示意图；
[0014]图7为本发明实施例二所述的语音控制方法中学习步骤的流程示意图；
[0015]图8为本发明实施例二所述的语音控制方法中建立与账户相匹配的第一性格数据和第二性格数据的流程示意图。
【具体实施方式】
[0016]为使本发明实施例的目的、技术方案和优点更加清楚，下面将结合本发明实施例中的附图，对本发明实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。
[0017]实施例一
[0018]如图1所示，本实施例提供一种图像文件处理方法，包括:
[0019]SllO获取记载有虚拟图像信息的第一数据；本领域技术人员可以理解，所述虚拟图像是指通过绘制得到的图像，可以是平面图像，也可以是呈现立体效果的立体图像，如山谷、外太空等具有立体感观效果的场景图像；
[0020]S120获取记载有现实图像信息的第二数据；本领域技术人员可以理解，所述现实图像是指通过拍摄得到的图像，其图像的真实度更加接近现实，可以是物体、动物、人脸或者人体的图像；
[0021]S130将第一数据和第二数据进行结合处理，从而得到记载有虚拟图像和现实图像的第三数据。
[0022]进一步，所述结合处理是指增强现实(Augmented Reality，简称AR)处理。本领域技术人员可以理解，所述增强现实，是在虚拟现实的基础上发展起来的新技术，也被称之为混合现实。是通过计算机系统提供的信息增加用户对现实世界感知的技术，将虚拟的信息应用到真实世界，并将计算机生成的虚拟物体、场景或系统提示信息叠加到真实场景中，从而实现对现实的增强。
[0023]如图2所示，S120所述获取记载有现实图像信息的第二数据的步骤，包括:
[0024]S121读取设备中存储的记载有虚拟图像信息的第一数据，并根据所述第一数据计算出目标特征数据；
[0025]S122识别第一数据；
[0026]S123在识别出的数据中找到符合目标数据特征的部分作为记载有现实图像信息的第二数据。
[0027]本领域技术人员可以理解，所述目标特征数据包括形状参数、范围参数、大小参数、分辨率参数和色度参数，本领域技术人员可根据目标特征数据识别出照片中的哪一部分是与所述第一数据可相匹配、可进行增强现实处理、可处理为第二数据的部分。例如，如果第一数据是人体颈部以下部分的绘制图像，那么与该第一数据相匹配的、可进行增强现实处理且可处理为第二数据的部分为照片中清晰度达到该第一数据图片参数要求的人脸范围数据，即此时的第二数据为拍摄的人脸信息数据。
[0028]实施例二
[0029]如图3所示，本实施例提供一种语音控制方法，包括:
[0030]S210接收语音信息，并提取该语音信息中的语音特征信息和语音内容信息；本领域技术人员可以理解，所述语音特征信息包括音调参数和音色参数信息，根据该语音特征信息，可识别出该输入该语音的用户；
[0031 ] S220查找到与该语音特征信息相对应的图像数据信息、音频信息、文本信息组合；
[0032]S230根据语音内容信息，依次显示图像数据、文本数据以及播放音频数据。
[0033]所述图像数据信息组合是指具有实施例一所述的相同第二数据的图像数据信息组合。这样可实现当输入特定的语音信息时，具有相同现实图像信息的图片会根据语音内容来依次进行显示。
[0034]如图4所示，所述查找到与该语音特征信息相对应的图像数据信息组合，包括:
[0035]S221建立图像数据组合与账户的匹配关系；
[0036]S222建立语音特征信息与账户的匹配关系；
[0037]S223对语音特征信息进行识别，查找到与该语音特征信息相匹配的账户，再根据该账户查找到与该账户相匹配的图像数据组合。
[0038]这样，当用户通过麦克风输入语音时，系统接收到该语音信息后，将语音信息中的音调参数和音色参数进行提取，从而获得音调参数和音色参数，根据音调参数和音色参数可识别出该用户并查找到与该用户匹配的账户，从而查找到与该账户匹配的图像数据组合，如查找到带有该用户头像的所有图像数据，包括实施例一中所述的经过将头像数据和场景数据经过增强现实处理而获得的所有第三数据。
[0039]如图5所示，所述根据语音内容信息，依次显示图像数据，包括:
[0040]S231建立与语音内容信息与第三数据的匹配关系；
[0041]S232对语音内容信息进行识别，查找到与该语音内容信息相匹配的第三数据；
[0042]S233显示第三数据。例如当语音内容为跳舞时，查询到与跳舞相匹配的图片信息，并根据设定进行显示，从而实现用户利用语音控制设定的角色跳舞。另外，根据本实施例所述的语音控制方法，还可以实现虚拟3D宠物语音互动，或参与到虚拟战争中，指挥战斗等。
[0043]如图6所示，本实施例所述的语音控制方法，还包括S240信息反馈步骤，具体包括:
[0044]S241建立语音内容信息与账户的匹配关系；
[0045]S242统计语音内容信息并根据语音内容信息分析出个性信息；
[0046]建立个性信息与账户的匹配关系；本领域技术人员可以理解，当第二数据为一 3D模型数据时，可通过反复执行该信息反馈步骤，实现在用户与设备交互的过程中，不经意间，系统通过大数据分析得出用户个性，并将个性赋予给3D模型，在长久的使用后，3D模型的反馈将越来越接近用户的个性。
[0047]如图7所示，本实施例所述的语音控制方法，还包括S250学习步骤，具体包括:
[0048]S251建立与账户相匹配的第一性格数据和第二性格数据；
[0049]S252建立与第一性格数据相匹配的第一性格比例参数以及与第二性格数据相匹配的第二性格比例参数，所述第一性格比例参数与所述第二性格比例参数的和为I ;
[0050]S253建立第一性格比例参数与时间的增长关系；
[0051]S254随着时间更新第一性格比例参数。例如每24小时，所述第一性格比例参数增长0.05。本领域技术人员可以理解，这样当第二数据为一 3D模型数据时，其所具有的第一性格将随着时间的增长而增长，其所具有第二性格将随时间的增长而减少，从而实现3D模型的成长。
[0052]如图8所示，所述S251建立与账户相匹配的第一性格数据和第二性格数据，具体包括:
[0053]S2511建立第一账户与第二账户之间的匹配关系；
[0054]S2512将第二账户的个性信息作为第一账户的第一性格数据；且将第一账户的个性信息作为第一账户的第二性格数据；本领域技术人员可以理解，所述第一账户的个性信息根据与第一账户相匹配的语音内容信息统计分析而获得；所述第二账户的个性信息根据与第二账户相匹配的语音内容信息统计分析而获得；这样，随着时间的增长，所述第一账户的第一性格数据会增长，即与第一账户所匹配的第二图像数据将具有越来越多的第二账户的个性；随着时间的增长，第一账户的第二性格数据会减少，即与第一账户所匹配的第二图像数据自己的个性会越来越少。如与第一账户相匹配的第二图像数据为少女照片，与第一账户相匹配的语音内容信息为舞蹈内容；与第二账户相匹配的第二图像数据为男子照片，与第二账户匹配的语音内容信息为战争指挥内容；随着时间的推移，第一账户匹配的少女将越来越多的显示出指挥战争的动作，而越来越少的显示出舞蹈动作，从而实现第一账户的第二图像数据与第二账户的第二图像数据相学习。通过本实施例所述的语音控制方法，还可实现第二图像数据之间的相互影响，例如用户拥有一个“孙悟空”3D模型，在进行增强现实体验时，其他用户的“猪八戒”模型进入到该用户的增强现实体验中，两个带着各自用户的个性数据的3D模型会进行自动语音或文字互动，在这个过程中相互影响。
[0055]最后应说明的是:以上实施例仅用以说明本发明的技术方案，而非对其限制；尽管参照前述实施例对本发明进行了详细的说明，本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改，或者对其中部分技术特征进行等同替换；而这些修改或者替换，并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
【主权项】
1.一种图像文件处理方法，其特征在于，包括: SllO获取记载有虚拟图像信息的第一数据； S120获取记载有现实图像信息的第二数据； S130将第一数据和第二数据进行结合处理，从而得到记载有虚拟图像和现实图像的第三数据。2.如权利要求1所述的图像文件处理方法，其特征在于，所述结合处理是指增强现实处理。3.如权利要求2所述的图像文件处理方法，其特征在于，所述S120所述获取记载有现实图像信息的第二数据的步骤，包括: S121读取设备中存储的记载有虚拟图像信息的第一数据，并根据所述第一数据计算出目标特征数据； S122识别第一数据； S123在识别出的数据中找到符合目标数据特征的部分作为记载有现实图像信息的第二数据。4.一种语音控制方法，其特征在于，包括: S210接收语音信息，并提取该语音信息中的语音特征信息和语音内容信息； S220查找到与该语音特征信息相对应的图像数据信息、音频信息、文本信息组合； S230根据语音内容信息，依次显示图像数据、文本数据以及播放音频数据。5.如权利要求4所述的语音控制方法，其特征在于，所述图像数据信息组合是指具有与相同权利要求1至3中任一项所述的第二数据的图像数据信息组合。6.如权利要求5所述的语音控制方法，其特征在于，所述查找到与该语音特征信息相对应的图像数据信息组合，包括: S221建立图像数据组合与账户的匹配关系； S222建立语音特征信息与账户的匹配关系； S223对语音特征信息进行识别，查找到与该语音特征信息相匹配的账户，再根据该账户查找到与该账户相匹配的图像数据组合。7.如权利要求6所述的语音控制方法，其特征在于，所述根据语音内容信息，依次显示图像数据，包括: S231建立与语音内容信息与第三数据的匹配关系； S232对语音内容信息进行识别，查找到与该语音内容信息相匹配的第三数据； S233显示第三数据。8.如权利要求7所述的语音控制方法，其特征在于，还包括: S241建立语音内容信息与账户的匹配关系； S242统计语音内容信息并根据语音内容信息分析出个性信息。9.如权利要求8所述的语音控制方法，其特征在于，还包括: S251建立与账户相匹配的第一性格数据和第二性格数据； S252建立与第一性格数据相匹配的第一性格比例参数以及与第二性格数据相匹配的第二性格比例参数，所述第一性格比例参数与所述第二性格比例参数的和为I ; S253建立第一性格比例参数与时间的增长关系； S254随着时间更新第一性格比例参数。10.如权利要求9所述的语音控制方法，其特征在于，所述S251建立与账户相匹配的第一性格数据和第二性格数据，包括: S2511建立第一账户与第二账户之间的匹配关系； S2512将第二账户的个性信息作为第一账户的第一性格数据；且将第一账户的个性信息作为第一账户的第二性格数据。
【文档编号】G06F3/0487GK105989132SQ201510086642
【公开日】2016年10月5日
【申请日】2015年2月17日
【发明人】吴周亚, 陈晓峰
【申请人】上海触趣网络科技有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：吴周亚;陈晓峰;
技术所有人：上海触趣网络科技有限公司;
我是此专利的发明人

上一篇：事务处理方法及装置的制造方法
上一篇：信息检索提示装置以及信息检索提示方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。