播放装置及音效调整方法

文档序号:8946215阅读:321来源:国知局
播放装置及音效调整方法
【技术领域】
[0001]本发明涉及视频播放领域,具体涉及一种播放装置及音效调整方法。
【背景技术】
[0002]立体声是指具有立体感的声音,它是一个几何概念,指在三维空间中占有位置的事物。因为声源有确定的空间位置,声音有确定的方向来源,人们的听觉有辨别声源方位的能力。特别是有多个声源同时发声时,人们可以凭听觉感知各个声源在空间的位置分布状况。
[0003]从这个意义上讲,自然界所发出的一切声音都是立体声,如雷声、火车声、风声、雨声等等。当人们直接听到这些立体空间中的声音时,除了能感受到声音的响度、音调和音色夕卜,还能感受到它们的方位和层次。这种人们直接听到的具有方位层次等空间分布特性的声音,称为自然界中的立体声。
[0004]但是,在室内场景中,如果要通过音响装置来播放立体声,就会存在精准播放的问题,该问题是由于在室内场景中,播放装置无法感知听众的存在位置而无法实现精准的立体声播放控制而导致的。

【发明内容】

[0005]本发明要解决的技术问题在于,针对现有技术的上述缺陷,提供一种播放装置及音效调整方法,能精准的感知听众的存在位置而实现精准的立体声播放。
[0006]本发明实施方式提供的播放装置,与摄像装置及音响装置通讯,用于调整所述音响装置的音效,其特征在于,所述播放装置包括映射模块、图像分析模块、坐标计算模块、音效调节模块。映射模块用于建立人脸在真实场景与所述摄像装置所获取的场景图像中的三维映射系数;图像分析模块用于通过所述摄像装置获取听众所在场景的实时图像,并从所述实时图像分析出听众的人脸在实时图像中的相对位置及大小;坐标计算模块用于依据所述三维映射系数、所述听众的人脸在实时图像中的相对位置及大小计算出听众在真实场景中的实时三维空间坐标;音效调整模块用于依据所述听众在真实场景中的实时三维空间坐标为听众实时调整所述音响装置的音效。
[0007]本发明实施方式提供的音效调节方法,用于播放装置中,所述播放装置与摄像装置及音响装置通讯,其特征在于,所述音效调节方法包括:建立人脸在真实场景与所述摄像装置所获取的场景图像中的三维映射系数;通过所述摄像装置获取听众的实时图像;从所述实时图像分析出听众的人脸在实时图像中的相对位置及大小;依据所述三维映射系数、所述听众的人脸在实时图像中的相对位置及大小计算出听众在真实场景中的实时三维空间坐标;及依据所述听众在真实场景中的实时三维空间坐标为听众实时调整所述音响装置的音效。
[0008]本发明的有益效果在于,通过人脸侦测的技术来精准的感知听众的存在位置,达到更加精准的控制立体声播放的效果。
【附图说明】
[0009]下面将结合附图及实施例对本发明作进一步说明,附图中:
[0010]图1是本发明实施方式的播放装置的运行环境示意图;
[0011]图2是本发明实施方式的播放装置的功能模块图;
[0012]图3是本发明实施方式的音效调整方法的流程图;
[0013]图4是图3所示的步骤S300的一实施例的细化流程图;
[0014]图5是图3所示的步骤S308的一实施例的细化流程图。
【具体实施方式】
[0015]现结合附图,对本发明的较佳实施例作详细说明。
[0016]如图1所示,本实施方式提供的播放装置10与摄像装置20及音响装置30通讯,用于调整所述音响装置30的音效。在本实施方式中,播放装置10可以为家庭影院、电视机顶盒、唱戏机等产品,摄像装置20可外接于播放装置10,如摆放在播放装置10的顶部,亦可内嵌于播放装置10。音响装置30可为蓝牙音箱、WIFI音箱等产品。音响装置30可以为一个,也可以为多个。本实施方式中的播放装置10可根据听众40的具体位置为听众40调整音响装置30的音效。其中,听众40可以为一人,也可以为多人,播放装置10会选择一人为其调整音响装置30的音效。
[0017]图2是本发明实施方式的播放装置10的功能模块图。在本实施方式中,播放装置10包括映射模块100、图像分析模块102、坐标计算模块104、音效调节模块106。
[0018]映射模块100用于建立人脸在真实场景与摄像装置20所获取的场景图像中的三维映射系数。在本实施方式中,真实场景是指真实的环境。摄像装置20获取的场景图像是指摄像装置20所拍摄的场景的图像,这图像中包括人脸。
[0019]首先,播放装置10的用户需要先行在真实场景中选定一个三维空间,并为播放装置10做初始化设置,用户第一次使用播放装置10时才需要做此设置,第二次使用时不需做此设置。在本实施方式中,三维空间可以依据播放装置10所提供的方式来选择,播放装置10可以提供多种选择方式,比如可以摄像装置20所在的位置为基准选择播放装置10所在的平面与房间地面所在的平面作为三维空间。当然,在实际计算过程中,还有很多其他的方式来选择三维空间,但具体的计算原则类似,这里的选择仅作举例之用。
[0020]用户以选择的三维空间为基准,量测一个真实人脸在真实场景中的三维空间坐标(XI,Yl, Zl),并输入到播放装置10。
[0021]映射模块100接收到用户输入的一个真实人脸在真实场景中的预设置的三维空间坐标(X1,Y1,Z1)。
[0022]映射模块100通过摄像装置20获取所述真实人脸处于三维空间坐标(XI,Yl, Zl)时的场景图像。由于需要适应使用者的不同姿势,所以需要实现多角度的人脸侦测。
[0023]映射模块100依据所述真实人脸的场景图像分析得出所述真实人脸在场景图像中的相对位置(xl,yl)及大小(hi)。在本实施方式中,所述真实人脸在图像中的相对位置(xl,yI)、人脸宽度及高度可通过常用的人脸侦测技术得出,在此不做赘述,其中,所述真实人脸在图像中的大小(hi)可采用人脸宽度、人脸高度或人脸面积等数据。
[0024]映射模块100依据所述真实人脸在图像中的相对位置(xl,yl)及大小(hi)与所述真实人脸的预设置的三维空间坐标(X1,Y1,Z1)计算出所述三维映射系数(αχ, ay, a z)。在本实施方式中,可以采用以下公式来计算三维映射系统:a χ = Χ1/χ1,a y = Yl/yl,a z = Zl/hl。映射模块100所完成的功能只在用户设置后才运行,并非每次打开播放装置10都需要运行。
[0025]播放装置10打开,进入正常播放状态。图像分析模块102通过摄像装置20获取听众40的实时图像。具体而言,摄像装置20获取视频图像,获取的视频图像是普通的YUV数据或者RGB彩色图像数据,然后检测视频图像中的人脸,检测方法可以采用目前常用的人脸检测方法,如SVM,ADAB00ST,肤色等。
[0026]听众40从摄像装置20前走过或者坐在某一特别位置,图像分析模块102会依据时间间隔获取听众40所在场景的图像,产生一系列图像。如果侦测到用户在移动,则获取时间间隔可以更小一些,而如果侦测到用户位置变动不大,则获取时间间隔可以设置得大
——止匕
~、O
[0027]图像分析模块102从所述实时图像分析出听众的人脸在图像中的相对位置(x2,y2)及大小(h2)。在本实施方式中,在有多个听众40存在时,摄像装置20获取到同时存在多个听众40的实时图像,图像分析模块102侦测出每一个听众的人脸大小,然后选择最大的人脸大小来计算听众40的实时三维空间坐标。
[0028]坐标计算模块104依据三维映射系数(ax, ay, a z)、听众40的人脸在图像中的相对位置(x2,y2)及大小(h2)计算出听众40在真实场景中的实时三维空间坐标(X2,Y2,Ζ2)。在本实施方式中,可以采用以下方式计算三维空间坐标:(Χ2 = a χ*χ2,Υ2 = a y*y2,Z2 = a z*h2) o
[0029]音效调整模块106用于依据听众40在真实场景中的实时三维空间坐标(X2,Y2,Z2)为听众40实时调整音响装置30的音效。
[0030]在本实施方式中,用户除了需要输入真实人脸的三维空间坐标(X1,Y1,Z1)之外,还需要量测每一个音响装置30所在的三维空间坐标(Χ3,Υ3, Ζ3)并输入到播放装置10,同时,还可以依据三维空间原点的选择来输入摄像装置20的三维坐标。这次输入也只是在用户首次使用播放装置10时才需要,再次使用不需设置,若变更了音响装置30的位置就需要重新设置一下。
[0031]在本实施方式中,音效调整模块106接收用户输入的音响装置30的三维空间坐标(Χ3, Υ3, Ζ3),然后根据音响装置30的三维空间坐标(Χ
当前第1页1 2 
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1