视频编码装置和方法、视频解码装置和方法、以及其程序的利记博彩app

文档序号：8909509阅读：414来源：国知局

视频编码装置和方法、视频解码装置和方法、以及其程序的利记博彩app
【技术领域】
[0001] 本发明涉及使用双预测编码的视频编码装置、视频解码装置、视频编码方法、视频解码方法、视频编码程序和视频解码程序。
[0002] 本申请基于在2012年12月28日申请的特愿2012-287927号要求优先权，并将其内容引用于此。
【背景技术】
[0003] 在通常的视频编码中，利用被摄体的空间上/时间上的连续性，将视频的各帧分割为多个处理单位块，按照每个块在空间上/时间上预测其视频信号，对示出其预测方法的预测信息和预测残差进行编码，由此，与对视频信号本身进行编码的情况相比，谋求大幅度的编码效率的提高。
[0004] 此外，在通常的二维视频编码中，进行参照相同的帧内的已经编码完毕的块来预测编码对象图像的帧内预测和参照已经解码完毕的其他帧基于运动搜索等来预测编码对象图像的帧间预测。
[0005]在包括 MPEG (活动图像专家组（Moving Picture Experts Group)) _1、MPEG_2 和 MPEG-4的许多视频压缩标准中，图像的编码/解码顺序与再现顺序不相同，因此，在帧间预测中不仅能够进行参照时间上之前的帧的前向预测，还能够进行参照之后的帧的后向预测，进而能够进行混合来自2个以上的帧的预测结果的双预测。
[0006] 根据双预测，能够降低由于图像间的旋转、亮度变化、噪声等造成的预测错误。关于双预测，在非专利文献1中详细地记载。
[0007] 该双预测也能够利用于对空间分辨率不同的视频进行编码的可伸缩（scalable) 视频编码、对多视点视频进行编码的多视点视频编码等。
[0008] 在可伸缩编码中，能够混合根据低分辨率层的解码图像进行高分辨率层的预测的层间预测和帧间预测。
[0009] 此外，在多视点视频编码中，能够混合根据不同的视点的解码图像进行编码对象视点的预测的视点间预测和帧间预测。
[0010] 关于可伸缩视频编码，在非专利文献2中详细地记载，关于多视点视频编码，在非专利文献3中详细地记载。
[0011] 此外，作为能够与通常的预测方式组合的预测方式，也能够利用将编码某个画面时的预测残差用于现在编码对象画面的预测的残差预测。关于该残差预测，在非专利文献 4中详细地记载。该方法是利用了在对具有高的相关性的2个画面根据分别对应的参照画面进行预测的情况下其预测残差也彼此具有相关性的预测方式。
[0012] 在通常的残差预测中，将某个画面的编码时的预测残差从使用另外的参照画面进行预测的现在编码对象画面的预测残差减去，对其差分进行编码。
[0013] 在可伸缩编码中，对低分辨率层中的预测残差进行上采样，并从高分辨率层中的预测残差减去，由此，能够削减码量。
[0014] 在多视点视频编码中，从编码对象视点的预测残差减去不同的视点的预测残差，由此，能够实现编码效率的提高。
[0015] 在此，对自由视点视频编码进行说明。自由视点视频是指，通过使用许多拍摄装置等从各种位置/角度拍摄对象场景来取得场景的光线信息，并以此为基础恢复任意的视点的光线信息，由此，生成从任意的视点观察的视频。
[0016] 场景的光线信息由各种数据形式表现，但是，作为最通常的形式，存在使用视频和该视频的各帧中的被称为深度图的深度图像的方式(例如，参照非专利文献5)。
[0017] 深度图是指按照每个像素记述从摄像机到被摄体的距离(进深/深度）的图，是被摄体具有的三维信息的简易的表现。
[0018] 在从2个摄像机观测同一被摄体时，被摄体中的各像素的深度值与针对该像素的摄像机间的视差的倒数成比例，因此，深度图有时也被称为视差图（视差图像)。与此相对地，有时将深度图对应的摄像机的视频称为纹理（texture)。深度图是图像的各像素每个具有一个值的表现，因此，能够被看作是灰度图像来记述。
[0019] 此外，作为深度图的时间上连续的记述的深度图视频(在以下不区别图像/视频而称为深度图）与视频信号同样地，由于被摄体的空间上/时间上的连续性，所以可以说具有空间上/时间上相关性。因此，能够利用为了对通常的视频信号进行编码而使用的视频编码方式一边去除空间上/时间上冗余性一边高效地对深度图进行编码。
[0020] 通常，在纹理与深度图之间存在高的相关性，因此，在如自由视点视频编码那样对纹理和深度图一起编码的情况下，能够利用两者之间的相关性来实现进一步的编码效率的提尚。
[0021] 在非专利文献6中，通过使用于两者的编码的预测信息(块分割、运动矢量、参照帧）共同化来排除冗余性，而实现高效的编码。
[0022] 再有，在本说明书中，图像是指活动图像的一个帧或者静止图像，将多个帧（图像）聚集的图像(活动图像）称为视频。
[0023] 现有技术文献非专利文献非专利文献 1 :M. Flier 1 and B. Girod, "Generalized B pictures and the draft H. 264/AVC video-compression standard, " Circuits and Systems for Video Technology,…，vol. 13，no. 7，pp. 587-597，2003 年；非专利文献2 :H. Schwarz, D. Marpe, and T. Wiegand,"Overview of the scalable video coding extension of the H. 264/AVC standard, "…and Systems for Video…， vol. 17，no. 9，pp. 1103-1120，2007 年9月；非专利文献 3 :M. Flier 1 and B. Girod, "Multiview video compression, " Signal Processing Magazine, IEEE, no. November 2007, pp. 66-76, 2007 年；非专利文献 4 :X. Wang and J. Ridge, "Improved video coding with residual prediction for extended spatial scalability, "Communications, Control and SignalProcessing, 2008. ISCCSP 2008. 3rd International Symposium on, no. March, pp. 1041-1046, 2008 年；非专利文献 5 :Y. Mori, N. Fukushima, T. Yendo, T. Fujii, and M. Tanimoto， "View generation with 3D warping using depth information for FTV，''Signal Processing, Image Communication, vol. 24，no. 1-2，pp. 65-72，2009 年1月；非专利文献 6:1. Daribo，C. Tillier，and B. P. Popescu，"Motion Vector Sharing and Bitrate Allocation for 3D Video-Plus-Depth Coding, ,?EURASIP Journal onAdvances in Signal Processing, vol. 2009, Article ID 258920, 13 pages, 2009 年。

【发明内容】

[0024]发明要解决的课题可是，以往的双预测混合基于2个不同的参照区域而生成的2个一次预测图像，由此，能够期待针对帧间的亮度变化的补偿、噪声的降低，另一面，在一部分中两个方向的预测较大不同的情况下，预测精度降低。作为针对这样的预测精度的不同的解决方法，存在对两个一次预测图像设定权重系数来混合的方法等。
[0025] 例如，混合的一次预测图像Pred能够表现为 Pred= 〔（P0) (Pred0)〕+ 〔（PI) (Predl)〕+D。
[0026] 在此，P0、P1为权重系数，Pred0、Predl为基于分别不同的参照区域的1次预测图像，D为偏移系数。
[0027] 关于权重系数和偏移系数，与分别使用单一的标量值相比，采用按照每个小区域或每个像素设定的系数值更有效，但是，关于为了在解码侧使用而对该系数值进行编码的情况，存在招致位流整体的码量的增大这样的问题。
[0028] 本发明是鉴于这样的情况而完成的，其目的在于提供能够在不对系数值进行编码的情况下生成高精度的预测图像的视频编码装置、视频解码装置、视频编码方法、视频解码方法、视频编码程序和视频解码程序。
[0029]用于解决课题的方案本发明提供一种视频编码装置，在将构成编码对象视频的各帧分割为多个处理区域而按照每个所述处理区域进行预测编码时，根据作为编码对象图像的各处理区域所相对应的基本参照区域来生成预测图像，所述视频编码装置的特征在于，具备：参照预测区域设定单元，针对所述编码对象图像设定作为所述基本参照区域所相对应的参照区域的第一参照预测区域和第二参照预测区域；权重系数设定单元，根据基于所述第一参照预测区域的第一参照预测图像和基于所述第二参照预测区域的第二参照预测图像来决定每个小区域的权重系数；预测区域设定单元，设定作为针对所述编码对象图像的参照区域的第一预测区域和第二预测区域；以及预测图像生成单元，基于所述权重系数根据基于所述第一预测区域的第1 一次预测图像和基于所述第二预测区域的第2 -次预测图像来生成所述预测图像。
[0030] 所述第一参照预测区域和第二参照预测区域可以基于对所述基本参照区域进行编码时的预测信息来设定。
[0031] 所述第一预测区域和第二预测区域可以设定为与所述编码对象图像的关系同等于所述第一参照预测区域和所述第二参照预测区域与所述基本参照区域之间的关系。
[0032] 所述第一参照预测区域和第二参照预测区域可以设定为与所述基本参照区域的关系同等于所述第一预测区域和所述第二预测区域与所述编码对象图像之间的关系。
[0033] 本发明还提供一种视频解码装置，在将构成视频编码数据的各解码对象帧分割为多个处理区域而按照每个所述处理区域进行解码时，根据作为解码对象图像的各处理区域所相对应的基本参照区域来生成预测图像，所述视频解码装置的特征在于，具备：参照预测区域设定单元，针对所述解码对象图像设定作为所述基本参照区域所相对应的参照区域的第一参照预测区域和第二参照预测区域；权重系数设定单元，根据基于所述第一参照预测区域的第一参照预测图像和基于所述第二参照

完整全部详细技术资料下载

当前第1页1 2 3 4 5 6

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：杉本志织;志水信哉;木全英明;小岛明;
技术所有人：日本电信电话株式会社;
我是此专利的发明人

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、王老师：1.数字信号处理 2.传感器技术及应用 3.机电一体化产品开发 4.机械工程测试技术 5.逆向工程技术研究
2、王老师：1.机器人 2.嵌入式控制系统开发
3、孙老师：1.振动信号时频分析理论与测试系统设计 2.汽车检测系统设计 3.汽车电子控制系统设计
4、毕老师：机构动力学与控制
5、袁老师：1.计算机视觉 2.无线网络及物联网
如您是高校老师，可以点此联系我们加入专家库。