使用高精度滤波器编码/解码视频的方法和设备的制造方法

文档序号:10492646阅读:396来源:国知局
使用高精度滤波器编码/解码视频的方法和设备的制造方法
【专利摘要】使用高精度滤波器编码/解码视频的方法和设备。一种视频编码设备,所述视频编码设备包括:预测单元,用于利用FIR滤波器根据对当前块的运动向量所参照的基准块的子采样分量值进行插值所获得的值来生成预测块;减法单元,用于通过从所述当前块减去所述预测块来生成残余块;变换单元,用于通过对所述残余块进行变换来生成频率变换块;量化单元,用于通过对所述频率变换块进行量化来生成量化频率变换块;以及编码单元,用于将所述量化频率变换块编码为比特流。
【专利说明】使用高精度滤波器编码/解码视频的方法和设备
[0001 ] 本申请是申请号为201180054874.X、国际申请号为PCT/KR2011/007418、申请日为2011年10月6日、发明名称为“使用高精度滤波器编码/解码视频的方法和设备”的发明专利申请的分案申请。
技术领域
[0002]本公开在一些实施方式中涉及一种通过使用高精度滤波器编码/解码视频的方法和设备。更具体地,本公开涉及其中利用高精度滤波器生成预测信号并且使用该预测信号来生成高准确度视频信号的视频编码/解码方法和设备。
【背景技术】
[0003]本部分中的描述仅提供了与本公开相关的背景信息,并且可以不构成现有技术。
[0004]运动图片专家组(MPEG)和视频编码专家组(VCEG)已经超发了优越于现有的MPEG-4第2部分和H.263标准的视频压缩技术的新标准。新标准称为H.264/AVC(高级视频编码)并且同时作为MPEG-4第10部分和ITU-T建议!1.264发布。!1.264/^(:(下面,简单地称为!1.264)通过使用各种编码方法显著地改进了图片质量和性能。另外,关于视频编码联合小组(MPEG和VCEG的联合组)正在讨论用于比高清(HD)更高图片质量的新标准。
[0005]作为现有的运动图片编码方法,已经使用了帧内预测编码方法和帧间预测编码方法。帧内预测编码方法通过使用当前正在编码的帧内编码的块的预测值来预测块。帧间预测编码方法通过根据之前重构的帧来估计运动来预测当前帧的块。
[0006]在用于亮度信号的帧内预测方法中,根据将被编码的块的大小和预测方法,已经使用了帧内4 X 4预测、帧内16 X 16预测和帧内8 X 8预测。
[0007]图1是示出典型的九种4X 4帧内预测模式的图。
[0008]参考图1,帧内4X4预测包括九种预测模式:垂直模式、水平模式、直流(DC)模式、指向左下的对角线模式、指向右下的对角线模式、垂直偏右模式、水平偏下模式、垂直偏左模式和水平偏上模式。
[0009]图2是示出典型的四种16X 16帧内预测模式的图。
[0010]参考图2,帧内16X16帧内预测包括四种预测模式:垂直模式、水平模式、DC模式和平面模式。与帧内16X16预测类似地,帧内8X8预测也包括四种预测模式。
[0011]在用于具有4:2:0视频格式的视频的帧间预测方法(帧间预测编码)中,已经使用了运动补偿。具体地,视频帧被划分,并且通过从之前编码的帧估计运动来预测当前块。如果减小运动补偿的块大小以便于使用,则能够以更高的准确性来预测当前块。然而,编码用于每个块的运动向量信息的要求导致编码量的增加。另外,当执行运动补偿时,通过不仅关注具有整数像素的整数采样中的运动向量并且还关注具有与亮度分量相关的1/4采样分辨率和与色度分量相关的1/8采样分辨率的子采样来获得更准确的运动向量。然而,由于子采样位置的亮度和色度采样不存在于基准图片内,因此需要通过在基准图片中插值相邻的整数采样来生成这些值。

【发明内容】

[0012]技术问题
[0013]本公开的实施方式涉及通过在视频插值期间使用比线性插值准确度更高的高精度滤波器来改进视频压缩效率并且通过高效地重构视频来改进主观图片质量。
[0014]解决问题的技术手段
[0015]本发明的实施方式提供了一种视频编码/解码设备,其包括:视频编码器,将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块,通过从当前块的色度分量减去预测块来生成残余块,通过变换和量化残余块来生成量化频率变换块,以及将量化频率变换块编码到比特流中;以及视频解码器,用于从比特流生成量化频率变换块,通过对量化频率变换块进行逆量化和逆变换来重构残余块,将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块,以及通过将重构的残余块与生成的预测块相加来重构当前块的色度分量。
[0016]本公开的另一实施方式提供了一种视频编码设备,其包括:预测单元,用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块;减法单元,用于通过从当前块的色度分量减去预测块生成残余块;变换单元,用于通过对残余块进行变换来生成频率变换块;量化单元,用于通过对频率变换块进行量化来生成量化频率变换块;以及编码单元,用于将量化频率变换块编码为比特流。
[0017]本公开的又一实施方式提供了一种视频编码设备,其包括:预测单元,用于为了获得当前块的运动向量所参照的基准块的1/2子采样值,通过相邻的整数像素值适用滤波系数求出1/2采样放大值,并利用所述1/2采样放大值获得所述基准块的所有子采样的值来生成预测块;减法单元,用于通过从当前块减去预测块来生成残余块;变换单元,用于通过对残余块进行变换来生成频率变换块;量化单元,用于通过对频率变换块进行量化来生成量化频率变换块;以及编码单元,用于将量化频率变换块编码到比特流中。
[0018]本公开的又一实施方式提供了一种视频解码设备,其包括:解码单元,用于从比特流提取量化频率变换块;逆量化单元,用于通过对量化频率变换块进行逆量化来重构频率变换块;逆变换单元,用于通过对频率变换块进行逆变换来重构残余块;预测单元,用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块;以及加法单元,用于通过将重构残余块和预测块相加来重构当前块。
[0019]本公开的又一实施方式提供了一种视频解码设备,其包括:解码单元,用于从比特流提取量化频率变换块;逆量化单元,用于通过对量化频率变换块进行逆量化来重构频率变换块;逆变换单元,用于通过对频率变换块进行逆变换来重构残余块;预测单元,用于为了获得当前块的运动向量所参照的基准块的1/2子采样值,通过相邻的整数像素值适用滤波系数求出1/2采样放大值,并利用所述1/2采样放大值获得所述基准块的所有子采样的值来生成预测块;以及加法单元,用于通过将重构的残余块和预测块相加来重构当前块。
[0020]本公开的又一实施方式提供了一种视频编码/解码方法,包括:执行视频编码处理,该视频编码处理用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块,通过从当前块的色度分量减去预测块来生成残余块,通过变换并量化残余块来生成量化频率变换块,以及将量化频率变换块编码到比特流中;以及执行视频解码处理,该视频解码处理用于从比特流生成量化频率变换块,通过对量化频率变换块进行逆量化和逆变换来重构残余块,将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块,以及通过将重构的残余块与生成的预测块相加来重构当前块。
[0021]本公开的又一实施方式提供了一种视频编码方法,包括:执行预测处理,该预测处理用于通过对当前块的色度分量进行运动补偿来获得色度分量的运动向量,并且将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块;执行减法处理,该减法处理用于通过从当前块的色度分量减去预测块生成残余块;执行变换处理,该变换处理用于通过对残余块进行变换来生成频率变换块;执行量化处理,该量化处理用于通过对频率变换块进行量化来生成量化频率变换块;以及执行编码处理,该编码处理用于将量化频率变换块编码到比特流中。
[0022]本公开的又一实施方式提供了一种视频编码方法,包括:执行预测处理,该预测处理用于为了获得当前块的运动向量所参照的基准块的1/2子采样值,通过相邻的整数像素值适用滤波系数求出1/2采样放大值,并利用所述1/2采样放大值获得所述基准块的所有子采样的值来生成预测块;执行减法处理,该减法处理用于通过从当前块减去预测块来生成残余块;执行变换处理,该变换处理用于通过对残余块进行变换来生成频率变换块;执行量化处理,该量化处理用于通过对频率变换块进行量化来生成量化频率变换块;以及执行编码处理,该编码处理用于将量化频率变换块编码到比特流中。
[0023]本公开的又一实施方式提供了一种视频解码方法,包括:执行解码处理,该解码处理用于从比特流生成量化频率变换块;执行逆量化处理,该逆量化处理用于通过对量化频率变换块进行逆量化来重构频率变换块;执行逆变换处理,该逆变换处理用于通过对频率变换块进行逆变换来重构残余块;执行预测处理,该预测处理用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块;以及执行加法处理,该加法处理用于通过将重构的残余块和预测块相加来重构当前块的色度分量。
[0024]本公开的又一实施方式提供了一种视频解码方法,其包括:执行解码处理,该解码处理用于从比特流提取量化频率变换块;执行逆量化处理,该逆量化处理用于通过对量化频率变换块进行逆量化来重构频率变换块;执行逆变换处理,该逆变换处理用于通过对频率变换块进行逆变换来重构残余块;执行预测处理,该预测处理用于为了获得当前块的运动向量所参照的基准块的1/2子采样值,通过相邻的整数像素值适用滤波系数求出1/2采样放大值,并利用所述1/2采样放大值获得所述基准块的所有子采样的值来生成预测块;以及执行加法处理,该加法处理用于通过将重构的残余块和预测块相加来重构当前块。
[0025]本发明的技术效果
[0026]根据如上所述的本公开,通过准确地插值将被编码的当前块减少了实际块与预测块之间的差,从而改进了编码效率。因此,能够通过改进当前块的压缩效率并且考虑编码方法来解码变换到比特流的块来高效地重构视频。
【附图说明】
[0027]图1是示出典型的九种4X 4帧内预测模式的图;
[0028]图2是示出典型的四种16X16帧内预测模式的图;
[0029]图3是示出使用亮度分量中的典型的子采样的运动预测的图;
[0030]图4示出了典型的6抽头有限脉冲响应(FIR)滤波器的示例;
[0031 ]图5示出了典型的色度采样的线性插值的示例;
[0032]图6是示意性地示出根据本公开的实施方式的视频编码设备的框图;
[0033]图7是用于描述根据本公开的实施方式的利用预测单元插值块内的子采样值的处理的示例性图;
[0034]图8是示意性地示出根据本公开的实施方式的视频解码设备的构造的框图;
[0035]图9是用于描述根据本公开的实施方式的视频编码方法的流程图;以及
[0036]图10是用于描述根据本公开的实施方式的视频解码方法的流程图。
【具体实施方式】
[0037]如下面所述的根据一个或多个实施方式的视频编码设备和视频解码设备可以是诸如个人计算机(PC)、笔记本计算机、个人数字助理(PDA)、便携式多媒体播放器(PMP)、便携式游戏机(PSP)或无线通信终端、智能电话等等的用户终端或者诸如应用程序服务器和业务服务器的服务器终端,并且表示配备有例如用于在各种装置或有线/无线通信网络之间执行通信的诸如调制解调器的通信装置、用于存储用于编码或解码视频或者执行用于编码或解码的帧间或帧内预测的各种程序以及相关数据的存储器以及用于执行这些程序以实现操作和控制的微处理器的各种设备。
[0038]另外,由视频编码设备编码为比特流的视频可以在经由包括互联网、短距离无线或个人局域网络、无线LAN网络、WiBro(也称为WiMax)网络、移动通信网络或诸如电缆或通用串行总线(USB)的通信接口发送之后被实时地或者非实时地发送到用于对其进行解码的视频解码设备,在那里被重构并再现为视频。
[0039]—般来说,运动图片可以由一系列的图片构成,各个图片被分为诸如帧或块的预定区域。当图片被分成块时,划分后的块可以根据编码方法被分类为帧内块(intra block)或帧间块(inter block)。帧内块是指通过帧内预测编码方法进行编码的块,帧内预测编码是指下述方法,其通过在当前正在编码的当前像素内利用经过先前编码和解码重建的块的像素来预测当前块的像素,从而生成预测块,并对预测块相对于当前块的像素的差值进行编码。帧间块是指通过帧间预测编码进行编码的块,该帧间预测编码是指下述方法,其通过参照一个或多个过往图片或将来图片预测当前图片中的当前块来生成预测块,并对预测块与当前块的差值进行编码。用于对当前图片进行编码和解码而参照的帧称为基准帧。
[0040]图3是示出使用亮度分量中的典型的子采样的运动预测的图。
[0041]参考图3,运动向量能够被获得为最多到达整数采样单元中的1/4采样的子采样位置。
[0042]图4示出了6抽头有限脉冲响应(FIR)滤波器的示例。
[0043]参考图4,通过使用具有整数像素值的六个值以及六个滤波器系数{I,-5,20,20,_5,I}来插值1/2采样位置处的像素值,并且使用插值后的1/2采样像素值和整数像素值或者两个1/2采样像素值利用线性插值来对1/4采样分量进行插值。如下面的示例性等式中所示地对1/4采样位置的像素值进行插值。
[0044]等式)b’ = (lXE+(-5)XF+20XG+20XH+(-5)XI+lXJ)
[0045]b = b,/32
[0046]a=((32XG)+b,)/64
[0047]除了用于生成子采样的典型方法之外,还存在很多用于更准确地插值子采样值的方法和使用不同滤波器系数的方法。为了更准确地插值子采样值,当插值1/2采样时,通过将整数像素值乘以32(而不是除以32)并且然后除以64来对1/4采样值进行线性插值。因此,能够减少由于中途的除法运算引起的误差值。
[0048]图5示出了典型的色度采样的线性插值的示例。
[0049]参考图5,如下面的示例性等式中所示,执行使用四个整数像素值的双线性插值以通过考虑各子采样的位置来乘以权重值来对1/8子采样的像素值进行插值。
[0050](等式):a= [(8-dx) X (8_dy) XA+dxX (8_dy) XB+(8_dx) XdyXC+dxXdyXD)]/64
[0051 ] S卩,在图5的示例中,
[0052]{a=[(6X5XA) + (2X5XB) + (6X3XC) + (2X3XD)]/64}
[0053]由于在4:2:0视频格式的情况下,色度信号是亮度信号的分辨率的1/4倍(水平:1/2,垂直:1 /2),因此执行I /8子采样插值。
[0054]以该方式,当仅使用线性插值以最多1/8采样分辨率对色度采样进行插值时,与6抽头FIR滤波器相比,其是不准确的。因此,当对色度采样进行编码,降低了压缩效率。
[0055]图6是示意性地示出根据本公开的实施方式的视频编码设备的框图。
[0056]根据本公开的一个或多个实施方式的视频编码设备600通过利用亮度分量的运动向量值来生成色度分量的子采样预测值来对视频的当前块进行编码。如图6中所示,视频编码设备600可以包括预测单元610、减法单元620、变换单元630、量化单元640和编码单元650。
[0057]以宏块为单元输入将进行编码的输入视频。在该实施方式中,宏块可以具有MXN的形式,其中,M和N均具有2n的大小并且可以彼此相等或彼此不同。
[0058]预测单元610将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块。
[0059]预测单元610可以通过使用其它帧来生成预测块以预测当前宏块。即,预测单元610可以通过已经进行了编码处理的重构的前帧中的运动估计来生成运动向量,并且使用该运动向量在运动补偿处理中生成预测块。在该情况下,预测单元610可以通过使用亮度分量的运动向量值来使用色度分量中的相同的运动向量值,并且可以将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块。
[0060]减法单元620通过计算当前块的各像素的原始像素值与由预测单元610生成的预测值之间的差来生成残余信号。
[0061 ] 变换单元630将由减法单元620生成的残余信号变换到频域中。变换单元630可以通过使用用于将时间轴视频信号变换到频率轴的诸如离散余弦变换(DCT)变换或者小波变换的各种变换技术来将残余信号变换到频域中。
[0062]量化单元640对包括由变换单元630变换到频域中的残余信号的频率变换块进行量化。作为量化方法,可以使用各种量化方法。量化方法的示例包括死区统一阈值量化(DZUTQ)和量化权重矩阵。
[0063]编码单元650将由利用量化单元640量化的频率系数构成的量化频率变换块编码为比特流。可以使用熵编码技术用于进行编码,但是本公开不限于此,并且也可以使用各种编码技术。
[0064]另外,编码单元650可以包括通过将解码编码比特流所需的各种信息和量化频率系数编码到编码数据中而获得的比特流。即,编码数据可以具有包括通过编码编码块图案(CBP)、delta量化参数和量化频率系数而获得的比特流的字段以及包括用于进行预测所需的信息的比特的另一字段(例如,帧内预测的情况下的帧内预测模式,或者帧间预测的情况下的运动向量)。
[0065]逆量化单元660对变换和量化后的残余块(S卩,量化频率变换块)进行逆量化,并且逆变换单元670对逆量化后的变换残余块进行逆变换。以该方式,残余块被重构。逆量化和逆变换可以通过反过来执行分别由变换单元630和量化单元640执行的变换和量化处理来执行。即,逆量化单元660和逆变换单元670可以通过使用从变换单元630和量化单元640生成并发送的关于变换/量化的信息(例如,关于变换/量化类型的信息)来执行逆量化和逆变换。
[0066]加法单元680通过将由预测单元610生成的预测块和由逆变换单元670生成的残余块相加来生成重构块。
[0067]帧存储器690存储由加法单元680重构的块,并且使用该重构的块作为基准块以在帧内或帧间预测过程中生成预测块。
[0068]图7是用于描述根据本公开的实施方式的利用预测单元610插值块内的子采样值的处理的示例性图。
[0069]可以通过使用下面的等式I至4的方法来执行图7中所示的子采样的插值。
[0070]d7 =(lXA+(-5) XB+20XC+20XD+(-5) XE+1XF)
[0071]d = ^ /32 等式I
[0072]可以通过使用通过将相邻的整数像素值乘以预定值而获得的1/2采样放大值并且加上相乘值来获得1/2子采样值。
[0073]可以通过使用左侧三个整数像素值A、B和C以及右侧整数像素值D、E和F来获得1/2子采样值。
[0074]b7 =(32XC)+d/
[0075]b = ((32XC)+d/ )/64 等式2
[0076]可以通过使用最近的整数像素值C和1/2采样放大值d’来获得1/4子采样值。通过在对最近的整数像素值C和1/2采样放大值d’进行线性插值“b”之后进行除法运算(而不是直接对1/2子采样进行插值)获得“b”。因此,能够移除获得“d”时出现的误差。
[0077]a7 =(64X0+^
[0078]β=((64ΧΟ+^ )/128 等式3
[0079]也能够通过使用最近的整数像素值C和1/2采样放大值d,来获得b’。因此,也能够通过使用最近的整数像素值C和1/2采样放大值d’来获得1/8子采样值。
[0080]a= ((wl X (CX32)+w2Xd/ )/((wl+w2) X32)等式4
[0081]在等式1、2、3和4以及图7中,A、B、C、D、E和F表示色度分量的整数像素值,并且d、b和a分别表不色度分量的1/2子米样、色度分量的1/4子米样和色度分量的1/8子米样。
[0082]如等式I中所示,可以通过使用高精度滤波器(这里,高精度滤波器可以使用诸如FIR滤波器的各种滤波器)来生成色度分量的1/2子采样值。如等式2中所示,1/4子采样值可以使用高精度滤波器和线性插值。特别地,在1/8子采样的情况下,如等式3中所示,可以通过使用整数像素和1/4子采样来执行高精度线性插值。另外,如等式4中所示,可以通过使用整数像素和1/2子采样来执行高精度线性插值。在该情况下,wl和w2表示将与整数像素和I/2子采样相乘的权重值。通过使用高精度FIR滤波器生成使用等式I的1/2子采样值(例如,“d”)和使用等式2的1/4子采样值(例如,“b” )。通过两个像素值之间的线性插值生成使用等式3的1/8子采样值(例如,“a”)。因此,与通过单独使用线性插值来插值所有子采样的情况相比,能够生成更准确的值。
[0083]在等式I至4中使用的所有除法运算可以通过使用移位运算(> >,< <)来改进处理速度。
[0084]另外,为了在等式I至4中舍入到最近的整数,可以预先将除数的一半与被除数相加。下面的等式5是其中舍入运算添加到等式3的等式。
[0085]a= ((64 X O+K+64)/128 等式 5
[0086]FIR滤波器是一种数字滤波器并且仅利用输入信号的预定值执行滤波。因此,如果计算是滤波器的特征函数的脉冲响应,则FIR滤波器具有有限长度。另外,在FIR滤波器的等式中,FIR不具有任何反馈分量。因此,当实施相同特性时,数量级增加并且执行时间增大。然而,当相位偏移(即,保持输入与输出之间的波形)重要时可以使用FIR滤波器。
[0087]另外,在这里使用的高精度FIR滤波器中,通过使用FIR滤波器生成1/2子采样,并且如等式2中所示,没有通过使用通过将使用FIR滤波器的值(d’)除以32获得的1/2子采样值(等式I中的d),而是通过对除以32之前的值(S卩,当获得1/2子采样值时获得的FIR滤波器结果值d’)与通过将整数像素值乘以32获得的值(32XC)进行线性插值来生成1/4子采样。因此,能够防止由于中间过程中的除法运算导致的信息丢失,从而更准确地对值进行插值。
[0088]另外,所有子采样值(例如,等式I的d’、等式2的b’和等式3的a’)以及其中增加了位元以具有与子采样值相同的位元数的整数像素值可以用作在下一步骤中获得当前块的预测块的采样值。在获得了预测块之后,像素值被除以权重值,从而预测块的每采样的位元数变为等于当前块的每采样的位元数。因此,能够实现更高的性能。
[0089]另外,已经将等式4描述为用于仅计算a(l/8子采样)的插值后的值的等式。然而,即使在获得b(l/4子采样)的情况下,能够通过与获得a的情况不同地设置权重值wl和w2来获得b。以类似的方式,如果在等式2中使用f’来代替b’,使用f来代替b并且使用D来代替C,则能够获得f,并且如果在等式3中使用g’来代替a’,使用g来代替a,使用f’来代替b’,使用f来代替b并且使用D来代替C,则能够获得g。同时,能够通过对b和d进行插值来获得是1/8子采样的c,并且能够通过对d和f进行插值来获得e。因此,与a或g类似地,能够通过使用最接近的整数像素值C和1/2采样放大值d’来获得c和e。
[0090]因此,通过获得相邻的整数像素值来获得1/2子采样。能够通过使用较不精细的相邻的子采样值或者接近的整数像素值(即,当计算1/4采样值时能够使用1/2子采样和整数像素)对较精细的子采样值(1/4子采样、1/8子采样等等)进行插值。本领域技术人员甚至在没有描述所有子采样的情况下推导出使用子采样值或整数像素值对位于各位置的子采样进行插值的技术方案。
[0091]另外,可以使用除了在这里使用的高精度FIR滤波器和线性插值的插值方法。然而,重要的是,对于1/4采样来说,使用具有6个或更多抽头的FIR滤波器用于1/2采样并且执行插值以具有高精度函数(如等式2中所示)。
[0092]在4:2:0视频格式的情况下,能够通过使用等式I至3来对基准帧内的基准块进行插值。在4:4:4视频格式的情况下,基准块内的亮度分量和色度分量的分辨率相等。因此,与亮度分量同样地,色度分量需要仅插值到最多1/4采样位置。因此,如果省略了等式3中的I/8采样位置的插值,则其能够用于4:4:4视频格式。
[0093]另外,在4:2:2视频格式的情况下,水平方向的色度分量是亮度分量的分辨率的I/2倍。因此,能够通过如等式I至3那样将水平方向的色度分量插值到1/8子采样并且如4:4:4视频格式那样使用等式I和2将垂直方向的色度分量插值到1/4子采样来生成子采样。
[0094]另外,在用于现有的HD或更高的图像图片的考虑测试模型(TMuC)中,亮度分量能够被插值到1/8子采样。因此,在4: 2:0视频格式中,色度分量能够被插值到1/16子采样。因此,在本公开的上述实施方式中最多能够进行到1/8子采样位置,并且能够通过使用线性插值再次对1/16子采样位置进行插值。
[0095]同时,在前述实施方式中,已经在将色度分量作为示例的情况下对滤波和插值方法进行了描述,但是这些方法也能够应用于各种块,例如,亮度分量和R、G和B颜色的块,以及色度分量。在下面将要描述的解码方法中,也能够同等地应用于色度分量、亮度分量以及诸如R、G和B颜色的块的各种块。
[0096]图8是示意性地示出根据本公开的实施方式的视频解码设备的构造的框图。
[0097]如图8中所示,根据本公开的一个或更多实施方式的视频解码设备800通过利用亮度分量的运动向量值生成色度分量的子采样预测值来对视频的当前块进行解码。视频解码设备800包括解码单元810、逆量化单元820、逆变换单元830、加法单元840和预测单元850。
[0098]解码单元810通过对比特流进行解码来提取量化频率变换块。
[0099]解码单元810可以通过解码编码数据来解码或提取解码所需的信息以及量化频率块。解码所需的信息是指解码编码数据内的编码比特流所需的信息。例如,解码所需的信息可以是关于块类型的信息、关于运动向量的信息、关于变换/量化类型的信息以及其它各种?目息O
[0100]S卩,解码单元810通过解码是由视频编码设备600编码的数据的比特流来提取包括视频的当前块的像素信息的量化频率变换块,并且将提取的预测所需的信息传输到预测单元850。
[0101]预测单元850能够以与视频编码设备600的预测单元610相同的方式通过使用从解码单元810传输的预测所需的信息来预测当前块。
[0102]预测单元850利用FIR滤波器和线性插值,根据对当前块的色度分量的运动向量所参照的基准块的色度分量的子采样值进行插值获得的值来生成色度分量的预测块。当通过使用从比特流重构的亮度分量的运动向量获得当前块的色度分量的运动向量时,通过使用高精度FIR滤波器和线性滤波器根据运动向量所参照的基准块的色度分量的整数像素值生成预测值。
[0103]根据本公开的一个或更多实施方式的视频编码设备800的预测单元850以与参考图6在上面描述的视频编码设备600的预测单元610类似的方式生成子采样。因此,为了避免重复的描述,将省略其详细描述。
[0104]逆量化单元820对由解码单元810从比特流提取的量化频率变换块进行逆量化。逆变换单元830将由逆量化单元820逆量化的频率变换块逆变换到时域中。
[0105]加法单元840通过将由预测单元850生成的像素值和通过逆变换单元830的逆变换重构的残余信号相加来重构当前块的原始像素值。由加法单元840重构的当前块可以被传输到帧存储器860,并且可以用于在预测单元850中预测其它块。
[0106]帧存储器860存储重构视频并且使得能够生成帧内预测块和帧间预测块。
[0107]可以通过将图6的视频编码设备600的比特流输出端连接到图8的视频解码设备800的比特流输入端来构造根据本公开的实施方式的视频编码/解码设备。
[0108]根据本公开的实施方式的视频编码/解码设备包括:视频编码器,用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块,通过从当前块的色度分量减去预测块来生成残余块,通过变换并量化残余块来生成量化频率变换块,以及将量化频率变换块编码为比特流;以及视频解码器,用于从比特流生成量化频率变换块,通过对量化频率变换块进行逆量化和逆变换重构残余块,将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块,以及通过将重构的残余块与生成的预测块相加来重构当前块。
[0109]能够利用根据跟公开的一个或更多实施方式的视频编码设备600来实施视频编码器,并且能够利用根据一个或更多实施方式的视频解码设备600来实施视频解码器。
[0110]图9是用于描述根据本公开的实施方式的视频编码方法的流程图。
[0111]视频编码设备600通过执行下述步骤来编码视频:预测步骤S910,用于通过使用视频的当前块中的亮度分量的运动向量值来生成色度分量的子采样预测值;减法步骤S920,用于通过计算当前块的原始像素值与预测像素值之间的差来生成残余信号;变换步骤S930,用于通过使用DCT变换或小波变换来将生成的残余信号变换到频域中;量化步骤S940,用于量化被变换到频域中的残余信号;以及编码步骤S950,用于将量化频率变换残余?目号编码为比特流。
[0112]由于预测步骤S910、减法步骤S920、变换步骤S930、量化步骤S940和编码步骤S950分别对应于预测单元610、减法单元620、变换单元630、量化单元640和编码单元650的功能,因此将省略其详细描述。
[0113]图10是用于描述根据本公开的实施方式的视频解码方法的流程图。
[0114]通过有线/无线通信网络或线缆接收并存储视频的比特流的视频解码设备800通过利用亮度分量的运动向量值生成色度分量的子采样预测值并且对视频进行解码来重构视频的当前块,以根据用户的选择或其它运行程序重构视频。
[0115]为此,视频解码设备800通过执行下述步骤解码接收到的比特流:解码步骤S1010,用于解码比特流以提取表示视频的当前块的像素值的信息的量化频率变换残余信号;逆量化步骤S1020,用于对量化频率变换残余信号进行逆量化;逆变换步骤S1030,用于将逆量化后的频率变换残余信号逆变换到时域中;预测步骤S1040,用于根据由通过逆变换到时域中而重构的残余信号表示的当前块的预测值使用亮度分量的运动向量值来生成色度分量的子采样预测值;以及加法步骤S1050,用于通过将在步骤S1030中重构的当前块的残余信号与在步骤S1040中预测的当前块的各像素的预测像素值相加来重构当前块的原始像素值。
[0116]由于解码步骤S1010、逆量化步骤S1020、逆变换步骤S1030、预测步骤S1040和加法步骤S1050分别对应于解码单元810、逆量化单元820、逆变换单元830、预测单元850和加法单元840的操作,因此将省略其详细描述。
[0117]根据本公开的一个或多个实施方式的视频编码/解码方法可以通过根据本公开的一个或多个实施方式的视频编码方法与根据本公开的一个或多个实施方式的视频解码方法的组合来实现。
[0118]根据本公开的实施方式的视频编码/解码方法包括:视频编码步骤,用于将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器或/和线性插值所获得的插值来生成预测块,通过从当前块的色度分量减去预测块来生成残余块,通过变换并量化残余块来生成量化频率变换块,以及将量化频率变换块编码为比特流;以及视频解码步骤,用于从比特流生成量化频率变换块,通过对量化频率变换块进行逆量化和逆变换来重构残余块,将根据当前块的运动向量所参照的基准块的子采样分量值利用FIR滤波器和线性插值所获得的插值来生成预测块,以及通过将重构的残余块与生成的预测块相加来重构当前块。
[0119]能够利用根据本公开的一个或多个实施方式的视频编码步骤来实施视频编码步骤,并且能够利用根据一个或多个实施方式的视频解码步骤来实施视频解码步骤。
[0120]在上面的描述中,尽管本发明的多个实施方式的全部组件已经被描述为装配为或可操作地连接为一个单元,但是本发明并非旨在将其本身限制于这些实施方式。相反,在本发明的目标范围内,相应组件可以选择性地且可操作地按任何数量组合。每个组件本身还可以按硬件来实现,同时可以将相应组件部分地或者作为整体选择性地组合并且采用具有用于执行硬件等同物的功能的程序模块的计算机程序来实现。本领域技术人员可以容易地推断用于构成这种程序的代码或代码段。该计算机程序可以存储在计算机可读介质中,其在操作时可以实现本发明的实施方式。计算机可读介质可以包括磁记录介质、光记录介质,以及载波介质。
[0121]尽管出于例示性目的已经描述了本发明的示例性实施方式,但是本领域技术人员应当清楚,在不脱离本发明的基本特征的情况下,可以进行各种修改、添加以及替换。因此,本发明的示例性实施方式并非出于限制性目的而进行了描述。因此,本发明的范围并非通过上述实施方式而是通过权利要求书及其等同物来限制。
[0122]工业应用性
[0123]如上所述,本公开非常适合于在生成视频的子采样预测值时用于最小化实际分量与预测分量之间的差的插值以及利用该插值进行视频编码和解码的领域。由于以更高的精度预测将被编码的当前块,因此,能够通过减小实际块与预测块之间的差来增加编码效率。因此,能够提高压缩效率。
[0124]相关申请的交叉引用
[0125]如果适用,则本申请要求在韩国于2010年10月6日提交的专利申请N0.10-2010-0097547以及于2011 年7月21 日提交的专利申请N0.10-2011-0072196在35U.S.C§119(a)下的优先权,将其全部内容通过引用并入本文。另外,该非临时申请基于该韩国专利申请,以相同理由要求保护在除美国以外的其它国家的优先权,将其全部内容通过引用并入本文。
【主权项】
1.一种视频编码设备,所述视频编码设备包括: 预测单元,用于利用FIR滤波器根据对当前块的运动向量所参照的基准块的子采样分量值进行插值所获得的值来生成预测块; 减法单元,用于通过从所述当前块减去所述预测块来生成残余块; 变换单元,用于通过对所述残余块进行变换来生成频率变换块; 量化单元,用于通过对所述频率变换块进行量化来生成量化频率变换块;以及 编码单元,用于将所述量化频率变换块编码为比特流。2.根据权利要求1所述的视频编码设备,其中,所述预测单元根据对所述当前块的色度分量的运动向量所参照的基准块的色度分量的子采样分量值进行插值所获得的值来生成色度分量的所述预测块。3.根据权利要求2所述的视频编码设备,其中,所述当前块的所述色度分量的所述运动向量与所述当前块的亮度分量的运动向量值相同。4.根据权利要求2所述的视频编码设备,其中,所述预测单元还配置为使像素值除以权重值,从而所述预测块的每采样的位元数变为等于所述当前块的每采样的位元数。5.根据权利要求1所述的视频编码设备,其中,当视频为4:2:0格式时,所述预测单元利用FIR滤波器生成所述基准块的1/2子采样值,并且利用FIR滤波器对1/4子采样值进行线性插值。6.根据权利要求1所述的视频编码设备,其中,当视频具有4:2:0格式时,所述预测单元利用整数像素和1/4子采样的线性插值或利用整数像素和1/2子采样的线性插值来生成1/8子米样值。7.根据权利要求5或6所述的视频编码设备,其中,用于1/2子采样分量的所述FIR滤波器是具有6个或更多个抽头的FIR滤波器。8.根据权利要求5或6所述的视频编码设备,其中,通过对整数像素值和32的乘积以及当获得所述1/2子采样值时获得的FIR滤波结果值进行线性插值来生成所述1/4子采样值。9.根据权利要求5或6所述的视频编码设备,其中,所述预测单元插值到所述基准块的1/16子采样的位置,所述1/16子采样的位置是通过线性插值生成的。10.根据权利要求2所述的视频编码设备,其中,利用所述FIR滤波器生成1/2子采样,并且没有通过使用1/2子采样值除以权重值来生成1/4子采样,其中所述权重值是滤波器系数之和。11.根据权利要求1所述的视频编码设备,其中,当视频具有4:4:4格式时,所述预测单元插值到色度分量的1/4子采样的位置。12.根据权利要求1所述的视频编码设备,其中,当视频具有4:2:2格式时,所述预测单元插值到水平方向的色度分量的1/8子采样的位置,并且插值到垂直方向的色度分量的1/4子米样的位置。13.根据权利要求2所述的视频编码设备,其中,所述预测单元利用没有除以权重值的FIR滤波结果值来生成所述预测块,其中所述权重值是滤波器系数之和。14.根据权利要求2所述的视频编码设备,其中,所述预测单元通过使用整数像素值乘以权重值来生成所述预测块,其中,所述权重值是滤波器系数之和。15.根据权利要求1所述的视频编码设备,其中,当对子采样分量进行插值时,添加舍入 运算。
【文档编号】H04N19/59GK105847808SQ201610350084
【公开日】2016年8月10日
【申请日】2011年10月6日
【发明人】宋振翰, 林晶娟, 李英烈, 文柱禧, 金海光, 全炳宇, 韩钟基, 金正弼, 金旲衍
【申请人】Sk电信有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1