一种基于分形和h.264的高光谱图像压缩方法
【专利摘要】本发明提出了一种基于分形和H.264的高光谱图像压缩方法。首先将高光谱图像立方数据体转换为YUV格式的视频,送入编码器。高光谱视频的I帧,使用基于宏块平坦度的H.264快速帧内预测模式判别方法进行帧内预测,以去除高光谱图像的空间相关性;高光谱视频的P帧进行块运动估计/补偿分形编码,以去除高光谱图像的谱间相关性。P帧编码宏块的各种树状结构分块首先由MSE准则在参考帧中寻找最佳匹配块,确定各块的迭代函数系统系数,然后比较所有块划分方式的率失真代价,将率失真代价最小的块划分方式作为最终的帧间编码模式,记录最终的分形参数。最后,I帧和P帧的残差数据经过DCT变换、量化之后由熵编码CABAC进行编码写入码流,P帧的分形参数也进行CABAC熵编码。
【专利说明】—种基于分形和H.264的高光谱图像压缩方法
【技术领域】:
[0001]本发明属于高光谱图像压缩领域,针对高光谱图像中存在的空间相关性与谱间相关性,提出一种基于分形和H.264的高光谱图像压缩方法,在保证图像质量的前提下,大大加快了高光谱图像的压缩速度,提高了压缩比。
【背景技术】:
[0002]高光谱技术是21世纪遥感技术的发展前沿和当今遥感界关注的焦点之一,它把传统的二维成像遥感技术和光谱技术有机地结合在一起,在用成像系统获得被测物的空间信息的同时,通过光谱仪系统把被测物的辐射分解成不同波长的谱辐射,能在一个光谱区间内获得每个像素几十甚至几百个连续的载波段信息。高光谱遥感技术己经在地质学、生态学、大气研究、土壤研究很多领域得到了成功的应用,显示出很大的潜力和广阔的发展前
旦
[0003]高光谱图像在地面图像二维信息的基础上,增加了第三维光谱信息。高光谱数据是一个光谱图像的立方体,其空间图像维描述地表二维空间特征,其光谱维揭示图像每一像元的光谱曲线特征。在高光谱图像数据的空间图像维存在空间冗余,光谱维存在谱间冗余。因此高光谱图像压缩与普通图像压缩的区别是既要考虑去除空间相关性,又要考虑去除谱间相关性。目前,常用的高光谱图像压缩方法分为三大类:基于预测的方法、基于变换的方法和基于矢量量化的方法。例如陈`雨时与张晔等提出了基于线性模型最优预测的压缩方案,利用递归双向预测的思想,通过建立谱带间的线性模型,得出了信噪比下的最优预测(参见陈雨时,张晔,张钧平.基于线性模型最优预测的高光谱图像压缩[J].南京航空航天大学学报,2007,39(3):368-372.)。Penna B通过采用点数抽取策略降低KLT的计算量,并将这种改进的KLT用于高光谱图像谱间去相关,而重建图像质量并未受到明显影响(参见 Penna B,Tillo T, Magli E, et al.Transform codingtechniques for lossy hyperspectral data compression[J].1EEE Transactions onGeoscience and Remote Sensing, 2007,45 (5): 1408-1421.)。Shen-En Qian 提出了一种快速的矢量量法算法来提高码书的产生的效率,在该算法无需进行全搜索,大大地降低了运算的复杂度(参见 Shen-En Qian.Hyperspectral data compression using a fastvector quantization algorithm[J].1EEE Transactions on Geoscience and RemoteSensing.2004, 42 (8): 1791-1798.)。除了上述传统的编码方法外,近年来分形编码也被应用于高光谱图像的压缩,如夏丽丽设计了一个三维分形压缩编码算法,在去除图像空间相关性的同时去除了波段图像之间的相关性,得到了较好的压缩效果(参见夏丽丽.基于分形理论的高光谱图像压缩算法的研究[J].计算机与数字工程,2011,39(9): 132-135.)。
[0004]本发明结合了预测编码、分形编码、DCT变换编码、CABAC熵编码,利用基于宏块平坦度的H.264快速帧内预测编码方法降低高光谱图像的空间相关性,利用分形编码降低其谱间相关性,并且对编码残差数据进行DCT变换、量化,用CABAC熵编码写入码流,分形参数也进行CABAC熵编码,实现了高光谱图像的有效压缩。
【发明内容】
:
[0005]本发明提出了一种基于分形和H.264的高光谱图像压缩方法。首先将高光谱图像立方数据体转换为YUV格式的视频,送入编码器。高光谱视频的I帧,使用基于宏块平坦度的H.264快速帧内预测模式判别方法进行帧内预测,以去除高光谱图像的空间相关性;高光谱视频的P帧进行块运动估计/补偿分形编码,以去除高光谱图像的谱间相关性。P帧编码宏块的各种树状结构分块首先由MSE准则在参考帧中寻找最佳匹配块,确定各块的迭代函数系统系数,然后比较所有块划分方式的率失真代价,将率失真代价最小的块划分方式作为最终的帧间编码模式,记录最终的分形参数。最后,I帧和P帧的残差数据经过DCT变换、量化之后由熵编码CABAC进行编码写入码流,P帧的分形参数也进行CABAC熵编码。
[0006]一种基于分形和H.264的高光谱图像压缩方法,其特征在于实现步骤如下:
[0007]步骤一:将高光谱图像立方体数据转换成YUV格式的视频;
[0008]步骤二:若为高光谱视频的I帧(第一帧必须为I帧,其它帧可以设置是否为I帧),使用基于宏块平坦度的H.264快速帧内预测模式判别方法进行帧内预测模式选择,预测宏块,完成所有块的预测后可以得到I帧的预测帧。通过原始帧和预测帧之差得到编码端残差帧,转入步骤四编码残差;若为高光谱视频的P帧,转到步骤三;
[0009]步骤三:若为高光谱视频的P帧,依次对当前帧的所有宏块进行分形编码。在参考帧中的搜索窗内对当前宏块进行块匹配,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同。对每个宏块进行树状结构分块,即分块从大到小可分为16X16U6X8、8X168X8,8X8往下(亚宏块分割)可以分为8X4,4X8,4X4。首先对编码宏块的各种树状结构分块由MSE准则寻找最佳匹配块,确定各块的迭代函数系统系数即IFS系数;然后比较所有块划分方式的率失真代价;最后将率失真代价最小的块划分方式作为最终的帧间编码模式。记录最终的IFS系数,转入步骤五得到本块的重建块。如果当前帧所有的宏块都已编码完毕,所有的重建块组成重建图像(即下一帧的参考帧),通过原始图像与重建图像之差得到编码端残差图像,转到步骤四编码残差。所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块与子块的位置偏移,即运动矢量(x,y)和比例因子S、偏移因子
O;
[0010]步骤四:残差图像的数据经过DCT、量化之后的系数一方面进行Zig-Zag扫描,然后用熵编码CABAC进行编码写入码流;另一方面经过反量化、反DCT变换后得到解码端残差帧。由预测帧和解码端残差帧之和得到重建帧(即下一帧的参考帧)。如果是P帧则还要对所有IFS系数进行CABAC熵编码。判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回步骤二继续处理下一帧图像;
[0011]步骤五:通过保存的IFS系数代入解码方程式
[0012]ri=S ? dj+o(1)
[0013]计算得到预测值,由原始块和预测块之差得到编码端残差块,编码端残差块经过DCT变换、量化、反量化和反DCT变换得到解码端残差块,再由预测块和解码端残差块之和得到重建块。转入步骤三编码深度图序列P帧下一宏块。式中A为预测块的像素值,屯为参考帧相应父块的像素值。
[0014]所述步骤一中将高光谱图像立方体数据转换成YUV格式的视频包括以下两个步骤:
[0015]I)高光谱图像数据归一化至[0,255]区间内的整数。高光谱图像数据表示地物的光谱反射率,其位深度一般为16比特/像素,需要转换成8比特/像素。转换方法为首先将光谱反射率的值归一化至[0,255]区间,然后将其转换为无符号8比特的整数,最终的数值为[0, 255]区间的整数;
[0016]2)将高光谱图像数据的每个波段作为一帧,每个波段的归一化后的反射系数作为该帧的亮度元素(Y分量),色度分量Cb和Cr均设为中值128。循环执行步骤2)直到高光谱图像的所有波段处理完毕。所有帧即组成一个YUV格式的视频文件。
[0017]所述步骤二中基于宏块平坦度的H.264快速帧内预测模式判别方法包括以下五个步骤:
[0018]I)计算当前编码宏块二维灰度直方图,并记录二维灰度直方图中z轴的最大值
Zmax〇
[0019]图像的二维灰度直方图是基于图像像素灰度及像素邻域灰度均值的联合分布构成的三维描述图。设图像f(x,y)的大小为MXN,灰度级为L。由f(x,y)采用kXk点阵平
滑得到的邻域平均灰度图像为g(x,y),记为
[0020]
【权利要求】
1.一种基于分形和a 264的高光谱图像压缩方法,其特征在于如下步骤: 步骤一:将高光谱图像立方体数据转换成YUV格式的视频; 步骤二:若为高光谱视频的I帧(第一帧必须为I帧,其它帧可以设置是否为I帧),使用基于宏块平坦度的H.264快速帧内预测模式判别方法进行帧内预测模式选择,预测宏块,完成所有块的预测后可以得到I帧的预测帧。通过原始帧和预测帧之差得到编码端残差帧,转入步骤四编码残差;若为高光谱视频的P帧,转到步骤三; 步骤三:若为高光谱视频的P帧,依次对当前帧的所有宏块进行分形编码。在参考帧中的搜索窗内对当前宏块进行块匹配,子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同。对每个宏块进行树状结构分块,即分块从大到小可分为16X16U6X8、8X16、8X8,8X8往下(亚宏块分割)可以分为8X4,4X8,4X4。首先对编码宏块的各种树状结构分块由MSE准则寻找最佳匹配块,确定各块的迭代函数系统系数即IFS系数;然后比较所有块划分方式的率失真代价;最后将率失真代价最小的块划分方式作为最终的帧间编码模式。记录最终的IFS系数,转入步骤五得到本块的重建块。如果当前帧所有的宏块都已编码完毕,所有的重建块组成重建图像(即下一帧的参考帧),通过原始图像与重建图像之差得到编码端残差图像,转到步骤四编码残差。所述搜索窗为在参考帧中的矩形搜索区域;所述IFS系数包括父块与子块的位置偏移,即运动矢量(x,y)和比例因子S、偏移因子O ; 步骤四:残差图像的数据经过DCT、量化之后的系数一方面进行Zig-Zag扫描,然后用熵编码CABAC进行编码写入码流;另一方面经过反量化、反DCT变换后得到解码端残差帧。由预测帧和解码端残差帧之和得到重建帧(即下一帧的参考帧)。如果是P帧则还要对所有IFS系数进行CABAC熵编码。判断当前帧是否为最后一帧,如果是最后一帧结束编码;否则,返回步骤二继续处理下一帧图像; 步骤五:通过保存的IFS系数代入解码方程式 !Ti=S ? dj+O(I) 计算得到预测值,由原始块和预测块之差得到编码端残差块,编码端残差块经过DCT变换、量化、反量化和反DCT变换得到解码端残差块,再由预测块和解码端残差块之和得到重建块。转入步骤三编码深度图序列P帧下一宏块。式中A为预测块的像素值,Cli为参考帧相应父块的像素值。
2.根据权利要求1所述一种基于分形和H.264的高光谱图像压缩方法,其特征在于:所述步骤一中将高光谱图像立方体数据转换成YUV格式的视频包括以下两个步骤: .1)高光谱图像数据归一化至[O,255]区间内的整数。高光谱图像数据表示地物的光谱反射率,其位深度一般为16比特/像素,需要转换成8比特/像素。转换方法为首先将光谱反射率的值归一化至[O,255]区间,然后将其转换为无符号8比特的整数,最终的数值为[O,255]区间的整数; . 2)将高光谱图像数据的每个波段作为一帧,每个波段的归一化后的反射系数作为该帧的亮度元素(Y分量),色度分量Cb和Cr均设为中值128。循环执行步骤2)直到高光谱图像的所有波段处理完毕。所有帧即组成一个YUV格式的视频文件。
3.根据权利要求1所述一种基于分形和H.264的高光谱图像压缩方法,其特征在于:所述步骤二中基于宏块平坦度的H.264快速帧内预测模式判别方法包括以下五个步骤:1)计算当前编码宏块二维灰度直方图,并记录二维灰度直方图中Z轴的最大值z_。 图像的二维灰度直方图是基于图像像素灰度及像素邻域灰度均值的联合分布构成的三维描述图。设图像f(x,y)的大小为MXN,灰度级为L。由f(x,y)采用kXk点阵平滑得到的邻域平均灰度图像为g(x,y),记为
4.根据权利要求1所述一种基于分形和H.264的高光谱图像压缩方法,其特征在于:所述步骤三中P帧宏块分形编码包括以下十个步骤: 1)首先以16X16宏块为单位在参考帧中的搜索窗内对当前宏块进行块匹配。子块的位置作为父块的起始搜索点,父块的大小与子块的大小相同。按照全搜索方式遍历整个搜索窗,寻找匹配误差MSE最小的父块位置。记录该位置迭代函数系统系数即IFS系数(包括运动矢量(x,y),比例因子s,偏移因子O),并计算该模式的率失真开销costl ; 2)将该16X 16宏块划分为2个16 X 8的小块,对每个小块均按照全搜索方式遍历相应的整个搜索窗,寻找匹配误差MSE最小的相应父块位置。记录这两个位置的IFS系数,并计算两个块的率失真开销之和cost2 ; 3)将该16X 16宏块划分为2个8 X 16的小块,对每个小块均按照全搜索方式遍历相应的整个搜索窗,寻找匹配误差MSE最小的相应父块位置。记录这两个位置的IFS系数,并计算两个块的率失真开销之和cost3 ; 4)将该16X16宏块划分为4个8X8的小块,对每个小块均按照全搜索方式遍历相应的整个搜索窗,寻找匹配误差MSE最小的相应父块位置。记录这4个位置的IFS系数,并分别计算这4个块的率失真开销cost4_l、cost4_2、cost4_3、cost4_4及四个率失真开销之和 cost4 ;5)比较步骤I)到步骤4)中的率失真开销costl、cost2、cost3、cost4,若最小值为cost4,则需进一步将每个8 X 8块继续划分,转到步骤6);否则率失真开销最小的划分方式即为该宏块最终的P帧编码模式,保留相应的IFS系数,结束; 6)将第I个8X8块首先划分为2个8X4小块,对每个小块均按照全搜索方式遍历相应的整个搜索窗,寻找匹配误差MSE最小的相应父块位置。记录这两个位置的IFS系数,并计算这两个块的率失真开销之和cost5 ; 7)将第I个8X8块划分为2个4X8小块,对每个小块均按照全搜索方式遍历相应的整个搜索窗,寻找匹配误差MSE最小的相应父块位置。记录这两个位置的IFS系数,并计算这两个块的率失真开销之和cost6 ; 8)将第I个8X8块划分为4个4X4小块,对每个小块均按照全搜索方式遍历相应的整个搜索窗,寻找匹配误差MSE最小的相应父块位置。记录这4个位置的IFS系数,并计算这4个块的率失真开销之和cost7 ; 9)比较cost4_l、cost5、cost6、cost7,将其中的最小值对应的块划分方式作为该8X8块最终的编码模式,保留相应的IFS系数; 10)依次对16X16宏块的每个8X8块按照步骤6)至步骤9)的方法选择最终的编码模式,保留相应的IFS系数。 其中匹配误差MSE的计算如下:
【文档编号】H04N19/567GK103501437SQ201310453280
【公开日】2014年1月8日 申请日期:2013年9月29日 优先权日:2013年9月29日
【发明者】祝世平, 赵冬玉 申请人:北京航空航天大学