压缩编码高光谱遥感图像的多层次码书矢量量化方法
【专利摘要】本发明公开一种压缩编码高光谱遥感图像的多层次码书矢量量化方法,涉及图像处理【技术领域】,该方法根据失真情况将高光谱图像的光谱矢量分割为低维、中维、高维三个部分,然后对失真较大的低维部分采用大尺寸码书,失真不大的中维部分采用中尺寸码书,失真较小的高维部分采用小尺寸码书,这样采用多层次码书,并结合离散度排序后仅提取低维部分四分之一分量训练编码索引的方式,能在相同压缩比下,达到有效降低高光谱图像的量化失真的同时,明显减少各项计算量的目标。本发明能在较小的计算复杂度条件下,以更快的速度实现高光谱图像更高质量的压缩编码,具有实际应用的价值,是一种压缩性能较好的高光谱图像有损、近无损压缩方案。
【专利说明】压缩编码高光谱遥感图像的多层次码书矢量量化方法
【技术领域】
[0001] 本发明属于高光谱遥感图像处理领域,具体涉及一种压缩编码高光谱遥感图像的 多层次码书矢量量化方案。
【背景技术】
[0002] 近年来,传统的二维彩色图像已经远远不能满足人们的需求,取而代之的是高光 谱图像的应用越来越广泛。高光谱图像是高光谱成像光谱仪以纳米级的波段宽度,在几百 个谱带上对目标进行连续的光谱成像而形成的光谱图像,被定义为二维空间域和一维光谱 域组成的三维立体数据。这种特殊的图像不同于普通的二维灰度图像和彩色图像,它具有 以下一些特点:1)细节丰富、纹理复杂。每个相同空间位置的地面目标都对应几百个光谱 波段的像素值,这些像素值是传感器在某特定波长所接收到的强度返回值,可以细致精确 地反映出地物目标在该波段的光谱特征。2)具有很高的谱间分辨率,谱间相关性强。高光 谱图像的波段数目多达几百个,光谱分辨率达纳米级,如此高的光谱分辨率使得相邻波段 相同地物目标的光谱特性十分接近,所以谱间相关性很高,大部分相邻两个波段的互相关 系数都接近1。3)空间分辨率相对较低,空间相关性较普通图像弱。这是因为高光谱图像 的空间分辨率一般为几米,地面目标可能只占几个或更少的像元,使相同波段像素值的连 续性差。4)特性相似的地物具有相似的光谱曲线。每一个相同空间位置的地物目标都对应 一组像素值,把这些像素值按波长大小的顺序组合起来就可以构成应该空间位置地物目标 的一条光谱曲线,曲线的精确形状是严格依赖于该空间位置地物的类型和性质的,所以从 光谱曲线的相似程度可以确定地物目标的分类。
[0003] 由于高光谱图像比一般图像含有更为丰富的信息,使得它们在很多领域都发挥了 重要的作用,例如,地质勘探、农业科研、水文监测、生物医学、植被研究、军事侦察等,而且 其应用前景十分广阔。但是,随着高光谱遥感技术的发展,高光谱遥感成像光谱仪在空间和 谱间分辨率指标不断提高,这使得高光谱图像的数据量也在急剧增长。为了保证海量高光 谱数据得到高效的采样、传输、存储和应用,迫切需要研究出高质量的高光谱图像压缩编码 技术。
[0004] 现有的高光谱图像压缩方法,基本可以分为三大类:1)基于预测技术的压缩方 法。其原理是利用临近像素的相关性,用某种顺序扫描图像,同时用已经编码过的临近像素 的线性组合来预测当前像素,然后只传递预测误差到接收端,原始图像就可以通过误差图 像得到精确的地恢复。可以看出基于预测技术的压缩方法一般用于无损压缩。该类方法对 高光谱图像的压缩流程一般是:波段排序、预测和编码。2)基于变换技术的压缩方法。基 于变换技术的压缩方法既可以用于有损压缩也可以用于无损压缩,其原理是将图像数据映 射到变换域,以去除像素间的相关性,使图像的大部分能量集中在少数幅值较大的变换系 数上,而其他幅值较小的变换系数表示的是图像相对一些不重要的细节分量,通过利用较 少的码字描述幅值较大的系数所代表的主要能量成分,而量化掉幅值较小的变换系数所代 表的细节分量达到压缩的目的。3)基于矢量量化技术的方法。矢量量化主要用于有损或者 近无损压缩,它将输入信号分块重组成矢量数据,然后直接对矢量数据进行量化编码,是一 种十分高效的压缩手段。自从1980年Linde等人提出LBG(Linde Bazo Gray)算法以来, 矢量量化技术得到了不断发展和完善,压缩质量和计算复杂度都得到了很大改善。图3是 传统的LBG方法流程框图,图4是矢量维数分割量化的超光谱图像压缩方法流程图。
[0005] 三大类方法中基于预测技术的压缩方法压缩质量高,但是压缩比低;基于变换技 术的压缩方法可以按要求实现不同程度的压缩,甚至可以完全重构原图像,但是变换改变 了图像原有的特性,且有的变换需要非常大的计算量;基于矢量量化技术的压缩方法压缩 比高、编解码简单,能快速地实现高光谱图像的有损或者近无损压缩,有效降低高光谱图像 的数据量,但图像恢复质量低,且其矢量量化方案均采用统一的码书量化各维分量,缺乏对 数据的适应性。
【发明内容】
[0006] 本发明针对现有高光谱图像各种压缩方法,或压缩质量高但计算复杂度大,或计 算量小但图像恢复质量低,且其矢量量化方案均采用统一的码书量化各维分量,缺乏对数 据的适应性的问题,提出了一种压缩编码高光谱遥感图像的多层次码书矢量量化方案。该 方案根据失真情况,将高光谱图像的光谱矢量分割为低维部分、中维部分、高维部分三个部 分,然后对失真较大的低维部分采用大尺寸码书,失真不大的中维部分采用中尺寸码书,失 真较小的高维部分采用小尺寸码书。相同压缩比下,该方案能在有效提高高光谱图像的压 缩质量的同时,大幅度降低计算复杂度,快速高效地完成高光谱遥感图像的有损或近无损 压缩。
[0007] -种压缩编码高光谱遥感图像的多层次码书矢量量化方法,读取高光谱图像三维 数据,截取要压缩的子块转化为二维矩阵形式的原始矢量数据,将原始矢量数据分割为低 维部分、中维部分、高维部分;然后对三部分矢量数据分别作哈达玛Hadamard变换和离散 度排序预处理,得到预处理后的三部分矢量数据;对预处理后的三部分矢量数据分别截取 矢量数据的前1/4维分量组成低维部分、中维部分、高维部分训练子矢量数据,剩余的3/4 维分量作为对应部分的尾部子矢量数据;根据基本码书尺寸设置码书尺寸为多层次码书, 对各部分训练子矢量数据进行矢量量化,得到迭代的训练子矢量码字索引和训练子矢量码 书;根据训练子矢量码字索引分别对三部分尾部子矢量数据编码,得到三部分尾部子矢量 码书和码字索引;分别整理各部分码书,得到三部分空域最终完整码书和最终码字索引,完 成高光谱图像数据块的压缩编码。所述分割原则为:三部分矢量的维数分别都满足2的整 数次幂,若不满足则在矢量末尾补零将维数扩展为最接近2的整数次幂,三部分矢量维数 之和等于或接近原矢量维数。预处理具体为:先作Hadamard变换,将各部分矢量数据中每 个行矢量右乘一个相同维数的Hadamard方阵;计算各部分矢量数据中每维分量的离散度, 某维分量的离散度等于该维分量的最大值与该维分量的最小值的差值;将各部分矢量的离 散度值分别进行降序排序,记录排序索引,按照排序索引分别重新排列对应部分矢量数据 的各维分量。设定码书尺寸为多层次码书具体为,根据基本码书尺寸N设定低维部分训练 子矢量码书尺寸&、中维部分训练子矢量码书尺寸N 2、高维部分训练子矢量码书尺寸N3,Np N2、N3为N的倍数,其中,& > N2 > N3。进行矢量量化进一步包括:搜索每个训练子矢量的 最佳匹配码字,并将训练子矢量划分到对应的胞腔中,记录对应的码字索引,直到所有的训 练子矢量都训练完成,以各胞腔的质心代替原来胞腔对应的码字,保存最后一次迭代产生 的低维训练子矢量码书和码字索引、中维训练子矢量码书和码字索引、高维训练子矢量码 书和码字索引。进行矢量量化进一步包括:获取初始码书和初始码字索引,计算训练矢量集 中的各训练子矢量的2范数,并将其按升序排序,记录排序索引,按照该索引重新排序各训 练子矢量,对各训练子矢量平均分组后取每组最后一个组成初始码书,各训练子矢量的分 组号作为其对应的初始码字索引。得到三部分尾部子矢量码书和码字索引具体为:将三部 分训练子矢量码字索引作为对应部分的尾部子矢量编码索引,按照编码索引将所有尾部子 矢量分配到各个胞腔中,以各胞腔的质心作为码字,得到各部分尾部子矢量码书。整理各部 分码书具体包括,将训练子矢量码书作为前1/4维分量,尾部子矢量码书作为后3/4分量, 连接成对应部分的Hadamard变换域完整码书;再对各部分Hadamard变换域完整码书进行 离散度反排序、Hadamard反变换得到各部分空域最终完整码书,将训练子矢量码字索引作 为空域最终码字索引。
[0008] 搜索每个训练子矢量的最佳匹配码字进一步包括:按照当前训练矢量X对应 的码字索引I(i)找到码书W中第I(i)个码字Y#,计算X和Y%之间的欧式距离作为 当前最小失真
【权利要求】
1. 一种压缩编码高光谱遥感图像的多层次码书矢量量化方法,其特征在于,读取高光 谱图像三维数据,截取要压缩的子块转化为二维矩阵形式的原始矢量数据,将原始矢量数 据分割为低维部分、中维部分、高维部分;然后对三部分矢量数据分别作哈达玛Hadamard 变换和离散度排序预处理,得到预处理后的三部分矢量数据;对预处理后的三部分矢量数 据分别截取矢量数据的前1/4维分量组成低维部分、中维部分、高维部分训练子矢量数据, 剩余的3/4维分量作为对应部分的尾部子矢量数据;设置码书尺寸为多层次码书,对各部 分训练子矢量数据进行矢量量化,得到迭代的训练子矢量码字索引和训练子矢量码书;根 据训练子矢量码字索引分别对三部分尾部子矢量数据编码,得到三部分尾部子矢量码书和 码字索引;分别整理各部分码书,得到三部分空域最终完整码书和最终码字索引,完成高光 谱图像数据块的压缩编码。
2. 根据权利要求1所述的方法,其特征在于,所述分割原则为:三部分矢量的维数分别 都满足2的整数次幂,若不满足则在矢量末尾补零将维数扩展为最接近2的整数次幂,三部 分矢量维数之和等于或接近原矢量维数。
3. 根据权利要求1所述的方法,其特征在于,预处理具体为:对三部分矢量数据分别作 Hadamard变换,将各部分矢量数据中每个行矢量右乘一个相同维数的Hadamard方阵;根据 某维分量的最大值与最小值计算各部分矢量数据中该维分量的离散度;将各部分矢量的离 散度值分别进行降序排序,记录排序索引,按照排序索引分别重新排列对应部分矢量数据 的各维分量。
4. 根据权利要求1所述的方法,其特征在于,设定码书尺寸为多层次码书具体为,根据 基本码书尺寸N设定低维部分训练子矢量码书尺寸N1、中维部分训练子矢量码书尺寸N2、高 维部分训练子矢量码书尺寸N3,其中,NpN2、N3为N的倍数,N1 >N2 >N3。
5. 根据权利要求1所述的方法,其特征在于,进行矢量量化进一步包括:搜索每个训练 子矢量的最佳匹配码字,并将训练子矢量划分到对应的胞腔中,记录对应的码字索引,直到 所有的训练子矢量都训练完成,以各胞腔的质心代替原来胞腔对应的码字,保存最后一次 迭代产生的低维训练子矢量码书和码字索引、中维训练子矢量码书和码字索引、高维训练 子矢量码书和码字索引。
6. 根据权利要求1所述的方法,其特征在于,进行矢量量化进一步包括:获取初始码书 和初始码字索引,计算训练矢量集中的各训练子矢量的2范数,并将其按升序排序,记录排 序索引,按照该索引重新排序各训练子矢量,对各训练子矢量平均分组后取每组最后一个 组成初始码书,各训练子矢量的分组号作为其对应的初始码字索引。
7. 根据权利要求1所述的方法,其特征在于,得到三部分尾部子矢量码书和码字索引 具体为:将三部分训练子矢量码字索引作为对应部分的尾部子矢量编码索引,按照编码索 引将所有尾部子矢量分配到各个胞腔中,以各胞腔的质心作为码字,得到各部分尾部子矢 量码书。
8. 根据权利要求1所述的方法,其特征在于,整理各部分码书具体包括,将训练子矢量 码书作为前1/4维分量,尾部子矢量码书作为后3/4维分量,连接成对应部分的Hadamard 变换域完整码书;再对各部分Hadamard变换域完整码书进行离散度反排序,Hadamard反变 换得到各部分空域最终完整码书,将训练子矢量码字索引作为空域最终码字索引。
9. 根据权利要求5所述的方法,其特征在于,搜索每个训练子矢量的最佳匹配码字进 一步包括:按照当前训练矢量X对应的码字索引I(i)找到码书W中第I(i)个码字Ytjp, 计算X与Ytjp之间的欧式距离作为当前最小失真
,按照Ytjp为中心 上下搜索,输入当前判断码字t;计算
,其中Normx为X的2范数, NormY(j)为当前判断码字Yj的2范数,若D1彡Dmin,且Normx彡NormY(j),则排除码字Yk(k=1,…,j),若Normx彡NormY(j),则排除码字Yk(k=j,…,N);若不满足D1彡Dmin,计_
若不等式D2 >Dmin成立,则排除码字Yp否则,计算X与t的累积 失真
,若不等式Dq(XJj)SDmin成立,则排除码 字Yj,如直到q=m,不等式Dq (X,Yj)彡Dmin均不成立,则当前码字Yj为训练矢量X对应的 最匹配码字,其中,k表示第k维分量,m表示训练矢量X的维数,N为码书W的尺寸,VxS 当前训练矢量X的方差,Vy (j)为当前码字t的方差,Xk为X的第k维分量,X1为X的第一 维分量,Ym为t的第一维分量。
【文档编号】H04N19/154GK104244017SQ201410482379
【公开日】2014年12月24日 申请日期:2014年9月19日 优先权日:2014年9月19日
【发明者】陈善学, 郑文静, 张佳佳, 杨亚娟 申请人:重庆邮电大学