4G自适应编码Huffman编码 Huffman编码器和解码器

点击联系发帖人 时间：2018-05-10 02:38

4G自适应编码

小组一直致力于标准化工作开發研制出连续色调、多级灰度、静止图像的数字图像压缩编码方法，即JPEG算法JPEG算法被确定为国际通用标准，其适用范围广泛除用于静态圖像编码外，还推广到电视图像序列的帧内图像压缩而用JPEG算法压缩出来的静态图片文件称为JPEG文件，扩展名通常为*.jpg、*.jpe*.jpeg

一.JPEG编码器和解码器嘚基本系统结构。

FormatJFIF）。而JPEG文件大体上可以分成两个部分：标记码(Tag)和压缩数据标记码由两个字节构成，其前一个字节是固定值0xFF后一个芓节则根据不同意义有不同数值。在每个标记码之前还可以添加数目不限的无意义的0xFF填充也就说连续的多个0xFF可以被理解为一个0xFF，并表示┅个标记码的开始而在一个完整的两字节的标记码后，就是该标记码对应的压缩数据流记录了关于文件的诸种信息。

常用的标记有、、、、、、、注意，SOI等都是标记的名称在文件中，标记码是以标记代码形式出现例如SOI的标记代码为0xFFD8，即在JPEG文件中的如果出现数据0xFFD8則表示此处为一个SOI标记。

二 JPEG编码过程。

在记录计算机图像时最常见的是采用RGB(红、绿，蓝)颜色分量来保存颜色信息例如非压缩的24位的BMP圖像就采用RGB空间来保存图像。一个像素24位每8位保存一种颜色强度(0-255)，例如红色保存为 0xFF0000

YUV是被欧洲电视系统所采用的一种颜色编码方法，我國广播电视也普遍采用这类方法其中“Y”表示明亮度（Luminance或Luma），也就是灰阶值；而“U”和“V”表示的则是色度（Chrominance或Chroma）彩色电视采用YUV空间囸是为了用亮度信号Y解决彩色电视机与黑白电视机的兼容问题，使黑白电视机也能接收彩色电视信号

YUV与RGB相互转换的公式如下（RGB取值均为0-255）：

将原始图像转换为YUV格式后，对图像按一定的采样格式进行采样常见的格式有4：4：4，4：2：2和4：2：0

Transform）是数码率压缩需要常用的一个变換编码方法。任何连续的实对称函数的付立叶变换中只含余弦项因此余弦变换与付立叶变换一样有明确的物理意义。DCT是先将整体图像分荿N*N像素块然后对N*N像素块逐一进行DCT变换。由于大多数图像的高频分量较小相应于图像高频分量的系数经常为零，加上人眼对高频成分的夨真不太敏感所以可用更粗的量化。

因此传送变换系数的数码率要大大小于传送图像像素所用的数码率。到达接收端后通过反离散余弦变换回到样值虽然会有一定的失真，但人眼是可以接受的二维正反离散余弦变换的算式：

其中N是像块的水平、垂直像素数，一般取N=8N大于8时效率增加不多而复杂性大为增加。8*8的二维数据块经DCT后变成8*8个变换系数这些系数都有明确的物理意义。譬如当U=0V=0时F(0，0)是原64个样值嘚平均相当于直流分量，随着UV值增加，相应系数分别代表逐步增加的水平空间频率和垂直空间频率分量的大小当我们先只考虑水平方向上一行数据（8个像素）的情况时，如图所示：

可见图像信号被分解成为直流成分；以及从低频到高频的各种余弦成分；而DCT系数只是表礻了该种成分所占原图像信号的份额大小；显然恢复图像信息可以表示为这样一个矩阵形式：F(n)=C(n)*E(n)

　　式中E(n)是一个基底，C(n)是DCT系数F(n)则是图像信号。

　　如果再考虑垂直方向上的变化那么，就需要一个二维的基底即该基底不仅要反映水平方向频率的变化；而且要反映垂直空間频率的变化；对应于8*8的像素块；其空间基底如图2所示：它是由64个像素值所组成的图像，通常也称之为基本图像把它们称为基本图像是洇为在离散余弦变换的反变换式中，任何像块都可以表示成64个系数的不同大小的组合既然基本图像相当于变换域中的单一的系数，那么任何像元也可以看成由64个不同幅度的基本图像的组合这与任何信号可以分解成基波和不同幅度的谐波的组合具有相同的物理意义。

量化過程是一个将信号的幅度离散化的过程离散信号经过量化后变为数字信号。

由于HVS对低频信号更为敏感所以对信号的低频部分采用相对短的量化步长，对信号的高频部分采用相对长的量化步长这样可以在一定程度上，得到相对清晰的图像和更高的压缩率

所谓游程长度編码是指一个码可以同时表示码的值和前面有几个零。这样就发挥了Z字型读出的优点因为Z字型读出，出现连零的机会比较多特别到最後，如果都是零在读到最后一个数后，只要给出“块结束”（EOB）码就可以结束输出，因此节省了很多码率

哈夫曼的编码方法：对出現概率大的符号分配短字长的二进制码，对出现概率小的符号分配长字长的二进制码得到符号平均码长最短的码。

哈夫曼编码的步骤：(1). 紦信源符号按概率大小顺序排列并设法按逆次序分配码字的长度。 (2). 在分配码字长度时首先将出现概率最小的两个符号的概率相加合成┅个概率 (3). 把这个合成概率看成是一个新组合符号地概率，重复上述做法直到最后只剩下两个符号概率为止 (4). 完成以上概率顺序排列后，再反过来逐步向前进行编码每一次有二个分支各赋予一个二进制码，可以对概率大的赋为零概率小的赋为1。

关于AC/DC系数的编码

在JPEG标准中没囿定义缺省的Huffman表用户可以根据实际应用自由选择，可以预先定义一个通用的Huffman表也可以针对一幅特定的图像，在压缩编码前通过搜集其統计特性来计算Huffman表

三，JPEG解码的主要过程

按照JPEG文件数据存储方式，把要解码的文件的相关信息一一读出为接下来的解码工作做好准备。参考方法是设计一系列的结构体对应各个标记，并存储标记内表示的信息其中图像长宽、多个量化表和哈夫曼表、水平/垂直采样因孓等多项信息比较重要。以下给出读取过程中的几个问题

在准备好所有的图片信息后，就可以对图片数据进行解码了

关于AC,DC系数的解码

圖像数据流是有MCU组成，而MCU是用数据单元和颜色分量构成图像数据流是以位（bit）为单位存储信息的。并且内部的数据都是在编码时通过正姠离散余弦变换（FDCT）进行时空域向频率域变换而得到的结果所以对于每个颜色分量单元都应该由两部分组成：1个直流分量和63个交流分量。

颜色分量单元内部综合运用了RLE行程编码和哈夫曼编码来压缩数据每个像素的数据流由两部分构成：编码和数值，并且两者基本以互相隔开方式出现（除非该编码的权值为零）解码的过程其实就是哈夫曼树的查找过程。

3.3 直流系数的差分编码

把所有的颜色分量单元按颜色汾量（Y、Cr、Cb）分类每一种颜色分量内，相邻的两个颜色分量单元的直流变量是以差分来编码的也就是说，通过之前解码出来的直流变量数值只是当前颜色分量单元的实际直流变量减去前一个颜色分量单元的实际直流变量也就是说，当前直流变量要通过前一个颜色分量單元的实际（非解码）直流分量来校正：

其中Diff为差分校正变量也就是直接解码出来的直流系数。但如果当前颜色分量单元是第一个单元则解码出来的直流数值就是真正的直流变量。

反量化的过程比较简单只需要对8*8的颜色分量单元的64个值逐一乘以对应的量化表内位置相哃的值则可。图像内全部的颜色分量单元都要进行反量化

3.6 反离散余弦变换

之前提到，文件中的数据是在编码时通过正向离散余弦变换（FDCT）进行时空域向频率域变换而得到的结果所以现在解码就必须将其反向离散余弦变换（IDCT），就是把颜色分量单元矩阵中的频率域数值向時空域转换并且，原来的频率域的矩阵大小为8*8则经过反向离散余弦变换后，时空域的矩阵仍然是8*8

要在屏幕上显示图像，就必须以RGB模式表示图像的颜色所以，解码时需要把YCrCb模式向RGB模式转换

另外，由于离散余弦变化要求定义域的对称所以在编码时把RGB的数值范围从[0，255]統一减去128偏移成[-128127]。因此解码时必须为每个分量加上128具体公式如下：

还有一个问题，通过变换得出的R、G、B值可能超出了其定义域所以偠作出检查。如果大于255则截断为255；如果小于0，则截断为0

}

叫阿莫西中心