数字图像处理与应用 Class 15. 20200617
Lecture 15 Compression
–Fundamentals
–Data Redundancies
–Image Compression Models
–Lossless Image Compression
许多联机信息是图形或图象的,存储和通信的要求是巨大的。
当今成像传感器的空间分辨率和广播电视的标准都有很大的发展。
1991年,柯达,MC-200, 0.4万像素,170万日元(约9500元人民币)。
2020年6月佳能IXUS 190, 2000万像素,950元左右。
VGA分辨率:320×240、640×480(标清),1280×720(高清),1920×1080 (1080 p), 3840 x2160 (4 k), 7680×4320 (8 k)…
存储和/或传输之前压缩数据的方法具有实用和商业价值。
Fundamentals
图像压缩解决了减少表示数字图像所需的数据量的问题。
删除冗余数据。
统计上不相关的数据集。
在存储或传输图像之前应用转换。
解压以重建原始图像或其近似值。
- 应用
提高空间分辨率
--图像传感器
--广播电视标准
Tele-video-conferencing
遥感
文件和医学影像,传真
越来越多的应用程序依赖于二进制、灰度和彩色图像的有效处理、存储和传输
Classification
无损压缩
也称为信息保留压缩或无错误压缩。
无损压缩法律和医学文件,遥感。
有损压缩
提供更高级别的数据简化。
适用于广播电视、视频会议、网络图像传输。
可以容忍一些错误或损失。
Data and Information 数据/信息
?Distinguish the meaning of data and information: 区别它们的概念区别
–Data: the means by which information is delivered. 数据:信息传递的方式。
–Information: various amounts of data may be used to present the same amount of information. 不同的数据量可能被用于表示相同的信息。
?Data Compression:
–The process of reducing the amount of data required to represent a given quantity of information.
例如:故事
?故事就是信息
?Word是数据
?数据冗余
如果两个人用不同数量的单词来讲述一个基本的故事。
其中至少有一个包含了非必要的数据。因此,它被称为包含数据冗余。
数据冗余是数字图像压缩的核心问题。
Data Redundancy
Data Redundancy: it is not an abstract concept, but a mathematically quantifiable entity.
如果n1和n2表示代表同一信息的两个数据集中携带信息的单元数。
第一数据集的相对数据冗余RD可定义为:
其中压缩比CR为,
在图像处理中,可以识别和利用三种基本的数据冗余:
编码冗余
像素间冗余
心理视觉冗余
当一个或多个冗余被减少或消除时,就可以实现数据压缩。
Coding Redundancy
区间[0,1]内的离散随机变量rk,表示灰度级。
每个rk发生的概率为pr(rk):
如果用于表示rk每个值的比特数为l(k),则表示图像像素所需的平均比特数为:
:编码一幅M×N的图像所需的总比特数为MNLavg。
eg,具有自然m位二进制代码的图像的灰度级。
常数m可以被提出来,只留下pr(k)的和等于1。
然后:Lavg = m
对于代码2,将编码图像所需的平均比特数简化为:
?The resulting compression ratio C_R is 3/2.7 or 1.11.
?Redundancy is R_D = 1?1/1.11 = 0.099.
为什么能压缩呢?
变长编码:分配更少的比特给更可能的灰度级。
有编码冗余:
--当没有充分利用事件的可能性时。
--它几乎总是通过使用自然二进制代码来表示。
根本依据:
某些灰色层次比其他层次更有可能出现。
Interpixel Redundancy
这些图像的灰度水平不是等可能的,可以采用变长编码来减少编码冗余。
编码过程不会改变图像内像素之间的相关性水平。
相关性来自于图像中物体之间的结构或几何关系。
这反映了另一个重要的数据冗余——像素间冗余:与图像中的像素间相关性直接相关的冗余。
任何给定像素的值都可以通过其相邻像素的值来预测。
单个像素所携带的信息相对较小。单个像素的视觉贡献对图像来说是多余的。
其他术语:
空间冗余。
几何冗余。
帧间冗余。
== Reduced Approaches ==
Reduced Approaches
?Transform into a more efficient (but usually ’nonvisual’) format.
?Example
?The difference between adjacent pixels.
?Mapping: transformations of the types that remove interpixel redundancy.
?Reversible Mappings: Can be reconstructed.
原始1024bit,压缩后88bit
Psychovisual Redundancy
眼睛对所有视觉信息的反应不是同样敏感的。
某些信息相对不那么重要。这一信息被称为心理视觉冗余。
它可以在不显著损害图像感知质量的情况下被消除。
Basic Cognitive Procedure
人对图像中信息的感知通常不涉及对图像中每个像素值的定量分析。
--查找边缘或文本区域等特性。
--在心理上将它们组合成可识别的分组。
--大脑将这些分组与先前的知识联系起来。
--然后,完成图像判读过程。
导致定量信息的丢失(量化)。
将广泛的输入值映射为有限数量的输出值。
不可逆的操作。
数据量降低一半
有损压缩
质量压缩:
(a)原始图像有256个灰度级。
(b)统一量化到16个灰度级。
(c)改进的灰度(IGS)量化。
压缩是2:1,但是IGS更加复杂。
Improved Gray-Scale(IGS) quantization
总和:最初设置为零。
将之前生成的和的4个最小有效位与当前的8位灰度级相加。
但是,如果当前值的四个最有效位是11112,则添加00002。
结果和的四个最重要的位被用作编码像素值。
Fidelity Criteria 保真度准则
Compression may lead to loss information
Quantifying the nature and extent of information loss
Objective fidelity criteria 客观保真度准则
When the level of information loss can be expressed as a function of the input image, the compressed and output image.
Easy to operate (automatic).
Often requires the original copy as the reference.
原图像作为参考Subjective fidelity criteria 主观保真度准则
Evaluated by human observers.
Do not require the original copy as a reference.
Most decompressed images ultimately are view by human.
Objective fidelity criteria
Subjective fidelity criteria
大多数解压后的图像是由人类观看的。
采用主观评价的方法对图像质量进行评价较为合适。
例如:评估或投票。
<!--实际栗子评价一下-->
客观基本一致,但是主观的评价有所区别。
Compression Models
通常将三种常用技术结合起来形成实用的图像压缩系统。
分析了该系统的总体特点,并开发了一个通用模型来表示它。
压缩系统由两个不同的结构块组成:编码器和解码器。
信道编码器:增加源编码器输出的抗噪性。如果无噪声,可省去。
The Source Encoder and Decoder
?Source Encoder: Remove input redundancies. 源编码器:移除输入冗余
Interpixel redundancy (Mapper, reversible).
Psychovisual redundancy (Quantizer, irreversible).
Coding redundancy (Symbol Encoder, reversible).
源码编码器的三个步骤:
首先,映射器将输入数据转换为一种旨在减少输入图像像素间冗余的格式(运行长度编码),这种操作通常是可逆的。
第二,量化器块根据一些预先建立的保真度准则降低了Mapper输出的精度。这一阶段减少了输入图像的心理视觉冗余。它是不可逆转的。
第三,符号编码器创建一个固定或可变长度的代码来表示量化器的输出。它可以减少编码冗余,并且是可逆的。
备注
当需要无损压缩时,量化器必须省略。
一些压缩技术通常通过合并上图中物理上分离的块来建模。
源解码器只包含两个块:符号解码器和反向映射器。由于量化会导致不可逆的信息丢失,因此在一般的源解码器模型中不包含反量化器块。
The Channel Encoder and Decoder 信道的编码器和解码器
? They play an important role in the overall encoding-decoding process when the channel is noisy or prone to error.
? Reduce the impact of channel noise
Insert a controlled form of redundancy into the source encoded data.
? Source encoder contains little redundancy
? It would be highly sensitive to transmission noise without the addition of this "controlled redundancy".
Lossless Image Compression
也称为无错误压缩
对无错误压缩的需求是由图像的预期用途或性质引起的。
在某些应用程序中,它是唯一可接受的数据简化方法。
医疗或商业文件的归档,通常由于法律原因禁止有损压缩。
另一种是卫星图像处理,其中收集数据的使用和成本使任何损失都是不可取的。
另一种是数字射线照相,信息的丢失会影响诊断的准确性。
两个相对独立的操作
减少编码冗余。
减少像素间冗余。
它们通常提供2到10的压缩比。
方法:
可变长度编码(编码冗余)
霍夫曼编码
算术编码
LZW编码(像素间冗余)
Variable-Length Coding
减少编码冗余:将最短的可能码字分配到最可能的灰度级别。
霍夫曼编码
算术编码
注:源符号可以是图像的灰度级,也可以是灰度级映射操作的输出。
-
Huffman Coding
对一个n符号源进行编码的程序,分为两步:
来源减少
按降序列出所有的可能性。
将概率最小的两个符号合并成一个新的复合符号。
重复上述两个步骤,直到有两个符号的压缩源。
码字分配
从最小的源开始,然后返回到最初的源。
每个合并点对应于二进制码字树中的一个节点。
具体的操作过程:
第一步:信源化简--计算概率,排序
不影响数据冗余,压缩比
第二步:码字分配--相当于二叉树
<!--看一个更复杂的栗子-->
<!--看一个更更更复杂的栗子-->
<!--书上的栗子,与上面的类似,因时间原因不讲解,有兴趣自行研究-->