第四章第九节为多媒体信息瘦身
有必要压缩数据
虽然多媒体信息具有我们之前介绍的广泛含义和多种类型,但对通信网络系统结构和性
能最有影响的,仍属于视像和声音等具有时序特征(信息在信号属性随时间变化中的特征)
的信息类型。当前,虽然所研究的压缩技术和方法,对其他一些大数据量的信息类型,如长
文本信息也是有意义的,但多媒体数据压缩技术主要还是针对视像和声音等这些信息类型
研究的。
从前面我们对多媒体信息特点的介绍中可以知道,多媒体信息有一个比较显著而且对通
信网络有很大影响的特点——数据量很大。如果我们要在通信网络中支持动态图像信息的存
储、传送和处理,将对通信网络各方面的性能提出很高的要求,在不同的应用环境,不同级
别的要求下相差也很大。
我们就以中等质量、长1小时的视像信号显示要求来看,在独立的计算机和通信设备中传输
速率要求达到14.3Mb/s,网络传输速率要达到114Mb/s,存储容量达到51.5Gb。这个指标
要求,以目前发展的通信网络技术和通信技术来看,虽然还不是完全不能达到,但已经需要
付出相当昂贵的代价和占用网络中许多宝贵的资源。
更为严重的是,刚才我们所举的例子,其性能要求仅仅是一个视像信息数据流的要求,而在
实际的通信网络工作环境中,完全可能需要支持许多用户的多媒体应用需求,因此在网络的
视像服务器中或网络的通信线路中,有可能同时有多个视像信息数据流在活动。这将数倍到
数百倍地增加对通信网内部的传输速率、存储容量和通信带宽的要求,如果不采取对视像信
号进行压缩的措施,把重复部分省略现有的通信技术和网络技术几乎难以实现。
1信息在时间、空间上的“重复”
静态图像中具有完全相同像素的块(同色)和颜色连续、均匀变化的块,相邻像素之间
有相关性;动态图像相邻帧之间一般只有少量变化,有更大的相关性;声音信号随时间的变
化,一般也是一种连续变化的过程,相邻采样点之间也有相关性。针对时空重复而提出的压
缩方法,常用的有预测法(按一定的模型根据若干已知点的值,预测未知点的值)、量化编
码法(按照统计和概率分布设计量化级,一次量化多少个点)等。
2信息在编码上的“重复”
这是与编码方法有关的一种重复,例如采用固定8位长编码来控制每个像素可能的256种
颜色变化。实际的图像或图像中有些部分往往并没有这样多的颜色层次,如采用根据实际图
形情况或某种统计规律自动改变编码长度,就可以大量地压缩重复的编码信息。
3信息在结构上的“重复”
这是指图像中有明显的结构特征和各部分具有结构相似性而产生的重复。对于这种图像
,有可能采用结构化编码方法,即首先找出其结构特征(如边界、轮廓、纹理等),并且参
照对图像的某些先验和背景知识对其结构特征编码,这显然比盲目地按照每一像素的颜色进
行编码要减少很多编码的数据量。在语音编码中采用语音识别的编码方法和采用基于语音参
数分析的编码方法,也属于这种基于结构和知识的编码方法。
上述各种数据压缩技术的基本思想,就是在尽可能保留信号中信息内容的前提下,去掉
重复数据而大量减少数据量(数倍、数十倍甚至数百倍),从而使多媒体计算机通信网络的
实际应用成为可能。
现有的通信技术和网络技术几乎难以实现。
压缩到什么程度
当我们评价压缩系统性能的时候,需要考虑三个关键参数,而不是数据被压缩的越小就越好
。第一是压缩量或压缩比,通常是压缩过程中输入数据量与输出数据量之比,但这种度量方
法还必须指明输入输出的显示形式,否则就将是不可靠的。
例如,压缩系统的输入可能是512×480的分辨率,每像素24位,输入数据是737 280字节。
而若输出为15 000个字节的位流,则压缩比大约为49∶1;但如果输出图像只有256×240个
像素,其分辨率只有输入图像的1/4,因而,在分辨率相等的情况下,压缩比应该为12∶1。
因此,衡量压缩量的一个更好的方法是在压缩位流中确定每个显示像素的所需的位数。例如
,在上述例子中输入为每像素24位,输出的15 000字节位流是要再现一个256×240像素的图
像,则压缩结果定义为:(15 000×8)/(256×240)=2位。因此压缩比为:24∶2=
12∶1。
第二个指标是图像质量,这与压缩的类型有关。压缩方法可以分为无损失压缩和有损失压缩
。无损失压缩是指压缩及解压过程中没有损失原来图像信息,所以对无损失系统不必担心图
像质量。有损失压缩则要对原来图像作一些改变,这样就使得压缩前后的图像不完全相同,
但我们人眼难以察觉。对有损失压缩结果的评价主要是主观评价。
第三个指标是压缩和解压的速度。在许多应用中,压缩和解压将在不同的时间、不同的地点
、不同的系统中,因而必须分别地评价压缩和解压速度。在存储回放应用中,解压速度
比压缩速度更重要,因为压缩只是一次,而解压则面对大多数用户的实时需要。但在实时采
集摄像机的实时动态视频时,对动态视频的压缩速度也要求较快。无论哪种情形,压缩和解
压速度都比较易于规定和测量。除了这些指标之外,还要考虑软件和硬件的开销。有些数据
的压缩和解压可以在标准个人电脑硬件条件下使用软件实现,有些则因为算法的复杂和质量
要求高而必须采用专门的硬件。