书城计算机网络多媒体技术
15865500000020

第20章 视频信息处理技术(2)

总之,目前所有微型计算机所采用的显示标准基本上都是与VGA相兼容的,尽管有一些小的差别,但它们大都遵循视频电子协会所制定的VESA(VideoElectronicsStandardsAssociation)标准。为了便于读者参考,将VESA标准显示模式列于表54中。

2.图形、图像的表示

在微型计算机上显示的图形、图像是由计算机将来自硬磁盘(或CDROM等)的图形、图像数据进行一定的安排,而后送往显示卡(VGA)的VRAM中,经VGA变换成RGB再送往监视器显示的图形或图像。在微型计算机中,表示或存放图形和图像常用的方法有两种:矢量法和位图法。

1)矢量法

矢量法以数字的方法表示一幅图形,例如,一条直线,只要记下其两端点的坐标便可以显示(画出)该直线。

其他图形也是一样,三个点的坐标可决定三角形,圆心的坐标和半径可决定一个圆,曲线可用直线段插补等。这样一幅图便可以用矢量图加以存储,在显示时再按照欲先规定好的算法将其显示出来。

用矢量法表示图形最大的优点是占用内存少,处理速度快。因此,矢量法常用于图形的存储和处理。

2)位图法

位图法就是首先将照片按一定分辨率采集为若干像素点,例如,用640×480像素点表示一幅图像。对于黑白图像来说,每个像素点取8bit,则可表示256级灰度。如前所述,若用红色5bit、绿色6bit、蓝色5bit,则一个彩色的像素点可用16bit来表示。然后将每个像素点存放于内存中(或其他媒体中),当显示时,根据内存与显示器的映射关系,将各像素点放在VRAM的适当位置(地址)就可以很好地显示一幅彩色图像。

位图存储的是每一个像素点,当分辨率比较高,表示的彩色比较多时,存放一幅图像要占相当大的内存(或外存)空间,因此,处理起来所花时间也会较长。

5.2.4图像文件格式

1.GIF图像文件格式

GIF(GraphicsInterchangeFormat)文件格式是由CompuServe公司于1987年提出的。该文件格式采用了无损数据压缩算法(LZW),目前的大多数图像软件都能识别这种文件格式。

GIF图像文件结构如图51所示。由图可见,GIF图像文件以6个字节的标记∕版本号开始,例如,用“GIF87a”或“GIF89a”作为标记/版本号。接下来是显示屏描述符,其中包括图像水平及垂直的分辨率、图像属性(如像素的位数、彩色的多少等)、背景颜色以及一个保留字节。这一部分主要说明显示屏的大小、图像像素的位数、彩色的多少及背景的颜色等,它们均是与显示屏幕有关的信息。

在图51中,规定了全局彩色安排表和局部彩色安排表。其含义是在GIF文件中可以包括多幅图像,假如所有的图像或多幅图像均用同一个彩色安排表,则此表就为全局彩色安排表。若一幅图像有它自己定义的彩色安排表,而在这幅图像进行彩色生成时只用它自己定义的表,则此表就是局部彩色安排表。

在GIF文件中,允许选用两个扩展块:第一扩展块用于注释,第二扩展块用于附加一些图像控制命令。扩展块的数据格式如图51所示。

图像描述块的第一个字节为图像分割符,也叫做同步字节,用以标志图像描述块的开始,用ASCII码中的“!”符号(21H)表示。该块中第2到第5个字节分别表示图像左上角的坐标X和Y的位置,接下来的4个字节分别表示图像的宽度和高度。图像描述块的最后一个字节是标志信息,包括:使用全局还是局部彩色安排表,数据是顺序存放还是错行存放,像素的彩色数等。

2.TIFF图像文件格式

TIFF(TagImageFileFormat)是由Aldus和Microsoft公司提出的用来存储图像数据的文件格式。在CDROM中经常以此文件格式记录图像数据。

TIFF图像文件的存储格式由三个基本部分组成:文件头、图像目录和目录项目。其结构如图52所示。

TIFF文件头由8个字节构成。开始用两个字节说明存储图像数据时是先写最低位后写最高位,还是高位在前低位在后;用两个字节表示TIFF的版本号;最后4个字节表示第一个图像文件目录的偏移量(或称偏移地址)。

由第一幅图像文件目录的偏移量便可得到这幅图像的文件目录。

图像文件目录的头两个字节用来表示在本幅图像中有多少目录项,即构成图像的条目项有多少。接下来逐个条目项进行存放,从项0、项1……直到最后一项。可见,组成一幅复杂的大的图像,用的条目项数会多一些,而小的简单的图像,条目项会少一点,图像文件目录长度是可变的。

每一项由固定的12个字节组成,如图52所示。标记(Tag)用两个字节表示,用来标记图像数据的特征,TIFF文件规定有几十种标记。可以想像,一幅图像由许多项构成,而每一项具有不同的特征(例如,高度、宽度、分辨率、压缩方法等)。一幅完整的图像便由这些具有不同Tag的图像块拼接而成。

项的第二个内容是用两个字节表示数据类型,即说明在本项中具有Tag的数据是什么类型的数据;接下来用4个字节表示数据的长度;最后4个字节指出存放数据的偏移地址(偏移量)。请注意,在条目项中给出的是存放数据的偏移地址,要到那个地址上才能取得数据。当然,条目项中所得到的是数据的起始地址。

这样,一幅图像就可以完整地加以表示了。以此格式存放,再以此格式读取。

3.PCX图像文件格式

PCX图像文件格式主要由三部分组成。

1)文件头

文件头的长度为固定的128字节,用来标记文件厂商、版本号、数据压缩方法、每个像素的位数、图像的尺寸、水平及垂直分辨率等一系列有关图像的参数。128个字节中未用的部分用空格填满。

2)实际的图像数据

在实际的图像数据存放区域里,以不同的模式表示各种类型的图像,因而,存放图像数据的形式也不一样。

实际的图像数据都是经压缩的数据。采用的压缩方法是仅对一行像素点进行的,也就是说,压缩是在一行像素点上分成若干扫描段来实现的。

3)256色调色板

构成PCX图像文件的第三部分是调色板。只有当存放256、64色彩色图像或256级灰度图像时,这部分才出现在PCX文件中。该部分用768个字节描述调色板的特性。当采用其他模式存储图像数据时,不需要这一部分。在此情况下,PCX图像文件就只由文件头和实际的图像数据两部分组成。

4.TGA图像文件格式

TGA图像文件格式是Turevision公司提出的,用于存储彩色图像。由于该文件格式清晰、使用方便,故得到了极广泛的应用。它是目前国际上比较流行的一种数据格式。

图53TGA图像文件的结构TGA图像文件的结构如图53所示,TGA图像文件由文件头、图像/彩色变换数据、开发者区域、扩展区及文件尾几部分组成。

①TGA文件头:文件头是对文件的一个最基本的说明。

②图像∕彩色变换数据:这里面包括图像鉴别字ID,这个鉴别字是可变长度的,最大为256个字节;同时,在这部分中还包括彩色变换数据,它也是长度可变的;最后是图像数据。

③开发者区域:TGA文件的第三部分是留给开发者的,它包括开发者的说明及开发者目录,两者的长度均是可变的。

④扩展区:扩展区用来存放开发者的附加说明。该区的位置由文件尾中4个字节的偏移量来指定。该区中还可包括许多内容,本书不作详细说明。

⑤TGA文件尾:它包括扩展区的地址指针(偏移量)、开发者目录区域的地址指针(偏移量)及结束标记。

5.3视频卡概述

5.3.1视频卡综述

视频卡的种类繁多,有的一块卡具备一种功能,有的则具备两种甚至多种功能。各种视频卡按功能大致可分为以下5类。

1.视频采集卡

视频采集卡的功能就是将视频信号与计算机VGA显示卡的VGA信号相叠加,将叠加后的信号显示在显示屏上。同时,还可以加入某些特技效果。视频采集卡的工作原理可由图54来说明。

所谓视频采集,就是将视频信号经过采样、量化后转换成数字图像并与VGA信号叠加存储到帧存储器内的过程。视频采集的模拟信号源可以是录像机、摄像机、影碟机等。可以将原来保存在录像带、激光视盘等介质上的图像信息通过视频采集卡转录到计算机内部,也可以通过摄像机将现场的图像实时输入计算机。

由图54可见,视频输入信号在视频采集卡中进行处理,包括对它进行A/D变换,变为数字信号,然后再对其解码得到亮度Y和色差(VU)信号,YUV信号通过某种算法可变换为红绿蓝(RGB)信号,并将此信号存入缓冲存储器中。另外,由VGA卡接收的计算机显示信号在VGA卡中变换为相应的RGB信号。

视频采集卡形成的RGB信号与VGA卡所产生的RGB信号在视频采集卡中叠加,获得叠加后的RGB信号。此RGB信号经D/A变换,形成显示器所需要的模拟信号,并在显示器上显示出来,此时所显示的就是两者叠加后的图像。

视频信号与VGA信号相叠加常用两种方式:一种是窗口方式,另一种是色键方式。

窗口方式是在显示屏上由软件命令在屏幕的任意位置上开设一个大小可指定的窗口。视频采集卡在工作过程中可从连续动态图像中(例如,PAL或NTSC电视信号)捕获一帧(一个画面),并将捕获的画面显示在规定的窗口内。窗口的位置和大小是可以指定的,最大的窗口就是显示器的全屏。

色键方式是利用软件命令来定义某种颜色为色键的,也就是定义某种颜色为透明色。因而,就可以规定VGA信号中的某种颜色为透明色(即色键),也可以规定视频信号中的某种颜色为透明色。这样一来,当VGA图像与视频图像叠加时,被定义为色键的颜色将不影响另一图像的显示。

例如,当定义VGA图像上的白色为色键时,在VGA图像与视频图像相叠加显示在屏幕上时,所有VGA图像为白色的地方全都原样显示视频图像,也就是说白色的VGA部分对视频图像来说是透明的。

视频采集卡可捕获动态图像并有可能对其进行全屏播放。但这种捕获主要用于播放,若要将捕获的图像真正截取下来并存到硬磁盘中,视频叠加卡的能力就显得比较弱,例如,截取的画面不够大,每秒截取的帧数不够多等。要更好地捕获动态图像,需要其他的视频捕获卡。

2.视频捕获卡

视频捕获卡专门捕获图像。它将捕获的图像数据以文件的形式存放在硬磁盘或其他媒体中。有了这样的图像数据文件,要对图像进行编辑、拷贝等各种处理也就容易了。

视频捕获卡可以以25fps(PAL)或30fps(NTSC)的速度捕获图像,并以某种格式,如AVI格式加以存储,捕获图像可达1/4屏。

这类捕获卡为达到以几十帧每秒的速率捕获图像数据,要用到前面所提到的一些采集、变换及压缩方法。目前,卡中常用专业级的硬件压缩芯片,例如,人们常提到的Intel公司的i750。

同时,为存储所捕获的图像信号,要求有一定吞吐率的CPU和一定容量的硬盘。如前所述,这样的CPU和大容量、高速度的硬盘已不再成为问题。

对于某些视频捕获卡来说,卡上带有音频处理功能。因此,在捕获图像视频信号的同时,音频信号也一并捕获存于AVI文件中。AVI文件允许将图像与声音存于同一文件中。

另外,在选用视频捕获卡时,要注意它是否支持全软件回放功能。全软件回放就是在没有视频捕获卡的计算机上能够不丢帧地实时回放由另一台具备捕获卡计算机所捕获的AVI文件。如果你所选用的视频捕获卡不支持全软件回放功能,那么回放的效果就会很差。

3.MPEG卡

MPEG卡包括MPEG视频压缩卡和MPEG视频解压缩(回放)卡。

MPEG压缩卡用于完成前面所叙述的对视频和音频信号进行采集、编码、压缩等操作。最终对包括声音在内的动态图像实现约100∶1的压缩。压缩的数据可对其进行存储、回放并可制作VCD节目。对于MPEG1标准的压缩卡,经解压缩回放,可以达到VHS录像带水平而且声音效果很好。

MPEG视频压缩卡根据MPEG的标准对图像(视频)和音频信号进行压缩,同时附加有关同步等系统工作信息,并将其以规定的数据格式存放在某种媒体上。这种媒体开始可能是硬盘,而后再将硬盘上的视频压缩信息制成CD光盘。

MPEG解压缩卡的工作就是MPEG压缩卡工作的逆过程。如前所述,它将记录在媒体上的视频信息(例如,CD光盘上的信息)进行解压缩,恢复为原始视频信号。在计算机的CRT监视器上或在电视机上可以播放CD光盘上的信息。

4.TV调谐卡

TV调谐卡主要包括电视接收机(或录像机)里的高频头及通道部分。前者提供选台功能,用于选择不同频道上的PAL或NTSC电视信号,而后者可提供所选中频道的图像和声音信号。很明显,只有TV协调卡,并不能在计算机的CRT上欣赏电视节目。

但是,当将TV调谐卡与前面提到的视频采集卡配合使用时,就可以做到利用计算机来显示电视图像。这时,TV协调卡的视频及音频信号可进入采集卡,而后形成计算机VGA所要求的显示格式。

为了方便使用,有些厂家将TV调谐卡与视频采集卡做在一块卡上,叫做电视卡。它确实可以使计算机的CRT显示器显示电视信号,这时的计算机变成了一台家用电视机。

5.电视编码卡

电视编码卡所完成的功能与视频采集卡刚好相反。它是将计算机VGA显示卡所送出来的VGA显示信号转换成标准的电视视频信号(PAL或NTSC)。将转换出来的信号加到普通家用电视机上,则可用电视机观察计算机显示器上的画面。若将转换出来的标准电视信号加到普通家用录像机上,则可录下计算机的显示画面。

5.3.2视频卡举例

随着多媒体技术的迅速发展,各种视频卡不断涌现。对于大多数视频卡用户来说,要用好它并不难,只要按照说明书的要求,在软件提示下进行操作就可以达到目的。下面对常见的视频卡VideoBlaster作一简要介绍。

1.VideoBlaster视频卡的硬件结构