书城教材教辅新传媒技术概论
18668100000026

第26章 传媒信息存储与管理新技术(1)

7.计算机图形图像中应用的虚拟现实技术主要分为哪两种?你是如何理解这两种技术的?

学习要点

了解音视频信息的基本存储方式、网络存储技术内涵和分类特点

掌握媒体资产管理的概念,了解其关键技术

理解广播电视网络管理的必要性,熟悉其主要功能和模式

长期以来,在电视台、影视传媒制作公司、音像资料馆等部门,海量的视音频信息的存储主要采用磁带存储方式。这种方式有易损、占地大、成本高、难以重新使用等很多弊端;更不利的是难以长期保存,难以查找、难以共享。随着计算机技术和视频压缩技术的发展,高速宽带网络以及大容量数据存储系统为视音频的网络化存储、查询、共享、交流提供了可能。如何利用计算机技术和视频压缩技术来存储与管理好视音频节目,是一个重要的课题。下面以电视节目为主介绍的传媒信息的存储与管理新技术。

4.1 基本存储管理方式

4.1.1 存储方式

电视节目以视音频素材为主,在选择存储方式时,应充分考虑过去、现在、将来的存储方式。对不同类型、不同用途的数据采用不同的存储方式。

电视节目信号分为压缩和不压缩两种。如果电视节目采用不压缩方式存储,信号质量最好、无损失,但是存储数据量非常大。电视节目存储的成本、管理费用及日常维护费用非常高。随着视频压缩技术的成熟,由压缩所带来的信号损失也越来越小,已完全符合制作和播出要求,因此选择适合的压缩格式,对信号进行压缩后再存储,将大大降低存储成本。

1.M‐JPEG、MPEG‐1与MPEG‐2

目前流行的压缩格式有M‐JPEG、MPEG‐1、MPEG‐2等。

M‐JPEG 技术即运动静止图像(或逐帧)压缩技术,广泛应用于非线性编辑领域可精确到帧编辑和多层图像处理,把运动的视频序列作为连续的静止图像来处理,这种压缩方式单独完整地压缩每一帧,在编辑过程中可随机存储每一帧,可进行精确到帧的编辑。但M‐JPEG 只对帧内的空间冗余进行压缩,不对帧间的时间冗余进行压缩,故压缩效率不高。

在MPEG 中图像分成3种编码类型:帧内编码的图像(Intra CodedPicture)称为I 帧;双向预测编码的图像(Bidirectionally Coded Picture)称为B 帧;前向预测编码的图像(Predictively Coded Picture)称为P 帧。

MPEG‐1压缩量很大,数据率很低,但是信号质量比较差,难以达到制作和播出要求。该技术已应用在VCD中,包括视音频音乐及多媒体的展现。

同时由于其压缩量很大,数据率很低,对网络的压力较小,可供电视节目存储与资源管理网络系统的多用户查询浏览用。

MPEG‐2使用多帧压缩技术,传输码率为4~50Mbps,MPEG‐2对图像序列中不同的帧采取不同的压缩编码方式,应用运动补偿帧间预测与DCT编码,在帧间压缩中以若干帧图像作为一个图像组进行处理,帧内压缩与帧间压缩相结合的方法,大幅提高压缩率,而且对图像质量影响不大。压缩后传输速率相当于M‐JPEG 的一半就可得到相同质量的节目,节约了大量的存储容量。

M PEG‐2的压缩过程、器件及算法比解压缩要复杂得多,各MPEG‐2压缩器件设计厂商的压缩方法和器件可以不一样。但MPEG‐2的解压缩是标准的,不同厂家设计的压缩器件压缩的数据可由其他厂家设计解压缩器来解压缩,这一点保证了各厂家的设备之间能完全兼容。MPEG‐2已成为数字电视存储传输的统一标准,未来大量的节目传输,变换和存储都将采用MPEG‐2格式。MPEG‐2采用帧间压缩的方式,只需进行I 帧的帧内压缩处理,B 帧和P 帧通过侦测获得,传输和运算的数据大多由帧之间的时间相关性得到,相对来说,数据量小,在获得广播级数字视频质量的前提下,可以实现20:1的压缩率,数据率可降到1Mbps,一小时视频节目占用3.6GB 空间,数据存储空间利用率高。随着逐帧编辑问题的解决,应用也会日益广泛。

在选择电视节目的存储方式时,可选择MPEG‐2,MPEG‐1两套压缩方式。由于MPEG‐1格式数据率较低,对网络的压力较小可供多用户查询浏览用。MPEG‐2格式供存储、输出及制作节目用。

2.MPEG‐4标准及其在广播电视领域的应用

MPEG 专家组继成功定义了MPEG‐1和MPEG‐2之后,于1993年7月开始制订全新的MPEG‐4标准,并分别于1999年初和2000年初正式公布了版本1和版本2。到2001年10月,MPEG‐4已定义了19个视像类(VisualProfile),其中新定义的简单演播室类(Simple Studio Profile)和核心演播室类(Core studio Profile)使MPEG‐4对MPEG‐2类别保留了一些形式上的兼容,其码率可高达2Gbps。随着MPEG‐4标准的不断扩展,它不但能支持码率低于64kbps 的多媒体通信,也能支持广播级的视频应用。MPEG‐4标准将广泛应用于数字电视、动态图像、万维网(www )、实时多媒体监控、基于内容存储和检索的多媒体系统、互联网上的视频流与可视游戏、基于面部表情模拟的虚拟会议、DVD 上的交互多媒体应用、基于计算机网络的可视化合作实验室场景应用、演播电视等,它将推动电信、计算机、广播电视三大网络的最终融合,成为今后一段时间压缩标准的主流。

(1)MPEG‐4标准的主要特点和功能

MPEG‐4视频编码标准支持MPEG‐1、MPEC‐2中的大多数功能,提供不同的视频标准源格式、码率、帧频下矩形图像的有效编码,同时也支持基于内容的图像编码。

在这一功能集的底层是VLBV(VeryLow Bit Rate Video)核心。它为码率在5~64Kbps范围内的视频操作与应用提供算法与工具,支持较低的空间分辨率(低于352×288像素) 和较低的帧频(低于15Hz)。VLBV 核心支持的专用功能包括:矩形图像序列的有效编码、多媒体数据库的搜索和随机存取。

MPEG‐4的HBV ( High Bit RateVideo)同样支持上述功能,其码率范围在64Kbps ~10Mbps 之间,它与VLBV 核心采用相同或相似的算法,但它支持更高的空间与时间分辨率,允许传输和存储适用于演播室的高质量视频信号,其输入可以是ITU‐R Rec .601的标准信号,典型应用为数字电视广播与交互式检索。MPEG‐4最终支持的码率将高于MPEG‐2。

MPEG‐4提出了基于内容(Content‐based)的存取概念,使用户可与场景进行交互。它对运动图像中的内容进行编码,其具体的编码对象就是图像中的音频和视频,称为AV 对象(AVO)。AV 对象可以组成AV 场景(AVOs)。

因此,MPEG‐4标准的基本内容就是高效率地编码、组织、存储、传输AV对象。

M PFG‐4标准支持8项新的或改进的功能,可分为以下3类:

基于内容的交互性。基于内容的多媒体数据存取工具;基于内容的码流操纵和编辑;自然与合成数据的混合编码;增强的时间域随机存取。

高压缩率。提高编码效率;对多个并发数据流的编码。

灵活多样的存取。错误易发环境中的抗错性(Robustness);基于内容的尺度可变性(Content‐based scalability)。

(2)MPEG‐4标准的构成

DMIF。DMIF 即多媒体传送整体框架,它主要解决交互网络中、广播环境下以及磁盘应用中多媒体应用的操作问题。通过DMIF,MPEG‐4可以建立具有特殊品质服务(QoS)的信道和面向每个基本流的带宽。

数据平面。MPEG‐4中的数据平面可以分为两部分:传输关系部分和媒体关系部分。为了使基本流和AV 对象在同一场景中出现,MPEG‐4引用了对象描述(OD)和流图桌面(SMT)的概念。OD 传输与特殊AV 对象相关的基本流的信息流图。桌面把每一个流与一个CAT(Channel Association Tag)相连,CAT 可实现该流的顺利传输。

缓冲区管理和实时识别。MPEG‐4定义了一个系统解码模式(SDM),该解码模式描述了一种理想的处理比特流句法语义的解码装置,它要求特殊的缓冲区和实时模式。通过有效的管理,可以更好地利用有限的缓冲区空间。

音频编码。MPEG‐4的优越之处在于,它不仅支持自然声音,而且支持合成声音。MPEG‐4的音频部分将音频的合成编码和自然声音的编码相结合,并支持音频的对象特征。

视频编码。与音频编码类似,MPBG‐4也支持对自然和合成的视觉对象的编码。合成的视觉对象包括2D、3D 动画和人面部表情动画等。

场景描述。MPEG‐4提供了一系列工具,用于组成场景中的一组对象。

一些必要的合成信息就组成了场景描述。

(3)MPEG‐4标准的视频编码技术

为了支持基于内容的交互性,即支持对内容独立地进行编、解码,MPEG‐4视频检验模型引入了视频对象面(VOP)的概念。假设输入的视频序列的每一帧都被分割成多个任意形状的图像区域(视频对象面),每个区域可能覆盖场景中特定的感兴趣的图像或视频内容。输入进行编码的VOP可以是任意形状的,且形状和位置可随帧而变。属于场景中同一物理对象的连续VOP序列称为视频对象。同一视频对象的VOP序列的形状、运动和纹理信息被编码传输,或者编码为一个隔离的视频对象层(VOL)。

MPEG‐4视频编码器的基本结构包括形状编码、运动补偿和基于DCT的纹理编码。具体的编码方法为:首先对输入的原图像序列进行场景分析和对象分割,以划分不同的VOP,得到各个VOP的形状和位置信息,它可以用alpha 平面来表示。发送端只需传送alpha 平面,接收端就可以确定VOP的形状和位置。alpha 平面所需的比特数较多,需要进行压缩编码。显然,只要对VOP的轮廓进行编码和传送,接收端就可以恢复alpha 平面,轮廓信息在轮廓编码器中进行编码。提取的形状和位置信息又用来控制VOP的运动和纹理编码。对运动和纹理信息编码仍然采用经典的类似MPEG‐1/2标准的运动预测/补偿法。输入第N 帧的VOP与帧存储器中存储的N‐1帧的VOP进行比较,找到运动矢量,然后对两帧VOP的差值进行量化、编码。对不同对象的运动和纹理信息的编码可因地制宜地采用不同的方法,以提高编码效率。编码后得到的纹理信息,与运动编码器和形状编码器输出的运动信息和形状信息复接形成该VOP的比特流层。不同视频对象的VOP序列分别进行编码,形成各自的比特流层,经复接后在信道上传送。传送的顺序依次为形状信息、运动信息和纹理信息。接收端的解码过程是编码过程的逆操作。

(4)MPEG‐4标准在广播电视领域应用前景

随着MPEG‐4标准的不断补充和完善,它已经能够支持广播级的视频应用。MPEG‐4的出现将改变传统的电视存储管理理念,它不但给广播电视领域注入新的活力,也将带来更多的机遇与挑战。MPEG‐4标准在广播电视领域将会有以下应用:

虚拟演播室。MPEG‐4独有的基于内容的交互性,可为虚拟演播室技术带来突破性的发展,虚拟演播室的应用范围也将得到扩展。如:虚拟出席、虚拟重放、视频跟踪、虚拟广告。

交互电视。利用MPEG‐4的交互性和支持多个并发数据流编码的特点,可实现交互电视的使用。例如:在同时转播几场足球比赛时,观众可在家里任意选择观看自己喜爱的比赛,他们甚至能以不同的分辨率同时选择观看3~4场比赛,还可享受附加的自动切换功能,以免漏掉所有比赛中的进球场面。这类应用还利用了MPEG‐4所支持的复杂度可伸缩特性,即允许终端用户解码每个流时只利用接收端解码能力的一部分。当然,前提条件是节目本身可以按照不同的分辨率解码和显示。另外,用户还可被允许进行以下操作:改变场景的视、听点,例如在场景中漫游;把场景中的对象拖到不同的位置上;点击特定对象以触发一系列事件,例如开始或终止视频流;多语言音轨时选择想要的语言等。

视频编辑。MPEG‐4定义的简单演播室类(Simple Studio Profile)能够为视频编辑提供高质量的信号,它仅有I 帧,采用形状编码,支持多个alpha通道,码率可高达2Gbps。核心演播室类(Core Studio Profile)在简单演播室类的基础上增加了P 帧,使编码更高效也更复杂。这两个新扩展的视像类使MPEG‐4用于高质量的视频编辑成为可能。

利用MPEG‐4支持基于内容编辑的特点,可直接选取音、视频内容进行编码,并对其灵活地进行控制和显示,用户可以自行选择场景中物体的解码质量,并可改变其某些特性,进行电视节目制作和编辑。