书城教材教辅新传媒技术概论
18668100000019

第19章 传媒节目、作品制作新技术(2)

(2)硬盘类别管理

一个节目制作完成后,通常都需保留一段时间,以待各级领导的审查。如采用固定硬盘,则设备就不得不因硬盘被占而无法进行其他节目的制作。如果采用了活动硬盘,如两套以上的活动硬盘,就可以随时换上空盘进行工作,这样提高了硬盘的利用率,也提高了制作的效率,令设备资源始终发挥最佳效益。在节目量大时,增加硬盘,节目量小时,减少硬盘,还可以解决做好的节目短期保留,后续节目进行制作的矛盾。所以,对非线性编辑系统来说,一个完善的管理系统是顺利完成制作任务的基本保证。

3.1.3 非线性编辑系统的发展

非线性编辑系统不同于常规的计算机,关键在于其视频处理硬件板卡。

一般包括I/O 卡、编解码及图像处理卡和强化特效的实时三维特技卡。其他软、硬件都是对非线性编辑板卡功能的辅助与增强。这些板卡是决定非线性编辑系统性能的一个重要因素。在节目制作中,有对图像/声音质量的要求,有对图像处理复杂性(实时层数和特效)要求,有对系统开放性及兼容性(多种编解码格式及第三方插件)的要求。这些都要依赖相关板卡来实现。可根据近几年非线性编辑系统的主流硬件板卡将非线编系统的发展分为三个时代。

第一代非线性编辑系统:基于M‐JPEG 编码、延续传统的板卡型非线编系统。

DigiSuite 套卡是Matriox 公司功能最强大的非线编板卡,它以5层实时处理、5个通道都可以独立设置多重特技而支持数百种特技制作;其三维DVE 选件为Movie‐2标准总线的GenieDVE 三维特技实时处理卡。

DigiSuiteLE卡是DigiSuite卡的简化版,性价比较高,与Digisuite卡相比,它只支持4层实时处理(无动态视频背景层),不支持实时三维处理、倒放和音轨调音功能,字幕效果简单;其三维DVE选件为MatroxFlex3D开放构架下的3DMAX卡。

Pinnacle公司有多种系列的非线性编辑板卡,较为专业的有:RealTime、RealTimeDV、RealTimeNitro。RealTime是一个较为经典的M‐JPEG 压缩格式非线性编辑板卡。RealTimeNitro在保持RealTime全部特性的基础上,增加了更多的实时三维特技和实时字幕运动特技,支持更加实效的网络功能及更多的第三方软件,是实时三维特技产品与非线性编辑产品的完美结合。

RealTimeNitroPlus 是RealTimeNitro 与in :SyncSpeedRazor4.5RT的完美结合,它在保留RealTimeNitro全部特性的基础上,提供了更专业的编辑手段、更强大的网络功能;当时它是唯一支持双CPU的视频编辑产品,生成速度要比单CPU系统提高30% 以上。

Avid 公司的Meridien 采集卡和BreakoutBox(BOB)共同完成信号的采集与压缩、输入/输出,它们在Avid的3个系列的非线性编辑系统中(Meridien‐basedXpress、MediaComposer 和SymphonySystems)必须捆绑使用。Meridien + BOB 有DSI 接口选件,但不支持DV1394接口;视频通道处理是由ABVB 板卡来完成的,BOB 从多个视频母线通道引入所需的视频流,经过(AVR)压缩后送入ABVB 处理,结果再交给Meridien + BOB 存储或输出。

第二代非线性编辑系统:压缩格式从M‐JPEG 到MPEG‐2。

为了降低成本、节约资源,人们一直在研发更有效的压缩方法。最为明显的变化是从非压缩到M‐JPEG 压缩、再到MPEG‐2压缩。非线性编辑同样也是循着更加完善的压缩算法而逐步演变的,到2002年,出现了所谓的第二代非线性编辑系统。

DigiSuiteDTV 卡和DigiSuiteLX 卡是Matriox 公司专门针对目前两个较为主流的数字视频压缩格式——DV 和MPEG‐2而开发的,它们的基本编辑功能类似于前一代DigiSuiteLE 卡,二者的主要区别是:DTV 卡基于“流中心”的设计思想,注重原始DV 格式的采集、编辑、输出一体化,强调两路视频的实时处理,单卡支持一路编码/2路解码、DV 和MPEG‐2压缩编码,不支持非压缩视频,可同时支持4轨视频(需另配MAX 卡)和多轨字幕,具有简单音频混音功能;DigiSuiteLX 卡是前者的简化版,相应地减少了编辑方面的功能。

其三维DVE 选件为Flex3D 开放构架下的3DDTVMAX 三维特技实时处理卡,但MAX 三维特技效果略逊于Genie 卡。

Pinnacle 公司的Tagar3000基于“内存中心”的设计思想,可以做到比实时更快的处理速度,它不局限于2路视频,单卡集成2路编码、4路解码,支持非压缩视频、原始YUV 和多格式混编,可以同时支持5轨以上视频和8轨以上字幕实时回放,且有比Genie 更好的高端三维特技选件K2卡。

第三代非线性编辑系统:借助计算机及硬件加速的软件型非线性编辑。

随着计算机硬件的功能不断增强、运算速度大幅提升,计算机的浮点运算能力大大提高,使得一般的图像处理可以摆脱硬件板卡的束缚,出现了以软件图像编解码和各种软件处理图像为特色的新型非线性编辑。由此引发了板卡型非线性编辑和基于计算机自身运算并借助硬件加速的软件型非线性编辑共同争夺市场的局面。从发展趋势看,CPU+ GPU 的基于软件处理图像的非线性编辑系统逐渐成为技术先进性的代表,即所谓的第三代非线性编辑。

在国内,比较突出的是大洋D3‐EDIT、索贝Editmax、新奥特“神器”、奥维讯OpenEdit 等。其共同的技术特点都是基于MatroxDSX 卡,引入“PowerofX”的理念,协同计算机资源加上MatrioxFlex3D 引擎(硬件加速),实现突出软件的非线性编辑。

3.2 音频节目制作技术

在传统的广播电视中,采用的是较为落后的单声道与双声道立体声技术。

为了迎接数字化的到来,目前我国已进行了数字音频广播(DAB)的试验与应用,数字音频已成为必然的发展方向。

数字音频广播是一种以数字方式广播电台节目的崭新方法。数字音频广播利用数字压缩技术,把音乐、语言和电台节目等信号先转化为一系列由二进制数字组成的数字码,然后将多种节目服务组合成一条数字信道,通过公用数字信道加以传送。数字音频广播与模拟系统不同,可以抗拒杂音及免受干扰。

由于数字音频广播支持单频网络的运作,因而可大幅度节省频宽。并可传送更多频道的电台节目。相关的无线电通信服务如数字广播、无线电传呼,静画/图像和精确导航等,均可加入数字音频广播网路,为市场提供更为广泛的数据服务。

3.2.1 数字音频的概念

声音之所以能够数字化,是因为人耳所能听到的声音频率不是无限宽的,主要在20kHz 以下。按照抽样定理,只有抽样频率大于40kHz,才能无失真地重建原始声音。

声音重放技术的发展路程,是沿着单声(monophonic)、双声道立体声(stereophonic)到4通道立体声,再到环绕立体声(stereo surround),现在一般为5.1模式。其根本目的,就是要更逼真地再现原声场。如何以尽量低的数据率,最有效地传送多声道、高质量的声音,是音频节目制作技术的发展方向。

音频数字化主要有压缩与非压缩两种方式。

(1)非压缩编码。较早出现的数字音频播放机,如CD 唱机和DAT 录音机,均采用线性PCM(脉冲编码调制)编码来存储信号,为非压缩方式。在高质量要求的音频工作站和数字录相机上,现在也采用非压缩的格式。

PCM 是一种将模拟语音信号变换为数字信号的编码方式。主要经过3个过程:抽样、量化和编码。抽样过程将连续时间模拟信号变为离散时间、连续幅度的抽样信号,量化过程将抽样信号变为离散时间、离散幅度的数字信号,编码过程将量化后的信号编码成为一个二进制码组输出。

量化分为线性量化和非线性量化。线性量化在整个量化范围内,量化间隔均相等。非线性量化采用不等的量化间隔。量化间隔数由编码的二进制位数决定。例如,CD 采用16bit 线性量化,则量化间隔数L=65536。位数(n)越多,精度越高,信噪比也越高。但编码的二进制位数不是无限制的,需要根据所需的数据率确定。比如:CD 可以达到的数据率为2×44.1×16= 1411.2Kbps。

常用的编码码组有3种:自然二进制码组、折叠二进制码组、格雷二进制码组(RBC)。国际PCM 标准主要使用折叠二进制码组。

PCM 虽然为无损编码,但由典型的音频信号表示的信号特性没有达到最佳,也没有很好的适应人耳听觉系统的特定要求。PCM 的数据量过高,从而造成存储和传输方面的障碍,因此必须使用相应的技术降低数字信号源的数据率,又尽可能不对节目造成损伤,这就需要压缩技术。

(2)压缩编码。目前常见的MPEG、Dolby Digital(杜比数字)、DTS 等为压缩编码方式。压缩分为有损压缩和无损压缩。有损压缩的目的是提高压缩率,降低占用系统资源。可以根据实际需要选用不同的采样速率、样本分辨力(精度)和数据率。

杜比数字作为由FCC 为美国选定的ATSC 数字电视标准的一部分,成为HDTV 和SDTV 广播的标准。MPEG 为欧洲数字视频广播(DVB)、数字音频广播(DAB)和日本广播电视业的音频标准。DVD 则支持3种主要标准:

Dolby digital、MPEG‐2和线性PCM (LPCM )。其他格式,如DTS (DigitalTheatre Sound)、SDDS(Sony Dynamic Digital Sound)等为任选格式。

音频压缩编码是基于人耳感觉特性来实现降低码率的目的的。在这些编码方案中,利用了人耳的频率、时间遮蔽效应和对声音的定位特性。频率遮蔽效应是当频率接近、强度有明显区别的两个信号同时出现时,人耳只能感觉强度高的信号,而强度低的信号将被遮蔽;时间遮蔽效应是当一个强度比较弱的信号出现在强度比它强的信号之前或之后的一个时间区间内时,比较弱的信号将被遮蔽,显然被遮敝的信号不需要传送,从而降低了码率;人耳对声源定位时,对低频信号方向性不敏感,对高频信号的方向主要是从对包络的感觉判断,这些特性被用于降低立体声编码的码率。当然,这样处理损失了原始音频信号中的一部分,但因为这部分是感觉不到的或者是很不敏感的,因此它基本上不会影响声音的质量,从而既保证了音质,又降低了码率。

3.2.2 数字音频工作站

1.基本概念

数字音频工作站(DAW)是以计算机控制的硬磁盘为主要载体的非线性数字音频系统,是由计算机中央处理器、数字音频处理器、软件功能模块、音源外设、存储器等部分所构成的一个工作系统。它通过将音频信号加工处理成数字码方式,来实现对信号的获取、记录、储存、重放。它包含录放音、多轨合成、调音、均衡、不变调时间压扩、混响、延时、降噪,简单到复杂的声音剪辑等所有系统功能,使众多操作繁琐的音频制作过程集成在多媒体电脑上完成。

与传统的数字音频制作相比,DAW 省去了大量周边辅助数字音频设备以及设备的连接、安装与调试。且性价比高,操作也较简单。

2.基本构成与工作原理

DAW 是一种硬件与软件的组合系统,具有较好的扩展特性,它将复杂的声音信号编辑成十分方便的编辑文件,同时还可以对声音信号进行新的处理。

DAW 是在计算机的基础上发展起来的,因此保留了计算机的操作方式,通过调用程序来工作。由于加大了模仿录音机和调音台部分功能的控制键盘——这个控制键盘是把数字音频工作所需的程序按照顺序排列好,存储在一个专用存储器内,并给予控制键盘的某个执行键来执行这个程序——这样对数字音频工作站的实际操作就像操作传统的录音机、调音台一样方便简捷。

数字音频工作站的主机已由过去的专用机发展到目前普遍使用的通用微机。采用通用微机的DAW,主机通常是MAC 和IBM 系列PC 机,系统软件建立在视窗系统Windows 或Macintosh 上。

DSP(数字信号处理器)是数字音频工作站的数字音频处理核心。DSP在DAW 中一般配有专用的硬件音频卡,它主要负责音频信号的数字化处理,把输入的音频信号进行采样、量化和加工,并直接将量化后的数字信号送硬盘储存。在DSP的数字音频处理系统内,使用了若干中间存储器,因此,可实现虚轨设置,进行逻辑多轨操作,这样能做到几百声轨的声音节目制作,从而突破了传统物理声轨的限制。对于每一条虚轨它同样具有物理声轨的可加工、调整、处理的全部操作功能。