第3章细说通信(1)

（第一节）寻数据和信号之源

一、信号家族两兄弟

信号相当一种“交通工具”，是运载消息的工具，是消息的载体。从广义上讲，它包含光信号、声信号和电信号等。例如，古代人利用点燃烽火台而产生的滚滚狼烟，向远方军队传递敌人入侵的消息，这属于光信号；当我们说话时，声波传递到他人的耳朵，使他人了解我们的意图，这属于声信号；遨游太空的各种无线电波、四通八达的电话网中的电流等，都可以用来向远方表达各种消息，这属电信号。人们通过对光、声、电信号进行接收，才知道对方要表达的消息。在信号这个大家族中，有两兄弟特别引人注目，就是“模拟”和“数字”。

(一)什么是“模拟”

信号家族中，“模拟”是“数字”的兄长。“模拟”是对我们生活的实体的一种表达方式。

如果你在看一本书，白纸黑字就映入你的眼帘，在你的大脑中就会有反应，你从书中知道了一些东西，我们说印在纸上的字是一种“模拟”。与此相类似，你用笔在纸上记下的一个电话号码或是写下的一首诗歌，还有刻在石头上的古代碑文，这些都是“模拟”。除了文字以外，我们在生活中还能见到许多“模拟”的东西，比如风景美如画的大自然，山间的鸟语花香，亲朋好友的声音传入我们的耳朵。

“模拟”需要载体或是信息的存储媒体，比如说一张白纸承载以文字形式存在的信息。

“模拟”需要工具也就是硬件。比如，有一台电视机，电视机的荧光屏和喇叭都属于模拟设备。

“模拟”需要传播方式，比如说你可以和一个十几米外的朋友说话，但是如果你的朋友在几百公里以外，你就不得不需要电话，电话网通过“模拟信号”将你的声音传到了几百公里甚至几千公里以外。

(二)什么是“数字”

“模拟”的老弟“数字”，数字也是我们生活中的实体的一种表达方式。

“比特”是数字信息最小的度量单位，有时也叫“位”，意即二进制的一位。在媒体中传输的讯号是以比特的电子形式组成你的数据。

给比特下的定义是：比特是一种存在的状态：开或关，真或伪，上或下，入或出，黑或白。出于实用的目的，我们把比特想成１或０。

“比特”来自于英语bit一词的音译。bit一词是由binary（二进制的）和digit（数字）两个词压缩而成的，所以bit即“二进制数字”，亦即０和１。“数字时代”准确的意思是“二进制数字时代”或“比特时代”那么这０和１到底是什么意思呢？

比如，我们在使用电脑的时候，可以根据我们的需要和喜好，通过一些位于显示器底部的旋钮来调节显示图形，在这些旋钮下面，分别写着center（居中度）、size（大小）、brightness（亮度）、contrast（对比度）。这些调节都有一定的可调幅度，我们可能在这个幅度内任意选择哪一种居中度、大小等。除这些旋钮外，还有一个“机关”却不是这样，这个机关的两边分别写着０和１。这就是显示屏的开关。它没有调节幅度，通过它我们只能选择非此即彼的两种状态：开（on）和关（off）。显示屏的亮度、对比度等都有两个极点，在这两个极点之间的“值”是多值性的。而开关的周期只有两个值，即它的两个极点。“进制”的“进”，就是周期所包含的“值”。比如“十进制”数字，就是一个变化周期里包含十个“值”数字。同样道理，二进制数字就是变化周期里包含二个值的数字。我们采用何种“进制”对一种事物的存在状态计数，表面上，要看衡量事物状态的“值”的多少，其实“进制”与事物的状态值并无必然的、唯一的关联。事实上，电脑完全可以用０和１这两个数字将多进制状态的“值”表示或“翻译”出来。数是抽象的，但数的观念却源于人的具体的感觉经验。我们对于十进制计数方法习以为常。当一个人说“一年有12个月”这句话时，他可能觉得“12”这个数字唯一正确地表示了一年的月份数。进而他可能会认为，数字与事物的数量同样都是客观的——除了说一年有12个月，不可能还说十三个月了。

这样的看法，是对于数字本质的一种似是而非的看法。极端地说，对于“一年有多少个月”这个问题，可以有很多不同的“答案”。这样说听起来简直荒唐透顶，细究起来却并不然。当我们采用不同进制来表示事物的数量时，我们对事物的数量就可以说出不同的“答案”，而且这些“答案”都是对的。比如可以说一人有65岁，也可说他有01000001岁。只是后一种说法我们听起来相当别扭，因为我们早已习惯了用十进制数字来表达数量。如果采用“六进制”数字（世界上似乎还没有哪个民族采用过这种进制的数字），那么就可以说一年有二“六”个月。如果螃蟹有朝一日进化到与人接近的水平，它们很可能采用“八进制数字”来计数，那么在它们看来，一年就有一“八”又四个月。

这样说看起来像是开玩笑。其实“数字”并非我们通常所认为的那样“客观”。说到底，它是人对于客观事物的数量的主观映象。

数字信息度量单位中，除“比特”（bit）外，我们还经常会遇到几个数字信息度量单位。字节（byte）是一种比“比特”更抽象或是高级的度量单位，一般来说，一个字节有8位，即8个比特。还有三个缩写，“K”、“M”和“G”。1K＝1024，在中文里我们通常叫它“千”；1M＝1024×1K，在中文里我们通常叫它“兆”；1G＝1024×1M，在中文里我们通常叫它“千兆”或者“吉”。

通常对于数据在网络上传输的情况用比特（位），比如我们一般都说这条电话线一秒钟可以传送9600比特的二进制流，而不是说1200字节。字节通常用在数据的存储系统中，比如说这个文件的大小是2M，这里指的是字节而不是比特，又比如是M软盘、20G硬盘，指的也是字节。

三、文本与二进制

数字化数据分为两种基本类型：文本或二进制数据。

文本的组成出自于普通字符：字母、数字、标点等。同样也由象空格（space）和制表符（tab）等这样的特殊字符组成。一份含有这类数据的文件称为文本文件。这种文件也可称为“ASCII文件”（该名来自ASCII码）。ASCII代表“美国信息交换标准码”，它规定了各种不同的符号如何转化为计算机数据。

一个较为复杂文件的数据可能就是“二进制”数据。一份二进制数据样本例子是含图片的文件。像这种文件不含字符。当然，它包含表示许多组成图像小点的信息。含有二进制数据的文件称为“二进制文件”。

用图像的贮存说明二进制的来由。二进制文件贮存图像完全不像照像册保存照片那样，它不含实际的图像。二进制文件贮存再造图像的数据。

它就是这样工作的，每一独立点被写成“0”或“1”的数值。在我们的例子中一个“0”可能表示一个白点；一个“1”可能表示一个黑点。换句话讲，一个含有图像的文件实际上就是由所有大长串“0”和“1”组成。显示图像的程序必须能识别这类数据，这样才能在屏幕上重现图像。

从计算机科学术语来讲，一个元素必须含有这两个数值中的一个——即“0”或“1”——这个元素称为“bit”（比特）。就专业术语而言，可以这样讲，我们的文件含有大量“bit”，所有这些“bit”都是“0”或“1”一个数值。每个“bit”都代表一个黑点或白点。

这里所举的例子已经是较简单的了。实际上计算机专家认识许多不同类型的“bit”。因此，也就有许多不同类型的二进制数据。例如，对于贮存彩色图片，就需要用不同的“0”和“1”。对于贮存录音，又需用另一种“0”或“1”的字码排列方法。

更重要的是，对于使用文本数据工作的程序是相对简单的。用二进制数据，每一个“bit”都是重要的，操作的数据变得更复杂。

通常，当一台计算机向另一台计算机传送数据时，需要知道所操作的是文本数据还是二进制数据。作为一种常规，普通字符数据为文本，其它的都是二进制数据。

因此，一个保存图像或录音的文件是二进制文件，它们的信息是不能用普通字符来代表的。在不知道许多常用计算机工具的时候，像文字处理系统和游戏程序——同样也是以二进制文件贮存数据。虽然在屏幕上，这些信息看起来像字符，但程序在文件中贮存数据是以非文字符的代码贮存的。例如，文字操作系统用这样的代码表示斜体字或粗体黑字。因此像文字处理文件或游戏程序这样的文件是以一种特殊格式化方式被贮存并分解为二进制文件的。

四、数字通信的小手术

模拟信号很大程度上区别于数字信号。模拟信号是用连续变化的数值来表示要说明的信息；数字信号是用有限个“0”和“1”的代码来表示信息中某一个字符，当很多字符组合起来时，才能表达完整的信息。

而今，模拟信号可通过数字化的方法转化成数字信号；反之，数字信号又可通过模拟化的方法转化成模拟信号。完成这两种转化的器件分别称为“模数转换”和“数模转换”。

脉冲编码调制，是模拟信号数字化最常用的方法，即PCM。PCM要经过三个步骤才能完成。第一步“取样”，第二步“量化”，第三步“编码”。当然，这些工作是由集成电路去完成的。这里仅介绍一下编码。

编码，是数字通信过程中的一个重要环节。编码的一个重要目的就是尽量压缩线路信号的传输带宽，以便提高发送信码的速率。当然，考虑到同步、抗干扰、特性匹配等因素，编码在降低传输带宽方面的效率不一定很高。下面总结几种常用编码方式加以描述。

(一)AMI码

AMI码就是传号交替反转码，属于“1B1T”码（即将1位二进制码（BINARY）变换为1位三进码（TERNARY））。其编码规则是：二进信码“1”交替用“+1”或“-1”电平表示，二进信码“0”则用“0”电平表示，根据编码规则可知：AMI码由于采用1∶1编码方式，在改进信码传输速率方面没有任何改进。

(二)HDB3码

由AMI码的改进成的HDB3码，在码流出现连“0”个数超过3个时，插入“V”码，以便于同步，由于插入“V”码，码流经编后传输速率略有提高，即传输带宽略有加大。

(三)差分双相码

这是一种双极性两电平码，属于“1B2B”码（即将1位二进码（BINARY）变换为2位二进码（BINARY））。其编码规则是：二进位码“1”用“+1-1”或“-1+1”组合电平表示，二进位码“0”则用“+1+1”或“-1-1”组合表示，根据编码规则可知，此类编码方式的信码传输速率是原来的15倍，从而增加了信码传输带宽，对信道带宽要求就相应增加。通过以上的分析我们不难得出结论：一个数字终端产生的原始信号经编码后送到媒介传输，其相应传输特性和对媒介的要求都要发生变化，一般可以认为，原始码流经编码后，其传输速率发生了变化，传输带宽也就跟着发生变化，从而对媒介的带宽要求也就不一样，在媒介带宽一定的情况下，为了能传输更高速率的数据流，我们就要设法通过编码方式降低传输速率，减少传输带宽，从而减轻对媒介的要求。

（第二节）高速的信息时代

人们在实现位置转移的时候，可以选择多种方式，比如陆地上的汽车、火车，空中的飞机，水上的轮船等，因为交通工具的不同，在转移过程中或效果上就会产生不同的结果。于是人们根据情况选择了相应的方式。

一、基带传输与曼彻斯特编码

在信号传输系统里，直接使用数字信号传输数据时，数字信号几乎要占用整个频带，终端设备把数字信号转换成脉冲电信号时，这个原始的电信号所固有的频带，称为基本频带，简称基带。在信道中直接传送基带信号时，称为基带传输。大多数局域网（LAN）使用的都是基带传输。

在利用基带传输时，数字数据由许多不同形式的电信号的波形来表示。表示二进制数字的码元的形式不同，便产生出不同的编码方案。主要有单极性不归零码、单极性归零码、双极性不归零码、双极性归零码、曼彻斯特码和差分曼彻斯特码等。其中两种曼彻斯特编码都得到了广泛的应用。曼彻斯特编码最大的优点是，无论编码怎样变化，脉冲中每发生一次跳变，不是在同步脉冲开始位置就是在中间位置。也就是说，发送端在发送曼彻斯特编码的时候，同时也把同步信号（每位的中间时刻）告诉接收端，这对接收端先提取同步信号，然后再检测数字信号，是非常有利的。

二、骑上飞驰的骏马——频带传输

如果采用模拟信号传输数据，往往只占用有限的频带，对应基带传输将其称为频带传输。使用模拟信号传输数字数据时，需要借助于调制解调装置，把数字信号（基带脉冲）转换成模拟信号，使其变为适合于电话线路传输的信号。调制就是用基带脉冲对载波波形的某些参量进行控制，使这些参量随基带脉冲变化。经过调制的信号称为已调信号。已调信号通过线路传输到接收端，在接收端通过解调恢复为原始基带脉冲。

载波信号都有三个特征：振幅（A）、频率（f）和相位（P）。相应地，把数字信号转换成模拟信号就有三种基本技术：振幅调制（ASK）、频率调制（FSK）和相位调制（PSK）。

三、速度与质量——数据传输的指标

当今的商场上，有一个行业叫快递，寄包裹速度快，但有丢包的可能。实际上前者是速度要求，后者是质量要求。数据传送也是一样，存在着速度与质量问题。数据传输通常按下列指标衡量：传输速度（讯号移动的速度）、传输差错率（由于车库大门开启、太阳黑子、UFO发射等现象的干扰）、信道容量。

一般表示传输速率的指标有二：信息速率和码元速率。信息速率表示每秒传送信息量的多少，信息量的单位是“比特”（bit），显然信息速率是“比特/秒”（bit/s或b/s或bps）。码元速率表示每秒传送的“码元”数多少，其单位是“波特”（baud）。对二进制调制来讲，基带信号的信息速率等于调制后的码元速率；对多进制调制来讲，基带信号的速率大于调制后的码元速率。

一般表示传输差错的指标也有二：误码率和误比特率。误码率和传输速率是一对矛盾，就像车开得越快，事故率越高一样。在什么情况下能够尽量提高速度？这要看信道条件的好坏，正如开车要看道路条件。

传输速率是可以无止境的提高吗？那是不可能的，它是有限的，这个极限就是有名的香农公式提出的“信道容量”。信道容量C就是指信道可能达到的最大传输能力，即极限信息速率。

（第三节）隐身的交通法规

“数据”与“数字”是不同的概念。例如，经模数转换后的信号称为数字信号；若数字信号具有一定编码、一定格式和一定位长，该数字信号才成为“数据”。换句话说，数字可以看作是一个个的人，数据就是有组织的队列。数据通信指数据经过一定的处理，能在有线或无线的传输系统中进行的通信，其处理的目的是要保证数据准确、无误地传送。例如接收和发送的同步问题，当传输出现差错时的检错和纠错问题，传输过程中如何提高效率的问题。

一、传送队列——并行和串行

第3章 细说通信(1)

第3章细说通信(1)