书城管理海归汇聚中关村
14881200000132

第132章 IT时代的“YES OR NO”技术

进入20世纪,人类的智慧越来越在财富创造中占据重要位置。于是,对于知识产权的强调和保护成为尊重每个文明创造者权利的世界性话题与行动。这些保护,使世界的重大技术创造对世界文明的进步拥有巨大的话语空间。例如对一些技术的掌握,使美国成为令人生畏的国家。

作为计算机技术的发起者、推动者、应用者与创造者,美国掌握着计算机技术最重要、最基本、最高端的核心技术。不论甲骨文、微软、INTEL、雅虎或者Google,都对世界IT技术的发展有着无可争议的权力。原因在于他们对于技术的垄断基础上所形成的市场垄断。

所以,只有那些掌握着“YES OR NO”技术的公司和国家才能在这个时代获得话语权,获得竞争与超越的资格。

不过,这个资格一开始对中国就是一个挑战。因为就像前面提到的,计算机一开始就是基于字母文字的创造物,没有考虑到东亚以中国为中心的表意文字。所以,如果没有技术上的突破,中国已经被屏蔽在计算机的发展之外。

王宏源告诉记者,新中国成立后的简化汉字以及汉字拼音化教学,就是中国应对计算机逻辑基础的一个措施。中国必须融入计算机的时代,这是那个时代的共识。

为什么会发生这样的事?

王宏源说,计算机的逻辑运算是二进制,二进制是莱布尼茨在中国《周易》的启发下发明的。在计算机那里,二进制的“0”和“1”代表着不同的信息,而且不同数字,“0”和“1”的分布是不一样的,这样就可以代表不同的信息,在计算机运算那里,第一位是标示位,不代表任何信息,因此要通过其他位置来传递信息。在最初,2的8次幂所能内涵的128个位置足够将西方文字单元表现出来,因为英文只需26个字母就可以构造所有的词,加上一些符号和数字,128个位置是足够的。但东亚的文字就不能表现出来。这就是计算机的单字节时代。

正是这个背景下,中国尝试拼音化汉字,还出版了拼音教材,全是拼音。显然,这与几千年的传统相违背,加之中国又没有英语教育的传统,英语普及率不高,种种因素都在呼唤技术的突破。

于是,20世纪80年代,二字节时代到来。二字节时代,是2的16次幂,有35532个位置,这样,27558个日韩文字都能表达了。1981年,中国国标2312标准出来了,大部分文字都可以经过计算机来处理。汉卡就是这个时代背景下的产物,随之五笔字型输入法等输字法的流行,中文的计算机时代到来,计算机开始大规模普及,直接点燃了90年代计算机的市场,奠定了互联网发展的基础。

中国在IT时代赶了上来,这确实要感激汉卡的发明和王选的汉字激光照排技术。但值得注意的是,为什么汉字激光照排的王选名气要远大于联想汉卡的主要发明人倪光南?因为,二字节的设置已经在计算机基础上解决了汉字基本输入问题,汉卡只是在这个基础上置入汉字信息。所以,上世纪80年代有那么多的公司发展汉卡。而汉字激光照排确实是原创性的东西。

二字节时代,大部分基本的汉字可以得到处理,但是,许多古书上的生僻字不能处理,这势必使许多古书上的重要信息缺失。

于是,计算机走向四字节时代。在微软的支持下,Unicode标准出台,四字节可以编码的空间巨大,所有的汉字都可以得到国际统一的编码。

与此同时,方正按照这个标准编码造了字模,并卖给微软,捆绑在OfficeXP上。随之,海峰五笔和新概念五笔等基于五笔字型的超大字符集输入法的出现,目前已实现了超过7万汉字的高速输入。

王宏源的技术贡献在于,他能够实现所有汉字的搜索,这种搜索其他搜索不能支持。原因在于,从来没有人建立过基于四字节基础上的全字符集的文本整理,网络上所有的中文生僻字都是缺失的。为了实现所有古籍的互联网化,王宏源致力于将所有古籍完整地放在计算机上和网络上,建立数据库,从而形成中国最完备的文化知识系统。还有,他发明了新的搜索技术,所有的汉字信息都能在他的数据库里找到。这是对中国文化传播的最大贡献,这种互联网上的传递与保护,将为中华文化复兴准备了技术基础和内容基础。

王宏源的技术就是这样的“YES OR NO”技术,只有这种技术才能实现汉字的全部搜索。正是在这个意义上,他说,他铺就了信息高速公路最后一段路,因为从他完成中国古籍的整理以后,世界上人类有史以来所有的知识和信息都将可以在这个信息时代全球性地流转和共享。