书城管理海归汇聚中关村
14881200000131

第131章 计算机能够处理所有汉字了

北京时代瀚堂科技有限公司总经理王宏源

王宏源,20世纪60年代出生于北京。1983?1988年,在清华物理系读本科,后连续攻读硕士研究生,1991年毕业。1992年,加入中国机械进出口总公司工作。1997年,进入加拿大滑铁卢大学学习电子工程,获硕士学位。2002~2003年,在台湾工作,2003年,回大陆在中关村海淀创业园创立北京时代瀚堂科技有限公司,任总经理。

计算机不是中华文明的产物,因此计算机所解决的对象都是西方语境下的文明存在。这是自然的,科学发明都离不开文化或文明的语境。就像筷子不会考虑西方人的刀叉习惯,这关涉不到科学殖民主义。

作为文明最大的承载体,语言和文字是计算机必须要处理的,也就是说,将人类的语言翻译成计算机语言,这样才能实现智能机器帮助人的大脑工作。

关于这些,许多人都已经知道了,而且IT技术的高度发展诱惑我们将目光投向IT技术的无限延展和应用。事实上,真正给IT技术带来革命的往往还是在计算机逻辑基础这一领域。其设计决定了IT的优点、缺点、内涵与外延。这里的“YES OR NO”决定着“MORE AND MORE”。

北京时代瀚堂科技有限公司总经理王宏源就是致力于IT时代“YES ORNO”的技术怪才。不过,由于他的技术主要全面解决5000年来中华书籍所有文字的输入和搜索问题,因此必须要优先对中国古代字书进行整理,充分掌握,因此他可能是认识中国文字最多的人之一。

对于试图复兴中华文化的中国而言,能够通过计算机和互联网全面把握所有中华文字,这种作用绝对不是可有可无的。

下面是2006年3月新华社的一条信息。在这个资讯爆炸的年代,这条信息很快被埋在信息垃圾下面。未来的历史将证明,这段文字将具有历史价值。

……一种由中国人自主开发的编码技术以计算机录入和处理的方式,出版了收录有大量生僻汉字的《康熙字典》,这不仅改变了古籍中的生僻汉字仅能依靠影印或造字出版的历史,也意味着中国所有汉字将实现计算机处理。

由中国人自主开发的四字节编码技术还将解决户籍、银行、海关等行业遇到的姓名、地名中的生僻字问题。

该项技术的发明人、北京时代瀚堂科技有限公司总经理王宏源说,在通用的计算机平台上的“龙语瀚堂”典籍数据库采用的四字节编码技术,可录入、显示、编辑、检索、查询和管理七万多汉字。而传统的二字节编码技术只能处理两万多个汉字,一些存在生僻汉字的古籍只能依靠影印或生硬造字的方式整理出版。

在日常生活中,一些姓名中有生僻字的人常常因为民航、银行等服务机构不认识或无法在电脑中输入他们的名字而遇到麻烦。统计显示,中国13亿人口中仅名字中带有生僻字的就多达6000多万人。

此前,虽然各种解决方案如手写扫描、造字打印、自建字库等输入手段也相应提出,却无法解决生僻汉字检索和查询的管理问题。

目前,海内外汉字文化圈所拥有的人口数高达15亿,全球非汉语母语的学习者已达3000万人……

对于大多数已经习惯汉字输入法的人,对这段信息可能一笑而过。但,作为中华汉字的重要组成部分,作为中华文化的承载者,这些所谓的生僻字传递着重要的文化和历史信息,有着深厚的历史内涵。

另一方面,对于计算机技术而言,信息时代如果不能囊括所有人类文明的知识与信息,也是IT时代的一个重大缺憾,全球化的理想就会受到致命一击。

中国,在挑战IT时代的边界。

但是,王宏源改变了这些……