第四章第七节手写字识别技术
显示屏上“写字”
你是否见过别人在掌上电脑上,用一根类似笔的东西,在小小的显示屏上“写字”,然后这
个“字”就出现在显示屏上并被电脑“承认”继而存储下来。其实这就是手写字识别技术。
手写字的输入方法与笔绘板基本相同,也是把手写字的位置信息首先转换成二进制的数字编
码信息,并写入显示存储器,实时显示在显示屏上。但随后的处理就不同了,手写字识别技
术会把写入的手写字信息在计算机内用一定的人工智能技术,对手写字进行智能化的识别,
并产生与之匹配的数字编码的中文或英文字符,同时所产生的字符也送给显示屏显示,最后
经过输入者确认后才作为正确的输入结果。
这种书写技术可以使我们与计算机进行信息交流,它不仅可以输入文本文字,而且可以输入
计算机或通信设备能够“理解”的命令,以便对它们进行控制和操作。这也是手写字技术与
笔绘板技术的不同之处。笔绘板技术虽然也可以进行手写字输入,但实际上其输入结果并未
被计算机识别和理解,仅仅是对它“照葫芦画瓢”地进行存储、传送。目前,手写字识别技
术,特别是中文字识别技术经过十几年的研究已经获得很大的发展,虽然在实用中还存在一
定的局限,如一定的错误率,但由于它作为一种多媒体与人工智能结合的技术,而且特别适
合我国的国情——汉字的结构比较复杂而且规律性较少,所以发展的十分迅速。
汉字输入
目前,汉字输入主要分为人工键盘输入和机器自动识别输入两种,自动识别输入又分为
语音识别和字符识别两种。汉字识别技术可分为印刷体汉字识别和手写体汉字识别两大类,
后者又可分为联机手写汉字识别和脱机手写汉字识别。从识别的角度来看,手写体识别难于
印刷体识别,而脱机手写识别又难于联机手写体识别。
汉字已有数千年的历史,也是世界上使用人数最多的文字,对于中华民族灿烂文化的形成和
发展有着不可磨灭的贡献,并将继续发挥重要的、其他文字形式无法取代的作用。然而,汉
字是非字母化、非拼音化的文字,在当今高度信息化的社会里,如何快速高效地将汉字输入
计算机,已成为影响人机交流信息效率的一个重要瓶颈。
汉字识别的困难
手写汉字识别是一种重要的、适用于把手写文稿随时输入计算机的方法,也是机器字符识别
最为困难的一个课题。这些困难和问题表现在:
1汉字类别多,
仅《康熙字典》中就包含了49 000多个汉字,而常用的汉字就有4 000多个,因而汉字识别
问题属于大类别(或者称为超多类)模式识别问题,在模式识别理论和方法研究方面有重大
意义。
2汉字字形结构复杂
汉字集合中相似字较多,有些汉字的差别仅为一点或一个笔画,由于手写变形的存在,使得
手写体中相似字的区分比印刷体要困难得多。因不同人书写风格的差异造成手写汉字的变形
很大,具体表现在以下几个方面:
(1)基本笔画变化。横不平,竖不直,直笔变弯,折笔的拐角变成圆弧等。
(2)笔画模糊,不规范,该连的不连,不该连的却相连。
(3)笔画与笔画之间、部件与部件之间的位置发生变化。
(4)笔画的倾斜角、笔画的长短、部件的大小发生变化。
(5)对于脱机手写汉字,不同人使用不同的书写笔可能造成笔画的粗细变化。
其中,手写汉字字形的变化是最难以解决的问题。
一般认为,联机手写汉字识别比脱机手写汉字识别相对容易些。联机手写汉字识别是一种人
工实时地把汉字输入计算机的方法,它利用书写板把笔画变为一维电信号,输入计算机的是
以坐标点序列表示的笔尖移动轨迹,因而被处理的是一维的线条(笔画)串,这些线条串含
有笔画数目、笔画走向、笔顺和书写速度等信息;而脱机手写汉字识别处理的仅是二维的汉
字点阵图像,是汉字识别领域中最后一个十分困难的问题,目前仍然处于实验室研究阶段。
字符识别处理的信息可分为两大类:一类是文字信息,处理的主要是用各国家、各民族的文
字(如汉字、英文等)书写或印刷的文本信息,目前在印刷体和联机手写方面技术已趋向成
熟,并推出了很多应用系统;另一类是数据信息,主要是由阿拉伯数字及少量特殊符号组成
的各种编号和统计数据,如邮政编码、统计报表、财务报表、银行票据等,处理这类信息的
核心技术是手写数字识别。近年来我国开始大力推广的“三金”工程在很大程度上要依赖数
据信息的输入,如果能通过手写数字识别技术实现信息的自动录入,无疑会促进这一事业的
进展。因此,手写数字的识别研究有着重大的现实意义,一旦研究成功并投入应用,将产生
巨大的社会和经济效益。
手写数字识别的理论价值
手写数字识别作为模式识别领域的一个重要问题,也有着重要的理论价值:
(1)阿拉伯数字是惟一的被世界各国通用的符号,对手写数字识别的研究基本上与文化
背景无关,这样就为各国、各地区的研究工作者提供了一个施展才智的大舞台。在这一领域
大家可以探讨,比较各种研究方法。
(2)由于数字识别的类别数较小,有助于做深入分析及验证一些新的理论。这方面最明
显的例子就是人工神经网络,相当一部分的人工神经网络模型都以手写数字识别作为具体的
实验平台,验证理论的有效性,评价各种方法的优缺点。
(3)尽管人们对手写数字的识别已从事了很长时间的研究,并已取得了很多成果,但到目前
为止机器的识别本领还无法与人的认知能力相比,这仍是一个有难度的开放问题。
(4)手写数字的识别方法很容易推广到其他一些相关问题,一个直接的应用是对英文这样的
拼音文字的识别。事实上,很多学者就是把数字和英文字母的识别放在一块儿研究的。
随着国家信息化进程的加快,手写数字识别的应用需求将越来越广泛,因此应当加强这方面
的研究工作。应用系统的性能的关键与瓶颈仍然在于手写数字识别核心算法性能上,最终目
标是研究零误识率和低拒识率的高速识别算法。此外,尽早建立反映中国人书写习惯的、具
有国家标准性质的手写数字样本库也是当务之急。