书城社会科学档案信息检索
17943500000029

第29章 档案检索工具常用排检法

排检法是指检索工具中各部分内容的编排方式,是一种用人工检索语言编排检索工具的方法,检索工具的编排方式与检索功能密不可分,检索工具只有进行科学的编排才能完成检索的任务。

档案检索工具排检法一般有三种类型:字顺法、类序法和自然顺序法。

一、字顺法

字顺法是根据汉字的字形、字音等特征编排工具书条目的方法。根据汉字的形体构造归纳分类,再按照一定顺序编排条目的方法称为形序法;根据汉字字音顺序排检汉字的方法称为音序法。

中国古人从先秦时代就开始从造字的角度分析汉字结构,例如《韩非子·五蠹》:“古者苍颉之作书也,自环者谓之私,背私谓之公。”在《周礼·保氏》和《汉书·艺文志》里就出现了关于汉字“六书”的名称,而从理论上阐述汉字基本结构,并用这种理论来探求汉字本义的,则应该首推东汉人许慎。许慎在《说文解字》一书中分析了九千多个汉字的形体,并说明每个字的本义,所用分析汉字的方法就是他在《说文解字·叙》中阐述的“六书”理论。许慎在《说文解字·叙》中具体地为“六书”下了定义,举了字例。后来,经过历代文字学家的总结补充修正,成为一套完整的理论,人们称之为“六书说”。“六书”是前代学者根据汉字的形体结构和使用情况,加以分析、归纳而出的字体分类,“六书”的具体内容是象形、指事、会意、形声、转注、假借。根据汉字“六书”的具体内容,编制中文检索工具最为常用的排检方法就是根据汉字的字形、字音特点形成的字顺法。字顺法又包含两种顺序,一是形序法,二是音序法。

(一)形序法

根据汉字的形体构造归纳分类,再按照一定顺序编排条目的方法称为形序法,常用的形序法有三种:部首法、笔画笔形法和四角号码法。

1.部首法

根据汉字部首编排和检索汉字的方法,又称为“部首检字法”。部首检字法是一种常用的汉字查字法,广泛应用于工具书编纂、汉字信息处理及其他领域的汉字检索。

第一次用偏旁部首给汉字归类是在东汉许慎的《说文解字》中,他首创540部。但后来汉字发展演变越来越重视形的变化,部首也就有了各种各样的变化。到了明代《字汇》偏旁部首变成了214部,清代《康熙字典》也是214部。新中国成立后,我国使用的各种字典中,有250部的,有189部的,也有214部的,《新华字典》第9版之前就是189部。1983年,中国文字改革委员会和国家出版局联合发布了《汉字统一部首表(草案)》,主部首为201个。草案发布后,在辞书编纂、汉字标准的制定、计算机信息处理等方面排序检索中广泛应用,得到了业界认可。我们熟悉的《汉语大字典》、《现代汉语常用字表》、《现代汉语通用字表》、《现代汉语词典》(第5版)、《新华字典》(第10版)、《现代汉语规范字典》、《中华字典》、国家图书馆书目检索系统等部首检字法,都依据这一草案。2009年国家教育部发布,并在2009年5月1日实施的新的《汉字部首表》是在《汉字统一部首表(草案)》的基础上制定的,依照现行的语言文字标准,在主部首和附形部首的确立、部首排序、部首表的使用规则等方面对草案做了适当的调整和补充。新的《汉字部首表》规定主部首201个,保持了原草案的部首数,附形部首99个。据教育部语言文字应用研究所有关专家介绍,过去的汉字归部是据义归类,而利用《汉字部首表》形成的《GB13000.1字符集汉字部首归部规范》则主要是据形归类。例如“则”字,据义归类,就归于“刂”,而据形则归于“贝”部。

根据新归部标准,拿到一个汉字,首先从左、上、右看哪个能成为部首,能成部首的就选成部首。比如说“彬”字,左侧有“木”,就归到“木”部;再比如“闻”,一看外部是“门”,就不要查“耳”了。一个字如果左边和上面都不是部首,那就取右边或取下边,如“颖”就取“页”做部首,“染”就取“木”做部首。如果几个部首叠合,比如说江西的简称“赣”,在左边取部的时候,可能有一点一横,或者一个“立”,一个“音”,部首叠合的时候就取复杂的部首归部,“赣”归入“音”部。今后再版的工具书,将逐渐均用统一部首表和归部规范编纂。一般以主部首为主。某些辞书,如大型书、词典、古汉语字词典可根据传统和实际需要,用繁体部首或变形、从属部首作为主部首。某一些辞书还可以采用主部首和收字较多的附形部首同时立部,比如“车”和“玉”。汉字部首的统一将推动辞书编纂、汉字教学以及汉语走向世界。此外,汉字统一部首也将对汉字的信息化产生推动作用,例如对汉字信息编辑,确定电脑字库中某个汉字的位置,以及计算机汉字编码、手机汉字编码,图书信息检索,甚至对今后应用于电脑的汉字输入法的编码都将产生影响。

部首法的优点:通过部首将数量庞大的汉字相对集中,符合汉字的结构特点,便于集中查询。

部首法的缺点:如部首判断不准,笔画数不正确,检索就比较困难。

2.笔画笔形法

根据汉字的笔画多少和笔形顺序排列和检索的方法,是笔画法和笔形法的结合。

笔画法:根据汉字笔画数多少编排和检索汉字的方法,由少到多排列。

笔形法:根据汉字的笔画形状(横、竖、撇、点、折)和书写顺序编排检索汉字的方法,又叫“笔顺法”。

笔画笔形法的编排顺序:

(1)按照汉字笔画数从少到多排。

(2)笔画数相同的字按起笔到末笔各笔形“横、竖、撇、点、折”顺序排列。

(3)以上各项相同时,按照汉字在国家标准汉字编码字符集中的编码值从小到大排列。

难点:检索时要注意数准笔画数,搞清笔形和书写顺序。

3.四角号码法

四角号码法的基本原理是将汉字的笔形分为10种,分别用0—9这10个数字表示,每个字按左上、右上、左下、右下(4个号)四角笔形取码,再按号码大小排列汉字。

四角号码笔形代码口诀:

横一竖二三点捺,叉四插五方框六。

七角八八九是小,点下一横变零头。

四角号码查字法号码笔形对照表(表6-7)。

注:根据《四角号码新辞典》,商务印书馆1991年第44次印刷出版。

四角号码法实例:

增=4816:①左上角4、②右上角8、③左下角1、④右下角6;

颂=8178:①左上角8、②右上角1、③左下角7、④右下角8;

颜=0128炮=9781 蜂=5715 说=3871 效=0844

四角号码取角方法:

(1)每字按①左上角、②右上角、③左下角、④右下角的次序取四个号码。

(2)一笔笔形有变化,可以分为上下或左右两部分取号,如:

以=2870乱=2261七=4071(3)一笔的上下两段和别笔构成两种笔形的分两角取号,如:

半=9050 大=4080 火=9080

(4)下角笔形偏在一角的按实际位置取号,缺角为0,如:

产=0020 亏=1002 弓=1702 户=3020

飞=1201 妒=4340

但当“亏”、“弓”等字作偏旁时,取2作整个字的左下角号码。

(5)凡外围是“口”、“门”、“门”三类字形的,左右两下角取里面的笔

形,如:

圆=6021 因=6080 田=6040 闭=3724

闲=3790 闽=3713

但上下左右有附加笔形的不在此例,如:

茵=4460 思=6033 简=8822 泪=3610

(6)一个笔形如果前面已经用过,后角为0,如:

王=1010冬=2730时=6400八=8000

斗=3400心=3301全=8010中=5000

(7)附号

为了区别四角同号码的字,摘取靠近右下角(第四角)上方一个笔形作“附号”,若这一笔形已经被用过(如“决”、“计”),则为0,如:

芒=44710固=60604豆=10108决=35180

四角和附号都相同的字,按照各字所横笔数目顺序排列,如:

市=00227(二横笔)帝=00227(三横笔)

取笔形时应注意的几点:

(1)凡是能构成复笔的尽量按复笔笔形取码,即“复笔优先”,如:

气=8001≠2101 扎=5201≠1221 庄=0021≠3021 养=8022≠3222

(2)点下带横折的,如“空、户”等字的上角,应取“点”作3,不能取“点下一横”作0.

(3)角形有两单笔或一单笔一复笔可取的,不论高低,一律取最左或最右的笔形,如:

梁=3390≠3790 帚=1722≠1740 鸣=6702≠6202 拍=5600≠5206

(4)有两复笔可取的,在上角取较高的复笔,在下角取较低的复笔,如:功=1412≠1712 也=4471≠4771 成=5320≠7325 皮=4024≠7724

(5)当中起笔的撇,下角有它笔的,取它笔作下角,如:

衣=0073≠0023 春=5060≠5006 复=8040≠8024 左=4010≠4001

但左边起笔的撇,取撇笔作角,如:

尉=7420≠7490 辟=7024≠7064

四角号码编排顺序:

根据《中华人民共和国国家标准·文字条目通用排序规则》(GB/T13418—92)的规定,四角号码按照以下顺序编排:

(1)按四角号码大小排,由小到大。

(2)四角号码相同者再按照附号排。

(3)以上两项都相同者,再按照横笔数排,由少到多。

(4)以上三项都相同者,再按照整字总笔画数排,由少到多。

(5)以上几项都相同者,再按照起笔至末笔各笔笔形,按“横、竖、撇、点、折”次序排列。

(6)以上各项都相同者,按汉字在国家标准汉字编码字符集中的编码值从小到大排列。

(二)音序法

利用汉字的发音进行排序的方法就叫做音序法。音序法包括三种:声韵法、注音字母法和拼音字母法。现在使用最多的是拼音字母法。

1.声韵法

古代按照平、上、去、入四声和韵部编排检索汉字的方法。使用这种方法首先要知道某个字在古代的声、韵、调,一般都是在研究古汉语或声韵学时专家学者使用,如古人的“云对雨,雪对风,晚照对晴空。来鸿对去燕,宿鸟对鸣虫。三尺剑,六钧弓,岭北对江东。人间清暑殿,天上广寒宫。两岸晓烟杨柳绿,一园春雨杏花红。两鬓风霜,途次早行之客;一蓑烟雨,溪边晚钓之翁”。这些字句就包含有对声韵的简单解释。对一般现代人来说要准确有一定困难,所以常用工具书一般不采用声韵法进行编排,不懂古音的人可以先利用《词源》、《汉语大词典》等标注有古音的工具书,查出字的古音,再去查用声韵法编排的工具书。

2.注音字母法

注音字母法是按照汉字注音字母顺序编排检索汉字的方法。注音字母又名“国音字母”,是中国第一套法定的汉字形式的拼音字母,1913年由读音统一会议定,1918年北洋政府教育部公布,1930年国民党政府改名为“注音符号”。1958年大陆《汉语拼音方案》公布,在这之前注音字母从1918到1958年推行了40年,对统一汉字读音,推广国语,普及拼音知识有很大贡献,目前仍在台湾省使用。注音字母共40个,它的特点是字母全部采用汉字的简单笔画,即:ㄅㄆㄇㄈ万、ㄉㄊㄋㄌ、ㄍㄎ兀ㄏ、ㄐㄑ广ㄒ、ㄓㄔㄕㄖ、ㄗㄘㄙ、ㄧ ㄨㄩ、ㄚㄛㄜㄝ、ㄞㄟㄠㄡ、ㄢㄣㄤㄥ、ㄦ。排列顺序是先声母,后韵母,声母韵母相同时按照声调的阴、阳、上、去顺序排列。1958年《汉语拼音方案》公布后,注音字母法就在中国内地废止,但大陆词典也有同时使用注音字母的,古今对照,方便只懂注音字母的人使用。在新《辞源》、《新华字典》附有注音字母,可以参考。

注音字母与汉语拼音字母对照:

ㄅ ㄆ ㄇ ㄈ 万ㄉ ㄊ ㄋ ㄌㄐ ㄑ 广 ㄒ ㄓ ㄔ ㄕ ㄖㄗ ㄘ ㄙㄧㄨ ㄩㄚ ㄛ ㄜ ㄝ

犫 狆犿 犳狏犱 狋 狀犾 犼狇 狀犼狓狕犺犮犺狊犺狉狕 犮 狊犻 狌ü犪 狅犲犻犲

ㄞ ㄟ ㄠ ㄡ ㄢ ㄣ ㄤ ㄥ ㄦ

犪犻犲犻犪狅狅狌犪狀犲狀犪狀犵犲狀犵犲狉

3.拼音字母法

按照汉语拼音方案字母表的顺序编排检索汉字的方法。1958年《汉语拼音方案》正式通过实施,1982年,获得国际标准化组织承认,成为拼写汉字的国际标准,是使用最广的汉字编排方法。

拼音字母排检顺序:

按照《GB/T13418—1992 ·文字条目通用排序规则》:

(1)按汉字拼音字母顺序排。

(2)拼音相同者,按阴平(—)、阳平(/)、上声(∨)、去声( )、轻声的次序排。

(3)音和音调相同者,按总笔画数排,由少到多。

(4)以上各项都相同者,按汉字起笔至末笔笔形排,依“横、竖、撇、点、折”顺序排。

(5)如以上各项均相同,按汉字在国家标准汉字编码字符集中的编码值,从小到大排。

国家标准汉字编码字符集简介:

全称为《信息交换用汉字编码字符集》,是由我国国家标准总局1980年发布,1981年5月1日开始实施的一套国家标准,标准号是GB2312—1980.它是计算机可以识别的编码,适用于汉字处理、汉字通信等系统之间的信息交换。基本集共收入汉字6763个和非汉字图形字符682个。整个字符集分成94个区,每区有94个位。每个区位上只有一个字符,因此可用所在的区和位来对汉字进行编码,称为区位码。这个码是唯一的,不会有重码字。1995年又颁布了《汉字编码扩展规范》(GBK)。

GBK与GB2312—1980国家标准所对应的内码标准兼容,同时在字汇一级支持ISO/IEC10646—1和GB13000—1的全部中、日、韩(CJK)汉字,共计20902字。《信息交换用汉字编码字符集》和汉字输入编码之间的关系是,根据不同的汉字输入方法,通过必要的设备向计算机输入汉字的编码,计算机接收之后,先转换成信息交换用汉字编码字符,这时计算机就可以识别并进行处理;汉字输出是先把机内码转成汉字编码,再发送到输出设备。

二、类序法

将排检对象按照事物性质、学科体系或主题内容编排检索的方法。

(一)事物性质排列法

将文献按照同一类事物性质归类集中编排的方法。如古代的政书、类书,现代的手册、指南、年鉴等。这种方法便于集中性质相同或相近的文献资料,便于以类相聚,按类检索。但如对待检对象的划类不准确,检索时便会出现误差。

(二)学科体系排列法

学科体系排列法是按照文献的学科系统分类排列的方法,具体做法就是用等级列举的方法层层依次展开各学科的类目。在中国古代,图书和档案没有很严格的区分,因此各类书目资料,包括部分档案材料大都采用学科体系排列法。到现代,古今图书分类有了较大区别,尤其是档案的分类和图书分类有了显著变化,最明显的区别就在于图书大多按照内容分类,而档案的基本分类原则是按照来源分类,在古代常用的图书分类法有六分法、四分法、五分法等,到了现代这些方法主要用于对古籍图书的分类,对现代图书的分类从20世纪50年代开始大都按照《中国图书馆分类法》的分类标准,而以学科体系排列档案的方法主要体现在以《中国档案主题词表》为标准的档案主题分类法中。

三、自然顺序法

根据事物发生、发展的时间或事物所处的地理位置编排文献的方法。包括时序法和地序法两种。

(一)时序法

按照时间顺序编排档案文献的方法。如历史纪年表、大事年表、年谱等。这种排检方法线索清晰,检索方便,检索者只要依年月日顺序就可顺利查到所需资料。

(二)地序法

按照档案文献内容所涉及的地理位置或行政区划进行编排检索的方法。如地图集、地理沿革表、名胜词典、方志目录、旅游指南等。