古文字
考古发现,中国古史从元谋人讲起已170万年。但文明史,应以有文字为标志。一般认为中国最古文字是殷商的甲骨文,始于公元前1300年至前1028年之间。文字发展趋势,先象形、后形声。甲骨文中有大量形声字,可见甲骨文出现前,早有文字。现已证实在甲骨文前有一种陶文,这种文字比甲骨文早600年到1000年,约在夏朝晚期。那么,文字萌芽时期可能在公元前3000年左右。
山东大坟门遗址发现陶器,上刻原始文字,称陶文,据考证,时间约在公元前3000至前2500年。这时已有文字萌芽,但尚无“成文历史”,可说是“文明”与“野蛮”两种文化交错阶段。它离今已5000年左右。所以说中国有五千年文明历史是合乎科学的。
关于中国文字的起源,古书里载有许多传说,伏羲画卦,神农结绳而治,仓颉造字,这都可以说明我国的文字是从简单的符号图象,慢慢演进而成的。
商人用的文字已在3000字以上,可以表达当时的语言及一切的事物、思想。我国的语文因为是单音、孤立的,所以我国的文字有许多特殊的形式,是其他语言所办不到的。如句子可以很短。《三字经》是三字一句,《诗经》的句子,也以四言为多,古文超过十字一句的句子很少。因为是单音、孤立,每句可以同样的长短,讲究“双声”,“叠韵”,讲究“对称”,做对子,作诗都以此为基础。此外如“回旋诗”,“连环诗”,以至六朝的各种各式的赋。有一一种整篇上千字的文章,都是用有“水”,或有“木”的字来写的。有人称这种赋为“字典式”的文章。
我国文字与其他文字最显着的分别,是方块字,而不是拼音的。最早的文字,可以说是图象及符号。图象的基本是形状,古书称之为“象形”字,符号的基本是抽象的意义,古书称之为“指事”。二者之间,义尤为重要。
在商代的甲骨文里,许多字都是多形的。如“羊”字,可以写成四十几种样子。可见这种字的创造,最早只是要表达某一种事物,字形之大小,字画的繁简,都不甚重要,而且这许多字形,都不必要表示该字的声音。
后来又发明了四种造字法,“会意”、“形声”、“转注”、“假借”,加上早先的“象形”、“指事”共六种造字法,古人称之为“六书”。商代甲骨文可读之字共11106个,其中象形的550个,会意的100个,形声345个,指事,转注及假借的字很少。周以后的新字,多数是用形声法来创造的,汉朝字典《说文解字》所录:形声7697个,会意1167个,象形364个,指事125个。
清初《康熙字典》收47000多字,形声约占90%,我国文字离开象形、指事初创的时代,已经很远了。不过,我国文字学的研究,仍以字形最有成绩。
中国文字的两个源头
中国文字的第一个源头是甘肃秦安县大地湾一期遗址出土的距今7350至7800年前的彩绘符号。它们后来发展成西安半坡、临潼姜寨、乐都柳湾、清江吴城、宜昌杨家湾等地出土的大批刻画符号。尽管许多学者不承认它们的文字性质,说成是“随意刻画的记事符号”或“八卦数符”,但不少彝族学者反复指出它们与现存古彝文有直接的渊源关系,许多刻画符号均能用古彝文释读。
中国文字的第二个源头是山东省泰安县大汶口遗址地出土的距今5500至63110年前的彩绘与刻画的象形符号。它们虽比大地湾刻画符号晚了约2000年左右,但从字形结构来看,已具有偏旁部首之类组合形式,而在使用方法、使用场合、刻画部位、刻画对象等方面,表明它们也是一种记录丧葬祭祀巫术法器咒语的成熟文字,只是以象形为特征而已。它们之前似乎还有一个漫长的草创阶段,估计也需2000年以上时间才能完成。因此,它们的萌芽可能在距今8000年前左右。这种以象形为特征的音节文字,后来可能随原始居民的迁徙,一部分去美洲演变成玛雅象形文字,一部分溯长江而上入四川演变成巴蜀图符。而留在大汶口地区的原始居民可能融合到中原地区,其文字被河南省舞阳县贾湖遗址的先民所吸收,演变成后来的殷墟汉甲骨文,时间当在距今7500年前左右。因为贾湖遗址出土的距今7500至8500年前的三块刻符龟甲和一件有契刻符号的柄形饰,上面的“日”、“月”二字,和殷墟汉甲骨文完全一样。
贾湖遗址的龟甲刻符不仅开了中国文字史上的龟灵崇拜卜甲刻辞之先河,而且也是汉甲骨文之原胚,它简化了大汶口遗址刻画象形文字,采用了大地湾遗址刻画文字草线刻画书写方法,又保留了象形基本形式,并吸收了大地湾遗址刻画文字的表音技巧。自贾湖遗址至殷墟的甲骨文经历了漫长岁月,反复吸收西边的刻画文字,并交叉组合成十几万个汉字。
从原始文字到甲骨文
中国是-个具有悠久历史的文明古国。中国的汉字是世界上目前正在使用的各种文字中最为古老的一种。汉字由于是一种独立创造的文字,所以它是在经历了相当长时期的原始文字阶段以后,才发展成为完整的文字体系的。
在原始文字产生之前,人们已经在以图画、符号等记事表意了。这些方法可以用来为一些词造字。有些词的意义可以用抽象的图形来表示,如汉字最初以“口”来表示“方”“圆”这两个词。古汉字里袭用原始的划道道的己数方法的“一”“二”“三”这几个数字,其字形也可以认为是抽象图形。在原始文字阶段,文字和图画大概是长期混在一起使用,两者的界线并不明确。在文字刚刚开始形成的过程中,人们尝试用表意的方法创造表意字,但有许多词是难以表意的。对于难以为它们造表意字的词,人们就分别为它们规定某种记号作为文字。在文字形成过程刚开始的时候,通常是会有少量流行的记号被吸收成为文字符号的。古汉字里“×”(五)“^”(六)、“+”(七)“八”(八)这几个数字的前身,大概就是原始社会前期用来记数的记号。但要进一步新造很多记号字却是有困难的。因此,为了克服表意字和记号字的局限性所造成的困难,人们又采用了表音的方法即文字学上所说的假借方法,用某字表达另一同音但不同义的字。表意造字法和假借方法应该是同时期发展起来的。一般认为,跟图画有明确界线的表意字和假借字的出现,是文字形成过程正式开始的具体标志。假借方法的普遍应用大大提高了,文字记录语言的能力。但是假借字多起来以后,被假借的字原来有自己所代表的词,同时又被假借来记录同音或音近的词,而且假借它的词可以有好几个,这就容易引起字义混淆现象。为此,人们进一步创造出形声字,即由表音的符号和指示字义的符号一起组字,表音部分称为声旁,表意部分称为音旁。形声字起初都是在已有的文字上加注指示字义的意符或音符而产生的。就汉字的情况来看,直到它已经成熟之后,这仍是形声字产生的主要途径。形声字的应用大大提高了文字表达语言的明确性,是文字体系形成过程中一个极为重要的步骤。在形声字出现之后,原始文字大概还经过了多方面的改进,才最后发展成为能够完整记录汉语的文字体系。
据目前推测,汉字形成过程大约开始于公元前3000年的中期,到夏商之际即公元前17世纪前后,形成了完整的文字体系。中国已发现的古代文字中时代最早、体系较为完整的文字是商代后期商王室用于占卜而刻写在龟甲和兽骨上的文字,称为甲骨文。在已发现的甲骨文里,最重要的是殷墟甲骨文。它发现于商代后期王都的遗址——殷墟(河南安阳小屯村)。此外,在山西、陕西一带也发现有字甲骨,是周代的遗物。因此甲骨文应当是商周时代的文字。迄今为止,总计共出上甲骨15万片以上,分别收藏于中国大陆、香港特别行政区和台湾省以及澳门地区,还有日本、美国、英国、加拿大、法国、俄罗斯、德国、瑞士、比利时、荷兰、瑞典、韩国等国家。甲骨文在很大程度上沿用图画的写实手法,不少字保留了图画文字的特点、象形的程度较高,由于处于文字使用的早期阶段,甲骨文的形体结构没有定型化。有些字有几种不同的写法,有的偏旁不固定,可以变换;书写款式没有一定规范,可以正写、反写,还可以倒写、斜写;字的大小不一,随形体的繁简而变化还有把两三个字写在一起的合文。不过总的说来,甲骨文已是比较成熟的文字,它以象形、假借、形声为主要造字方法。今天的汉字,仍是以象形字为基础的形符文字,因此甲骨文已具备后代汉字结构的基本形式。
从语法上看,甲骨文中有名词、代名词、动词、形容词等,其句子形式、结构序位也与后代语法基本一致。由于商王几乎每事必卜,所以殷墟甲骨文内容涉及商代社会的各个领域。对甲骨文的研究自20世纪以来一直是文字学家、历史学家的重要课题。
甲骨文发掘与整理
甲骨文,又叫“卜辞”、“契文”、“龟版文”、“贞文”、“龟刻文”、“殷墟文字”、“龟甲文字”、“殷墟书契”等,是商周时代刻在龟甲、兽骨上的文字,多为占卜吉凶的卜辞和占卜的记事。
河南省安阳市西北五里的小屯村,是历时273年的殷都。周灭殷后,此都湮灭,后人将此处称为殷墟。清光绪年初,小屯村的剃头匠李成,染了一身疖疮,没钱医治。一天,他试着将那些扔在河边的甲骨拣来碾成碎粉敷在脓疮上,脓水被吸干了,后来他用石子在手上划个口子,再把骨粉敷上,又止住了血。村里那些读书人说它是“龙骨”。李成把它拿到中药铺出卖,药铺以一斤六文钱的价格收进。
第一个揭开中国甲骨文之谜的人是王懿荣。1899年,任国子监祭酒的王懿荣患了疟疾。他精通医道,药都要经他过目后才送去煎。有一天,在一味涩精补肾的“龙骨”上发现有刀痕,是一种似字非字的刻划符号,这符号与他研究的铜器铭文有些相似。精于金石之学的王懿荣断定此物不同凡响,经反复揣摩研究,认定其为殷商时代的一种文字。他立即将中药铺里刻有文字的“龙骨”全买下,初得千片。
不久,他死后,甲骨文为丹徒刘铁云所得。刘又托人奔走购买,所集很多。上虞箩振玉在刘处看到甲骨文字,惊为奇货。1903年(光绪二十九年),刘铁云择龟甲中字迹完好者千余片拓印为书,名《铁云藏龟》,凡六册,这便是我国甲骨文字印行之始。
不久,朴学大师瑞安孙诒让得识,在1904年写成《契文选例》二卷,这便是我国学者用甲骨文考证古文字之始。
到1906年罗振玉继而开始搜购甲骨,并派人专至安阳采掘,共得甲骨3万余片,为历来收藏家所不及。他先后编印《殷墟书契》八卷、《殷墟书契菁华》一卷、《殷墟书契后编》二卷、《殷虚书契续编》六卷。给历史学家提供了丰富的资料,对学术界的贡献极大。
但是由国家正式有组织、有计划,用科学的方法进行发掘,还是从1928年开始的。从1928年到1934年,前中央研究院陆续进行了9次发掘,共发掘龟甲、兽骨6513片,择出3866片,编为《殷墟文字甲编》。后1934年到1937年又组织了6次发掘,共发掘龟、骨18405片,编为《殷墟文字乙编》,从此我国研究甲骨文字的材料更加丰富而完整。1938年至1947年抗战期间,日本人曾组织所谓调查团到安阳发掘,出土不少文物运往日本。抗战以后所出土的有字甲骨,相当一部分流散国外。1949年至1973年殷墟共出土有字甲骨5000多片,另外,1955年,由中国科学院考古研究所编成《殷墟文字缀合》,将断碎了的甲骨联结起来,从而补充了许多资料。
近年又发现了周代的甲骨文,字体细小到须用放大镜才能看清。1985年夏,陕西省考古研究所镐京考古队在西安市西南20多公里的长安县斗门镇花园村一带,发掘西周名都镐京的大型宫室建筑遗址时,意外地发现了一处“龙山文化”时期的原始社会部落聚居遗址,并发现了一批刻有文字的甲骨,考古学界和古文字学界认为它是我国迄今所见最早的甲骨文。其历史至少应上溯到4500至5000年之前的黄帝时代。
据甲骨学专家胡厚宣统计,迄今共计出土甲骨154000多片,其中大陆收藏97600多片,台湾省收藏30200多片,香港收藏89片,总计我国共收藏127900多片。日本、加拿大、英、美等12个国家共收藏26700多片。
如今,甲骨学已成为一门蔚为壮观的世界性学科,中外研究的学者有500多人,发表的论文、专着达2000多种。其中中国科学院历史研究所所编《甲骨文合集》13册,共收甲骨50000片,可算集甲骨文之大成。
历史上在甲骨学研究中贡献最大的有4个人,即罗振玉(号雪堂)、王国维(号观堂)、董作宾(号彦堂)、郭沫若(号鼎堂)。因为他们的号中都有一个“堂”字,所以合称“甲骨四堂”。着名古文字学家唐兰说:“辞研究,自雪堂导夫先路,观堂继以考史,彦堂区其时代,鼎堂发其辞例,固已极一时之盛。”
关于汉字
着名语言文字学家安子介在他的《解开汉字之谜》一书里,提出汉字是继指南针、火药、造纸、印刷术之后的中国第五大发明的论断,并且预言:
“21世纪是汉字发挥威力的时代。”
1.1899年在河南安阳小屯村,即殷王朝首都的遗址殷墟,发现了甲骨文,距今已有3200年左右,它是我国保存最早的汉字。
2.汉字一共有多少?
在当代,《中华大字典》收录汉字48000多个;《汉语大字典》收录汉字60000多个。
3.汉字虽多,但常用字并不多。北京七四八工程标准汉字组检阅现代文章7075篇,计2162万多字。其中共发现汉字6300个,这2162万多字,有99%是用这2400字写成的,而剩余的3900字,出现率仅为1%。因此专家们认为,掌握了这2400个常用汉字,阅读、写作便不会有多大问题了。
4.为了进一步理解上述观点,再让我们看下列统计数据:2000多年前的《韩非子》,用字2680个;号称封建社会百科全书的《红楼梦》全书共731017个字,使用不同汉字4462个;《毛泽东选集》一至四卷共用字3002个。
5.据专家统计分析,有42个汉字使用的频率最高,它们竟占到一般报刊用字的25%。这42个汉字是:的、一、是、在、了、不、和、有、大、这、主、中、人、上、为、们、地、个、用、工、时、要、动、国、产、以、我、到、他、会、作、来、分、生、对、于、学、下、级、就、义、年。
6.再细分一下,在这42个汉字中,排行在首的“的”字,出现频率最高,一般文章的25个字中便会出现一次,竟全部汉字用字率的4%。