汉字,是用于书写汉语的文字,也借用于书写日语、朝鲜语(韩语)等语言。汉字文化圈广泛使用的一种文字,也是世界上唯一仍被广泛使用的高度发展的语素文字。

汉字又称中文字、中国字、国字,属于表意文字的词素音节文字,广义的汉字指从甲骨文、大篆、金文、籀文、小篆,至隶书、草书、楷书(以及派生的行书)等的文字,狭义指以正楷作为标准写法的汉字,也是今日普遍使用的现代汉字。

汉字是世界上迄今为止连续使用时间最长的主要文字,由汉族发明并改进,目前确切历史可以追溯到商朝的甲骨文。早在古代汉字已发展至高度完备的水准,不单中国使用,在很长时期内还充当东亚地区唯一的国际交流文字,20世纪前都是日本、朝鲜半岛、越南、琉球等国家官方的书面规范文字。

汉字的演变过程是:史前符号,商朝的甲骨文,周代的金文、大篆,秦朝的小篆、籀文,汉代的隶书,唐代的楷书,草书,行书。隶变是汉字发展史上的一个里程碑,汉字发展至汉朝隶书时被取名为“汉字”。

2001年1月《中华人民共和国国家通用语言文字法》实施,明确规定中国推行规范汉字,同时也明确保留或使用繁体字的范围。2013年6月5日中国国务院公布《通用规范汉字表》,含附表《规范字与繁体字、异体字对照表》,一般应用领域的汉字使用以规范字表为准。目前主要使用繁体字的地区有中国的台湾地区、香港特别行政区和澳门特别行政区。

简介

汉字是意音文字,不是拼音文字。是用表意体系的符号来表示汉语的词或语素的。

一个汉字通常表示汉语里的一个词或一个语素,这就形成了音、形、义统一的特点。汉字是由笔画构成的方块状字,所以又叫方块字。如“车”“上”“明”等,“车”“上”“明”用字的形体来直接表达语言里的词义;“问”既能表意又能表音,“门”表音,“口”表意。

汉字经过了几千年的演变,逐渐形成了“汉字七体”,即:甲骨文、金文、篆书、隶书、草书、楷书、行书。

历史

商周时期,通用的文字是甲骨文。这是一种成熟而系统的文字,为后世的汉字发展奠定了基础。之后流行的青铜铭文(金文)虽有字数的增加,但形体并无大的变化。

春秋以后,由于诸侯割据,“文字异形”。秦统一后,为巩固统治,始皇帝令丞相李斯、中车府令赵高、太史令胡毋敬等整理文字,以原秦国字为基础制定出小篆,作为标准字体,通令全国使用。稍后,程遍又依当时民间流行的字体,整理出更简便的字体隶书,并作为日用文字在全国广为流传。

曹魏时,钟繇创立真书(楷书)。至此汉字的演化已臻完善。不仅如此,自东汉末年,汉字的书写已成一种专门的艺术即书法。

中国史学界较普遍的一种说法是:中国文字源始于殷商。实际上,殷商时代的甲骨文已很成熟,在此之前,应该有一个从发生、发展到渐趋成熟的过程,因此有人主张推至夏末;也有人主张推至夏以前,各执己见。郭沫若在《古代文字之辩证的发展》指出:“汉字究竟源始于何时呢?我认为,这可以从西安半坡村遗址距今的年代为指标。”,“半坡遗址年代距今有六千年左右。”,“半坡遗址是新石器时代仰韶文化的典型”,“半坡彩陶上每每有一些类似文字的简单刻划,和器上的花纹判然不同。”“虽然刻划的意义至今尚未阐明,但无疑是具有文字性质的符号。”“可以肯定地说就是中国文字的起源,或者中国原始文字的孑(jié)遗。”如按此说,中国文明则应算成近六千年。中国文字之源始,究竟在何时?最古老的文字产生于什么时代?分别代表什么含义?至今还尚在百家争鸣中,看来还有待于大量的材料来佐证说明。

数量

汉字的数量并没有准确数字,大约将近十万个(北京国安咨讯设备公司汉字字库收入有出处汉字91251个),日常所使用的汉字只有几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字时已到99%,简体与繁体的统计结果相差不大。

关于汉字的数量,根据古代的字书和词书的记载,可以看出其发展情况。

秦代的《仓颉》、《博学》、《爰历》三篇共有3300字;汉代扬雄作《训纂篇》有5340字,到许慎作《说文解字》[1] 就有9353字了;据唐代封演《闻见记·文字篇》所记,晋吕忱作《字林》有12824字,后魏杨承庆作《字统》有13734字,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字;唐代孙强增字本《玉篇》有22561字。宋代司马光修《类篇》多至31319字,宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书;清代《康熙字典》有47000多字了;915年欧阳博存等编著的《中华大字典》有48000多字;1959年日本诸桥辙次主编的《大汉和辞典》有49964字;1971年张其昀主编的《中文大辞典》有49888字;1990年徐仲舒主编的《汉语大字典》有54678字;1994年冷玉龙等编著的《中华字海》有85000字。台湾地区教育主管机关编撰的《异体字字典》第五版,内容含正字与异体字,共106230字,是收录最多汉字的字典。

历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为异体字和罕用字。绝大多数异体字和罕用字已被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“二简字”,已被废除,但仍有少数字在社会上流行。

如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。但是《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而今天的书面语里已经废置不用的字。据统计,十三经(《易经》、《尚书》、《公羊传》、《论语》、《孟子》等13部典籍)全部字数为589283个字,其中不相同的单字字数为6544个字。因此,实际上人们在日常使用的汉字不过六千多而已。

在汉字计算机编码标准中,最大的汉字编码是台湾地区的CNS11643,5.0版全字库可供查询的字共87,047个汉字、10771个拼音文字及894个符号。台港民间通用的大五码收录繁体汉字13053个。GB18030是中华人民共和国现时最新的内码字集,GBK收录汉字简体、繁体及20912个,而早期的GB2312收录简体汉字6763个。Unicode的中日朝(韩)统一表意文字基本字集则收录汉字20902个,总数亦高达七万多字。

初期的汉字系统字数不足,很多事物以通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。汉字数量的过度增加又引发了汉字学习的困难,单一汉字能表示的意义有限,于是有许多单一的汉语意义是用汉语词语表示,例如常见的双字词。汉语书写的发展多朝向造新词而非造新字。殷墟的甲骨文更早、与汉字起源有关的出土资料。这些资料主要是指原始社会晚期及有史社会早期出现在陶器上面的刻画或彩绘符号,另外还包括少量的刻写在甲骨、玉器、石器等上面的符号。可以说,它们共同为解释汉字的起源提供了新的依据。

字形

汉字由表意象形字根,如金、木、水、火、土等,像积木一样组合而成。因形状方正,有“方块字”的别称,从结构上来看,汉字有以下特色;

规整的字体(如楷书、宋体、隶书、篆书等)书写下的汉字是一种方块字,每个字占据同样的空间。汉字包括独体字和合体字,独体字不能分割,如“文”、“中”等;合体字由基础部件组合构成,占了汉字的90%以上。合体字的常见组合方式有:上下结构,如“笑”、“尖”;左右结构,如“词”、“科”;半包围结构,如“同”、“趋”;全包围结构,如“团”、“回”;上中下结构,如“赢”;左中右结构,如“斑”;“品”字形结构,如“品”。汉字的基础部件包括独体字、偏旁部首和其他不成字部件。

汉字的最小构成单位是笔画,笔画也具有一定的含义,如横画(一),可表示地平线(如旦字中的一横)等。

书写汉字时,笔画的走向和出现的先后次序,即“笔顺”,是比较固定的。基本规则是,先横后竖,先撇后捺,从上到下,从左到右,先外后内,先外后内再封口,先中间后两边。不同书写体汉字的笔顺可能有所差异。

“biang” 从字体上分,可将各类汉字的字体分为三大类型。第一类是从宋代活字印刷发展起来的宋体、黑体(包括粗、细等线体)等;第二类是由书法演变而来的字体,如楷体、仿宋体、行楷、隶体、魏体、舒体、颜体、瘦金体以及钢笔书写的字体等;第三类是属于美术字体,如综艺、美黑、琥珀、水柱等。其他字体多是属于以上三类字体的变异,例如:由宋体演变的大标宋、小标宋、报宋、长宋、中宋、姚体等;由黑体演变而成的大黑、平黑、粗黑、等线体(包括粗、中、细等线体,后又演变出粗、准、细圆体)等;由楷体、仿宋体等演变而来的中楷和细仿宋等;由黑体和宋体演变而来的美黑;由隶体演变而来的隶变体等。

笔画最少的汉字只有一划。有的字在书面上没有,只在民间流传 “biang”是笔画较多的汉字,有56笔,异体字共有45笔,繁体字共有59笔。“biangbiang面”是源于陕西的一种面,也是一家面馆的品牌,还在使用这个字,流传不广,近几年方才流行,声称只能在康熙字典中查到“biang”字写法。事实上,在康熙字典中查不到“biang”字的写法。

关于biang,有一个字谜:

一点飞上天,黄河两道弯,八字大张口,言字往里走 。

东一扭,西一扭。左一长,右一长,中间坐了个马大王。

心字底,月字旁,打个勾勾挂麻糖,

推个车车逛咸阳。

笔划最多的汉字 日文汉字有一个字有84画之多,日语读作“たいと”(Tai-To)。

注音

汉字是汉语的书写文字,每个字代表一个音节。中国大陆现今以普通话作为标准读音,普通话的音节由一个声母、一个韵母及声调确定,实际用到1300多个音节。由于汉字数目庞大,因而有明显的同音字现象;同时还有同一字多音的情形,称为多音字。这一情况在汉语各种方言中是普遍存在的。

汉字虽然以表意为主,但并非没有表音成分,最常见的是人名、地名,其次就是外来词的音译,比如沙发。此外,还有部分原有的表音词,如一命“呜呼”、“哈哈”大笑等。但即使如此,还是有一定表意成分,特别是该国国内的人名、地名。而即使是国外的人名、地名,也存在某些表意的底线,比如“Bush”绝不能音译成“不死”。

有学者经研究认为:汉朝之前,一个汉字发音为两个音节,次要音节和主要音节。由于汉字本身不表音,自汉朝到20世纪汉字在数量上、写法上虽有变迁,但无法看出发音的变化。必须进行专门的研究才能推测它们在上古汉语和中古汉语的发音。汉字在日语中的读音有“音读”和“训读”之分,往往一个字有很多读法,原因来自中国不同时期传入日本的发音。

除了日本以外,其他汉字使用地区也有使用了一些多音节的字,如“浬”(海里)、“嗧”(加仑)、“瓩”(千瓦)等。但是在大陆地区由于官方废除已基本不使用,台湾仍在使用,一般人也明了其意思。

最早的注音方法是读若法和直注法。读若法就是用音近的字来注音,许慎的《说文解字》[1] 就采用这种注音方法,如“埻,射臬也,读若准”。直注法就是用另一个汉字来表明这个汉字的读音,如“女为说己者容”中,使用“说者曰悦”来进行注音。

以上两种方法都有先天上不完善的地方,有些字没有同音字或是同音字过于冷僻,这就难以起到注音的作用,例如“袜音韈”等。

魏晋时期发展出了反切法,据传是受使用拼音文字的梵文影响。汉字的发音可以通过反切法进行标注,即用第一个字的声母和第二个字的韵母和声调合拼来注音,使得所有汉字发音都有可能组合出来。如“练,朗甸切”,即“练”的发音是“朗”的声母与“甸”的韵母及声调所拼成。

近代以来,又发展出了汉字形式的注音符号以及很多拉丁字母注音方法。注音符号仍是台湾地区教学的一部分,而目前中国大陆最为广泛使用的是汉语拼音。

由于汉字以本身表义为主,注音方面较为薄弱。这个特性使得上下千年的文献,不至于产生如同使用拼音文字的西方一样,用字措辞太悬殊的差距,但也造成推断古代声韵的难度。例如“庞”从“龙”而得声,但今日北京话前者读“páng”,后者为“lóng”。如何解释这样的差异,就是音韵学所探讨的课题。需要注意的还有声调:阴平,阳平,上声,去声,轻声(元音āáǎàa ōóǒòo ēéěèe īíǐìi ūúǔùu ǖǘǚǜü)