在汉字计算机编码标准中,最大的 汉字编码是中国台湾地区的CNS11643,5.0版全字库可供查询的字共87,047个汉字、10771个拼音文字及894个符号。台港民间通用的 大五码收录繁体汉字13053个。GB18030是中华人民共和国现时最新的内码字集,GBK收录汉字简体、繁体及20912个,而早期的GB2312收录简体汉字6763个。Unicode的中日朝(韩)统一表意文字基本字集则收录汉字20902个,总数亦高达七万多字。
初期的汉字系统字数不足,很多事物以 通假字表示,使文字的表述存在较大歧义。为完善表述的明确性,汉字经历了逐步复杂、字数大量增加的阶段。汉字数量的过度增加又引发了汉字学习的困难,单一汉字能表示的意义有限,于是有许多单一的汉语意义是用汉语词语表示,例如常见的双字词。汉语书写的发展多朝向造新词而非造新字。 殷墟的甲骨文更早、与汉字起源有关的出土资料。这些资料主要是指原始社会晚期及有史社会早期出现在陶器上面的刻画或彩绘符号,另外还包括少量的刻写在甲骨、玉器、石器等上面的符号。可以说,它们共同为解释汉字的起源提供了新的依据。
汉字民俗
射虎:即猜灯谜,也叫 打灯虎,与汉字有着密切关系。旧时的射虎大致可以分成两类,一类是文人射虎,谜面深奥,谜格复杂多样,谜底多为 四书五经中的原句;一类是市井灯谜,谜面谜底均较通俗。射虎是 元宵节的一项重要活动。
汉字结构
汉字是“形、音、义”的结合体,大多数汉字是由形旁和声旁组成的。
六书是汉字构字的基本原理。在《周礼》中就提到了六书,只是没有说明具体内容。到了东汉,许慎在《说文解字》[2]中,详细阐述了“六书”构造原理:象形、指事、会意、形声、转注、假借。
象形:这种造字法是依照物体的外貌特征来描绘出来,所谓“画成其物,随体诘诎”是也。如日、月、山、水等四个字,最早就是描绘日、月、山、水之图案,后来逐渐演化变成如今的造型。
瓜是一个象形字。“瓜”字中,两撇表示藤,中间竖钩表示瓜,捺表示叶。“葫芦科植物的统称”就是“瓜”的本义。“形状像瓜”,在现实生活中有很多东西像瓜形的,比如,“瓜皮帽”是帽子的一种;“瓜皮船”是船的一种。“像切瓜一样”,瓜的命运是要被切分的,由此引申出此义。人们用“瓜分”表示分割或分配。又指若干强国联合起来分割弱小或不发达国家的土地。“傻瓜”,表示不聪明,这一词来自古代的“瓜子族”,春秋时期生活在 瓜州(甘肃敦煌一带)姜姓人被称为“瓜子族”,他们十分勤劳,受人雇佣时总是一刻不停地干活,可是有些人把他们这种老实的习俗看作“傻”,于是就有了“傻瓜”了。
指事:这是指表现抽象事情的方法,用象征的符号,或在象形字上加上符号来表示某个词。所谓“各指其事以为之”是也。如人在其上写作“上”,人在其下写作“下”,“刃”,在刀口上加一点,表示这里最锋利,这就是刀刃,等等。自大一点就是“臭”,“富”有田的人,“穷”靠用“力”打工,“贱”的繁体是“贱”,右边两个“戈”,为钱而争斗,自然是“贱”。
形声:就是文字内以特定形状(字根)表特有的音。例如胡。这个字也可为一个字根,结合不同的属性字根,可合成为:蝴、蝴、湖、葫、瑚、醐等等,而以同样的发音(也有的只有声母一样),表达不同的事物。形声是汉字里造字最多的方法和神韵。
形声字的形旁和声旁有四种组合方式:
左形右声:情、忆、哼、犷、构、描……
右形左声:期、战、鹦、鸠、领、飘……
上形下声:宇、笆、雾、草、景、符……
下形上声:盂、货、娶、基、裘、盒……
内形外声:闻、问、闷、瓣、辫、辩……
外形内声:园、囤、病、衷、阁、匣……
形占一角:疆、腾、栽、裁、载……
有些形声字,随着汉字的改革表音部分的读音有了变化,已经不起表音的作用了,如果再读半边就要闹笑话。“秀才识字读半边”又成了对“秀才”们读错字的讽刺。
会意:这种造字法,是用两个或几个字组成一个字,把这几个字的意义合成一个意义。如“日”和“月”组起来,就是日光加月光变成“明”。“人”字和“言”字合成“信”字,意思就是人过去所言有信,就是这个人很遵守自己说过的话,“休”,“人”和“木”合在一起,一个人靠在树上,表示休息。