词语
语素是汉文表意的最小单位,类比于英语的“词汇”和“词组”的总称。绝大多数汉字可以独立构成语素,比如“我”,类比于英语中的单一字母构成的词汇,比如“I”。现在白话文大多数词语都是由两个以上的汉字构成的,不过,和英语中“词汇”和“字母”的关系不同,语素的意思往往和其中各个汉字独立构成语素时的意思有相关性,因此相当程度上简化了记忆。词语包括语素和若干个语素形成的短语。
汉字的高效率,体现在几百个基本象形字,可以合成表示天上地下的各种事物的上万汉字;几千个常用字,又可以轻松组合出数十万词语。
偏旁
偏旁又叫部首,人们习惯合称偏旁部首。在汉字的结构中,偏旁是比笔画大的构字部件,是构成汉字的基本单位。如“坡”中的“皮”是表示读音的偏旁,“土”是表意的偏旁。
辞典
中国古代称“ 字书”,
汉字直到《康熙字典》问世才称“字典”。最早的汉语字 典是东汉许慎编的《 说文解字》[2]。近代大致可分为两类,一类是综合性的,如《新华字典》;一类是专门性的,如《异体字字典》。1915年, 中华书局出版了《中华大字典》。
世界三大汉语词典分别是中国大陆的《汉语大词典》(共13册,5.6万词条,37万单词)、中国台湾的《中文大辞典》(共10册,5万词条,40万单词)以及日本的《大汉和辞典》(共13册,4.9万词条,40万单词)。汉字是记录汉语的文字,它已有六千年左右的历史,是世界上最古老的文字之一。
“最中国”汉字“和”:2008年北京奥运会开幕式上,几百名演员扮演的活字印刷字模通过不断变幻,用大篆、小篆、楷书三种不同字体展现了同一个汉字――“和”。这一幕至今让人津津乐道,而这个包含“和谐”“和平”“和睦”等意义的汉字,再度被评选为“最中国”的汉字。最新一期的《中华遗产》杂志发布了该社组织的“100个最具中华文化意义的汉字”评选结果。“和”字赢得了网上投票的最高票数,也获得了中国台湾“中央研究院”历史语言研究所研究员 李贞德等专家的大力推荐。[4]
汉字字数
汉字的数量并没有准确数字,大约将近十万个(北京国安咨讯设备公司汉字字库收入有出处汉字91251个),日常所使用的汉字只有几千字。据统计,1000个常用字能覆盖约92%的书面资料,2000字可覆盖98%以上,3000字则已到99%,简体与繁体的统计结果相差不大。
关于汉字的数量,根据古代的字书和词书的记载,可以看出其发展情况。
秦代的《仓颉》、《博学》、《爰历》三篇共有3300字;汉代扬雄作《训纂篇》有5340字,到 许慎作《说文解字》[2]就有9353字了;据唐代封演《闻见记·文字篇》所记,晋吕忱作《字林》有12824字, 后魏杨承庆作《字统》有13734字,南朝时顾野王所撰的《玉篇》据记载共收16917字,在此基础上修订的《大广益会玉篇》则据说有22726字;唐代孙强增字本《玉篇》有22561字。宋代司马光修《类篇》多至31319字,宋朝官修的《集韵》中收字53525个,曾经是收字最多的一部书;清代《 康熙字典》有47000多字了;1915年欧阳博存等编著的《 中华大字典》有48000多字;1959年日本诸桥辙次主编的《 大汉和辞典》有49964字;1971年张其昀主编的《 中文大辞典》有49888字;1990年徐仲舒主编的《汉语大字典》有54678字;1994年冷玉龙等编著的《中华字海》有85000字。中国台湾地区教育主管机关编撰的《 异体字字典》第五版,内容含正字与异体字,共106230字,是收录最多汉字的字典。
历史上出现过的汉字总数有8万多(也有6万多的说法),其中多数为 异体字和 罕用字。绝大多数异体字和罕用字已被规范掉,除古文之外一般只在人名、地名中偶尔出现。此外,继第一批简化字后,还有一批“ 二简字”,已被废除,但仍有少数字在社会上流行。
如果学习和使用汉字真的需要掌握七八万个汉字的音形义的话,那汉字将是世界上没人能够也没人愿意学习和使用的文字了。但是《中华字海》一类字书里收录的汉字绝大部分是“死字”,也就是历史上存在过而今天的书面语里已经废置不用的字。据统计,十三经(《易经》、《尚书》、《公羊传》、《论语》、《孟子》等13部典籍)全部字数为589283个字,其中不相同的单字字数为6544个字。因此,实际上人们在日常使用的汉字不过六千多而已。