研究表明:汉字作为一个复杂的文字符号系统,其信息熵很高。研究的基本方法是:逐渐扩大汉字容量,随着汉字容量增大,信息熵的增加趋缓;汉字增加到12370以后,不再使信息熵有明显的增加。我国科学家指出:汉字的容量极限是12366个汉字,汉字静态平均信息熵的值(平均信息量)是9.65比特。通过数理语言学中著名的齐普夫定律(ZIPF’SLAW)核算,这是当今世界上信息量最大的文字符号系统。联合国五种工作语言文字的信息熵的比较如下:
法文:3.98比特
西班牙文:4.01比特
英文:4.03比特
俄文:4.35比特
中文:9.65比特
可以看出,拼音文字的信息熵小,差别不大。汉字的信息量最大。
汉字对拼音文字的这种信息熵优势是什么概念?简单的比喻就是十进制数与二进制数的差别。十进制数字系统需要人记忆0?9,10个符号,二进制只需要记忆0和1两个符号。十进制乘除要记忆9X9表,二进制只需要学会与、或、非的简单逻辑。
下面举个最简单的例子来显示英文的笨拙:本人曾问系里的几个教授“长方体”如何用英文讲,可这几位母语是英文的工科教授竟说不知道,接下来连问几个本地的研究生,结果他们也不知道。着实令我大吃一惊!现在我要问读者:您知道么?反正不是Cube,Rectangular...。后来,我倒是真的在字典里找到了该词,可现在又忘了,原因是它太生辟。感叹,英文真是笨人的语言,试图给天下每一事物起一个名字。宇宙无穷,英文词汇无穷!词汇如“光幻觉”、“四环素”、“变阻器”、“碳酸钙”、“高血压”、“肾结石”、“七边形”、“五面体”都只有专业人士才会。根本不可能象汉语那样触类旁通,不信?去亲自问问母语是英文的人好了。英文是发散的。搞的一些基本概念如“长方体”也只有专家才会讲!怪不得英文世界里专家那么多,而且都那么自信;是啊,一般人连他们的基本术语如“酒精绵球”“血压计”都不会讲。生活在英文世界真是对无知无奈!可悲可怜!
国家汉字的扫盲标准是1500个字,理工科的大学生一般掌握2000个汉字。就凭这2000个字,大家可以读书、看报、搞科研。可在英文世界里,没有20000个字别想读报,没有30000个字别想把周刊读顺,大学毕业10年后的职业人士一般都懂80000字。新事物的涌现,总伴随者英文新词,例如火箭ROCKET),计算机(COMPUTER)等,可汉语则无须,不就是用“火”驱动的“箭”么,会“计算”的“机”么!可英文就不能这么干,不能靠组词,原因是“太长”了。如火箭将成为“FIRE-RIVEN-ARROW”,计算机将成为“COMPUTAIONAL-MACHINE”等。人的视角有限,太长的字会降低文章的可读性与读者的理解能力。
目前,英文词汇已突破40万,预计本世纪中叶,将突破100万大关。而汉语则相对稳定,现在中学生还可以琅琅上口地读屈原的楚词。英文就难了,太不稳定。现在的人们读沙士比亚的原著已困难重重,更不用说读400年前英国诗人乔叟的诗了。学GRE的时候,注意到很多韦氏字典收录的词汇竟是本世纪件初的新词,如“Gargantuan”取自拉伯雷的小说。这也不奇怪,毕竟英文400年前才统一了拼写。在英文世界里能读文学名著是一件了不起的事,不是所有受过大学教育的人都能干的。如阅读中用英文描述的非州的一些植物真是艰涩无比,一般英美人也只能囫囵吞枣而已;可在中文世界里,又有谁会对仅有中学学历的人读完四大名著而感到惊奇?

没有评论:
发表评论