|
张时钊 发表于 2009-2-4 16:23
少争辩,多研究,发展中文
关于中西文孰劣孰优、要不要用拼音新文字代替汉字的争论,已经很长久了,所有的方方面面大致都涉着了。就是那几种观点,不能统一,还是公说公有理,婆说婆有理。其中有的本身就无可比性,有些没有准确数据,再加上视角不一,谁也说不了谁。认为汉字是中国第五大发明的,要让这国宝发扬光大;认为汉字落后,已使中国挨了打的,要搞拼音化,担心在高科技时代会阻碍中国的发展。争论的双方都是为了中国的将来。但目前看来,中英文各有千秋。没有新意的争论,再重复下去只会空耗精力,无利于我们国家。我觉得大家都应冷静下来,弄明白对方观点的来龙去脉,对症施"辩",并尽量吸收对方合理的意见。更重要的,是研究文字发展的内在规律,商讨当前可实施的步骤,发展我们的语言文字。
一、汉字落后论的根源
汉字落后论,当然是在国门已被打开,与英文比较之后才产生的。在能够闭关自守时,自唐至明,邻国还来朝贺,自然不感落后。从1840年以后,清朝屡战屡败,被逼签订不平等条约,才承认落后,但也只认为在机械科学上落后,不如人家船坚炮利,只要向他们学这点小聪明就可以了,决不认为我们的祖宗根基比人家差。不识字的,不懂洋文的,不会比较;能学洋文的,一定已经经过十年寒窗,首先学会了汉字,怎么反说中文不如英文呢?但是,历史上要摒弃汉字,要求拉丁化的,正是知识分子中的精英。最早在1892年,卢戆章等发起"切音字"运动,是给汉字注音。继之,康有为、梁启超、谭嗣同等已在提倡拼音文字。到1918年钱玄同发表《中国今后之文字问题》,说"欲使中国不亡……必以废 孔学、灭 道教为根本……废 记载孔门学说及道教妖言之汉文,尤为 根本解决之根本解决"。正当砸孔家店时期,几乎没有一个不守旧的知识分子不支持所谓的"汉字革命"。瞿秋白认为汉字是封建统治阶级的。1931年吴玉章、萧三、林伯渠等召开"中国新文字第一次代表大全"。鲁迅说"方块汉字真是愚民政策的利器""汉字不灭,中国必亡"。1940年,延安就成立新文字协会。解放后,毛泽东1951年指示:"文字必须改革,要走世界文字共同的拼音方向"。1954年成立文字改革委员会。及到1985年,文改会改组为语言文字工作委员会为止,汉字革命已搞了一个世纪。其后至今20年,虽无公开的领导和提倡者,但仍有大量的个体设计者,不断设计出各种不同的新文字,其热闹情况,不亚于输入法的"万码奔腾"。
国人觉醒,认识到落后是好事。但是,为什么知识分子却要怪罪于汉字?而当时强大到能欺侮我们的小日本,也在用我们的汉字呀!智力高的精英们,怎么会作出违反常理的结论?
我认为主要是由于英文机械打字机的出现,让这些知识分子惊呆了。我们发明了活字印刷术,一传到西方,使拼音文字如虎添翼。因为西文只要几十个字模,在此基础上,很容易地发明了打字机。打字机使外国人早早"换笔",写作也机械化了。但汉字有成千上万,不可能造出同样方便的中文打字机,我们的文人只能辛辛苦苦地"爬格子"。
查史料,第一台实用打字机的设计者是一位美国人克里斯多弗·拉撒姆·肖尔斯,他在19世纪60年代制作了一架木制的打字机模型。1873年开始投产,3年内就销售了数千台。办事员开始被秘书所取代,大量定货单、发货清单、商务函件和报表再也不要手写了。中国知识分子心急如焚,连林语堂都醉心于制造中文打字机。50年后,1912年,上海商务印书馆的周厚坤发明一台铅板打字机,但使用很不方便,不能批量投产。后由舒震东继续改进,于1919年试制成舒式打字机,由商务印书馆的中国实业机器厂制造。再过10年,至1929年,上海俞斌琪仿造国外H型打字机获得成功,并开设打字机制造厂进行生产。但中文打字机至少要数千的字模,非常笨重,个人"爬格子"还是不能机械化,其他通讯、印刷上也远赶不上西文,"汉字落后"这一寃案仍没有翻案的可能。这使我们整整失去了近百年的机械打字机时代。
1946年第一台电子计算机诞生。开始十数年主要用于数值计算,输入输出都是通过打字机,输入的程序和输出的表格中,都是数字为主,文字很少,汉字可用字母代表。70年代出现微机,80年代初拥入国门后,已开始转为文字处理为主了。当时输出的汉字字形虽然难看,因为有了阴极射线管作显示屏和针式打印机,总算还可以应付。但繁多的汉字难以输入,这一拦路虎被形象地称作"输入瓶颈"。这瓶颈如果没法解决,在信息社会时代,中文和中文文化竟与计算机无缘,真要把中国抛到原始社会去了。汉字真的碰到灭顶之灾,当时看来必须立即改革为拼音文字。
二、汉字的巨大惯性
但是,世界上人数最多的民族,使用最久的汉字,真的能被拼音文字取代吗?为什么一百年来的新文字运动都没有成功呢?
原来文字是有慣性的。汉字使用者众多,历史又特长,惯性冲力更加大。惯性的意思不是不变化。这两个字,我借自物理学。物理学上的慣性也只是说,物体保持速度和运动方向的不变而已,不是说没有运动。从已知的历史来看,从三千五百年前的甲骨文开始,已经经过了大篆、小篆、隶书、楷书、行草、狂草、魏碑、宋体等等演变。然而纵有千变万化,总是一往直前。虽然形声字增多了,但绝没有也不可能有向拼音化发展的迹象。因为这是两个完全相反的方向。汉字使用者众,犹如物体的质量大;历史长,文化积累深厚,犹如运动物体的冲量大。要将具有巨大冲量的物体作180度的大转弯,没有这么大的能量。
不是几个人或小集团内部,也不是把个别几个汉字改用新的符号,而是要13亿人废除所有方块字,改用结构全异的新文字,这实在不可思议。要进行这种意义的文字改革,上世纪七、八十年代之交可能是唯一的一个好时机。那时如果有设计得很好的新文字,中央一声令下,为了使国家不被排除在信息社会之外,大部分人不可能反对,但也不一定乐于用它。即使是强制推行,也一定会有一大部分人到死都学不会。所以我们只能指望从下一代开始,可能还不是一两代就能完成这个"换字"工程的。推广普通话比推广新文字要容易吧,我们足足干了二代(一代以20年计),据教育部最近统计,会说普通话的还只占53.06%,城市高一些,达66.03%,乡村仅45.06%。15到19岁的已有70.12%,但到30-44岁就跌至52.74%。在单位里,在公共场合,用普通话的占41.97%,一回到家里就降为17.85%了。同样,推广简体字比推广新文字容易,国家老早禁用繁体字,而且大量的报刊书籍的用字很容易控制执行,使简化字普及率已达95.25%,可是现在又出现要求恢复繁体字的呼声,大街小巷繁体字满天飞。这使我们猜想,如果当年已推广了新文字,现在可能也会恢复方块字,像韩国恢复使用汉字一样。
用拼音文字代替汉字,还有一个难题是如何处理三四千年积累起来的大量历史文献。可能有人说,一般人用不到这些古籍,那些就留给少数专家去研究好了。当然不是每个人都要阅读大量的古书。但正如许多人指出的,汉字的神奇,就在于我们普通人还可以读懂两三千年前古人写的文字,而世界上的其他文字,就像英文那样,三四百年前写的,就只能让专家去啃了。我们的古文,比如二千年前的诗经、论语,不仅中学生可学,甚至可做幼童的启蒙教材。如果一般人不能翻阅这些文献,那么对于我们的后代,中华文明也就像玛雅文明一样,只不过是一个抽象的概念,中华文明的传统也就不复存在了。
当然可以把她们都翻译成新文字。且不说这要化巨大的人力、物力和时间,且不说总有一些文献会被漏掉,新发现的要等一段时间才能翻译出来。大家都知道,看译文总不如看原文,这中间要打一个不少的折扣。有人说,英文很难把中文的神韵完全翻译出来,还说这是中国文学得不到诺贝尔奖的原因。我们不评论这一说法的对和错,很明显,翻译水平是随译者的知识修养及理解程度而定,这迫使我们要对比参阅不同译者的译文。但是,每种文献都搞几种译本,也不一定能保证完全传达原著的一切呀?
再说,汉语不是粘着语,不适于用拼音文字。明显的是,汉字单音节,同音字多,单用拼音字母是分不清的。为此,许多新文字设计者,都增加了特别的义符。殊不知这样一套新设计的新汉字,可能难以传达原有汉字所有的微妙含义,可能比原来的方块字更难学。好的有生命力的文字,是要经过长期的实践磨合调整的。我们知道,就是比语言文字简单得多的计算机软件,刚设计出来时,必有许多BUG,要在试用期不断纠正,最后才可决定能否实用。新文字的磨合期应该比一般大型软件的试用期更长,不是一年两年,可能要几十年。
另外,我们学习汉字时,每个汉字都有它六书造字的源头,常常联系着一些故事、趣事,好的汉字教学法都会尽量利用这些资料。那怕《说文解字》的六书分析不正确,有的材料是无稽之谈,但有利于记忆。为了记住圆周率3.1415926535,我们把它编成故事:"山颠一寺一壶酒,尔乐苦杀吾",这没任何科学道理,但绝对有效。还有许多方块字特有的文化,如字谜、对联、拆字、书法……,以及常说的"木子李""弓长张"等等,都要随着新文字的使用而消灭了。难怪有人说,搞新文字不如直接使用英文,还可把力气化在好好翻译中国古文献上,让中国古文化遗产更好地传给全世界,我们后代也能更好的与世界接轨,他们也能与世界其他人一起,能清楚地了解,历史上曾有过一个中华文化。不过这时,他们应该已不是中国人了。
文化,有了文字之后是文化的主要载体--文字,是一个民族的灵魂。汉字是中华民族的灵魂,消灭汉字,无异于消灭中华民族。这不是危言耸听。大家都读过《最后一课》的故事,征服者想永久奴役被征服者,都是从禁止使用被征服者的语言文字开始的,当年日本帝国主义对我们也是这样做的。玛雅人的血统还存在,但玛雅民族及其文化已不复存在。据说玛雅人是被当年欧州殖民者杀光了。实际上人是难杀绝的,但玛雅文字确确实实失传了。我国宁夏一帶,11到13世纪,曾有"党项族"建立的相当发达的西夏王国。成吉思汗知道不可能杀绝他们,于是采取毁掉西夏文化以及西夏文化的一切载体的方法:西夏文字、服饰、音乐不准用,寺、塔,甚至连瓦档都捣毁,近年发掘西夏王陵,发现连已入土的陪葬品都被捣碎,这个民族就这样被消灭了。以前的敌人,未能消灭我们中华民族,难道现在要由我们自己来消灭她?
设计新文字的,常举出创制新文字成功的例子。原来没有文字的少数民族,当然可以设计拼音文字,不过设计只是一个开始,更重要的还在于此后的长期磨合改进。说土耳其由原来的斯拉夫字母改为拉丁字母成功了,实际上拼音文字换一套字母,同我们换一种字体那样简单。越南是由汉字改为拼音了。他们人口少,历史短,而且经过法国的长期殖民统治,是较容易。印度经过长期的殖民统治,独立后,想废除英文还做不到呢,谁愿意走这样的路?韩国推广谚文后,又恢复汉字;日本应该是最早废除汉字的,结果不但离不开汉字,而且所谓的当用汉字,字数还增加了。
应该好好总结一下近百年来对汉语新文字的研究。要由它来替代方块字,按上面的论述,于情于理都是不应该、行不通的。据说现在的世界语问题多多,而我们汉语语法简单,组词灵活有效,目前连英语都有这样的发展倾向。新文字的研究是否可以转向为新世界语世界文的研制。不是搞什么"一语双文",把"双文"当作是向单一拼音文字的过渡。新研制的世界文是方便各国相互交流的中介,到时候可以作为我们首选的外语。
三、克服缺点,弘扬汉字
我们说汉字并不落后,不应该去追求拼音道路,但也不是汉字一切都好。我们应该看到,汉字确实也存在一些缺点。尤其在数字化处理上,汉字输入电脑的瓶颈是基本解决了,仍有其他许多问题没有解决。
汉字表音能力差,比起拼音文字来,终究是一个大缺点。据统计,汉字一半以上是形声字,而汉语如果不计声调的话,只有400多种不同音节。如果设计得很好,经过适当的调整,使每个音节只使用固定的2到3个表音字形,那么让每个汉字都成为形声字,且有准确的表音,是有可能的。因为汉字不是一次性造出来的,而是在使用过程中不断创造并筛选出来的(实际上拼音文字的字也这样),其中不免有一些矛盾或不合理。"秀才认字读半边",本应是形声字规则的体现,但因为形声字有这些不合理,结果使许多人读错了,成为笑话。事实上,这些读错的字,如果大家都读错,并不影响交流,有时还可能大有好处。例如有人建议,将"终"zong字,改读为dong,大家都这样错读,反而能把"终于"和"忠于"zongyu分清楚了。我们在简化笔画上已取得了巨大成绩,统一表音偏旁的工作,不会比简化字形难多少,为什么不做呢?
另一个缺点是,至今没有一个科学的排序方法。所谓科学,可以陈述为:有一个单一的(简单的)、唯一的(确定的)、自然的(合理的)标准。按出现时间的先后,我们曾用过、现在还在使用的方法有:部首、四角号码、拼音、笔画等,但没有一种能够将每个汉字都排到唯一的位置上,即按单一的标准,每个汉字都有一个确定的、不与任何别的汉字相重覆的位置。这使汉字字典与其他拼音字典有一个最大的不同:在字典正文之前(或之后),必须有一个索引,有时还有几种索引,多数还要设一个难字检字表。同部首、同音的字多,最后都要辅以笔画数。本来直接用笔画序是比较好的,位置有重覆的很少,可惜汉字平均笔画数太大,直接使用很不方便。另外还有笔顺问题,规定和学习笔顺规则不容易,笔顺不统一,排序位置也就不确定了。不过最后解决这个问题还是要建立在笔画上,不是直接用笔画序列,还要用一些笔画组--部件,像王竹溪的《新部首大字典》那样。这里要先研究确定笔画、部件、笔顺这三者的标准。
可以说,汉字的科学排序问题是最最重要的问题,它是解决其它许多重要问题的关键,是这些问题的根。例如,说汉字难学,对中国人来说,主要就是由于查字典难。因为学习任一种文字,在学校里只能学一点基础,特别是学习使用字典的方法,然后再到读写实践中去学。我们都有体会,由于碰到生字,用字典一时间查不到,才使我们读不准一些字,或者读错、闹笑话。如果像英文字典,很容易查到,如果用电子字典,还会发音教您,就能彌补表音不足的缺陷。用电子字典查汉字,等于要输入这个汉字,其输入必然很简单,人人都会,就不会出现"万马奔腾"的局面。如果上面说的三个标准都很科学地解决了,每个汉字就唯一对应这查字序列,可以直接用这个序列作为内码。这样一来,内码长短不一,与英文字(词)一样,不要专门的输入法,也不会产生乱码。如果有适当的组字软件,就可组出一切汉字,再也不需要字库,汉字数也没有限制了。
解决以上问题后,汉字大概再没有其他大问题了。下面三个问题比较简单,不过还是要通过一定的试验研究,作出正确的取舍,推广使用则并不难。第一个是彭泽润先生提倡的分词连写。虽然有人觉得不习惯,但对各种中文处理是很重要的。我们要有一套分词的标准,同时修改文字处理软件,并确定两词之间的空间要留多大(现在是留一个汉字的位置,显然不合适),才能实现分词连写。第二个是金灿龙研究发现的,我国青少年近视眼增多,与中文横排、每行又高低一致有关。外文虽然横排,但小写字母是高低不平的。这个事,真要好好进行实验研究。古人读书,常把书卷起来,凸出被读的行,犹如放了一个指示用的界尺;再伸握书的右手手臂,将书举到右上方,保证了健康的阅读距离;竖排的行是由右向左的,移行很顺手,稍稍转动一下就可以了。过去是为了排印公式,中文也改用横排。如果横排真有金灿龙发现的缺点,那就应该改回来。公式实际上也可改为竖排,习惯了可能也不错,只有西文不好改。另外,是否可以开发一套新字体,按书法"中宫收紧"的原则,突出有些汉字的外展笔画,这可能还会提高汉字的分辨力,使横排时也高低不平。第三个是,西文的专有名词,首字母大写;中文竖排时,专有名词右边加竖线;但改横排后,却不加下划线了。这常常产生理解的困难,对专有名词,应该有一个像书名号一样的标点符号。
其他所谓的一些问题,不见得正确。有人说,英文熵(英文字母的平均信息熵)低,只有4.03比特,而汉字熵高达9.65比特,所以中文的信息处理效率特别低。而汉字优越论者却认为这是汉字的优点,熵就是信息量,熵高即含信息多。汉字形体复杂,分辨率高,确是优点,不过熵大却不是好事。平均熵的含义是,用最好的编码方法,平均一个字至少要多少比特(二进制位),当然是愈小愈好。但这里将汉字和英文字母比较是很不合理的。按计算,汉字熵比英文字母熵大一倍还多,但是谁都知道,在任何两份内容相同的中英文,英文的字母数都比中文的汉字数多两倍以上。与字母相当的应是汉字笔画,我计算汉字笔画的平均熵只有3.43比特,远比英文字母的4.03比特低。实际上,目前的文字信息编码,都没有应用熵原理。按信息论,为了达到理想情况,必须用不等长的编码:出现频率愈小的,用愈长的碼,而高频字则用短码,才能使实际的平均熵降低,接近这理论熵值。现在不管英文还是中文,都用等长码。一个字母8比特(一个字节),是平均熵的两倍。汉字如果用2字节内码,一个汉字16比特,不到平均熵的两倍,再加上中文总比英文短,效率决不会低。
我们知道,二字节的等长码,只有256*256=65536个码位,而汉字总数远超过此数,所以要给所有汉字定交换码,二字节码长是不够的。国际上现在规定统一码(Unicode),定长4字节32比特。我说它也不是科学的解决方案,最后是行不通的。它虽然有20(实为42)亿码位,但文字是发展的,无定数,收不完所有字母和字符。而且一开始就出现混乱。本来,汉字采用"字库加编码"的方法,应该不会有错字,只有别字。现在网上竟有人发现"电脑错字",也有重覆的汉字。更困难的是如何在十万左右的汉字中找出需要的字,给输入法出难题。有人提出的解决办法是限制汉字数,不准造新字。这不仅不适于古籍的处理,也扼杀汉字的发展。半世纪来"字库加编码"方法实际上已不能造新字了,结果涌出许多光怪陆离的网络词语,报纸上出现大量字母词,不仅破坏中文的纯洁性,还使读者看不懂。这些为什么没人管,是不是认为字母词有利于走向拼音化?
|