2005年1月3日星期一

读汉语拼音文字

汉语拼音(文字)"写的快,读的慢",是一个值得注意的问题。这个问题早在四、五十年前,黎锦熙先生就发现了。他说:"我用注音字母写日记...后来改用国语罗马字写日记...前后近三十年。...结果是写是写得很纯熟了,看起来就慢得多。...逐字认读,时间至少(比汉字)加两倍...。试写不标调的注音字母和拼法上不分声调的拉丁化新文字,写是更快,读则更慢...,许多词儿更要从句子的上下文猜出意思来,所以读的时间比读汉字有时多到十倍"(见《国语新文字论》)。黎先生是著名的语言文字学家,是汉语拼音化的积极倡导者和实践者,同时也是一位实事求是的学者。他并没有因为大力推进汉语拉丁化,而无视拼音化过程中存在的问题。

黎先生发现的问题,论坛上的许多朋友可能也是有体验的。我们读用拼音(文字)写的帖子,总比读汉字写的帖子慢得多。黎先生说的话是实事求是的。

我们现在还没有拼音文字。假如某天有了拼音文字,若真是"写的快,读的慢",就是一个值得注意的问题了。在信息时代,各种知识、各类信息、各方面的新发现,像海啸一样迎面扑来。我们阅读用汉字写的文章尚嫌其慢,如果阅读用拼音文字写的文章更慢的话,有谁还会用它呢?

汉语拼音(文字)为什么会"写的快,读的慢"呢?这可能与拼音词定型不充分,同音词干扰,词形较难区分等有关。当然,不熟练是关键,熟能生巧嘛!但此外就没有其他原因了吗?笔者认为,和汉字相比,在相同覆盖率情况下,拼音文字需要记忆更多的东西,需要花费更多的时间练习才能熟练掌握它,是一个更重要原因。

根据《现代汉语频率词典》(北京语言学院出版社1986年出版)提供的资料:

当书面覆盖率30%时,汉字需用37字,分词连写的拼音词需用35个。

覆盖率50%时,汉字115个,拼音词191个;
覆盖率60%时,汉字194个,拼音词396个;
覆盖率70%时,汉字311个,拼音词803个;
覆盖率80%时,汉字502个(含5个词素字),拼音词1665个;
覆盖率90%时,汉字885个(含23个词素字),拼音词4138个;
覆盖率95%时,汉字1298个(含60个词素字),拼音词7838个;
覆盖率100%时,汉字4574个(含1003个词素字),拼音词31159个。

从上面提供的数据不难看出,随着汉语书面覆盖率的增加,所需用的汉字和拼音词都是增加的。但两者增长的速率有很大的不同,汉字增加的较慢,分词连写的拼音词,增加的较快,这一点可从下面的比率变化看出来:
当覆盖率为30%时,汉字和拼音词所用的数量接近1:1。但接下来,拼音词的数量就迅速超过汉字了,而且两者的距离越拉越大。

覆盖率为50%时,拼音词/汉字=191/115=1.66
覆盖率为60%时,拼音词/汉字=396/194=2.04
覆盖率为70%时,拼音词/汉字=803/311=2.57
覆盖率为80%时,拼音词/汉字=1665/502=3.32
覆盖率为90%时,拼音词/汉字=4135/885=4.56
覆盖率为95%时,拼音词/汉字=7838/1298=6.03
覆盖率为100%时,拼音词/汉字=31159/4574=6.81

我们举覆盖率为90%时的情况为例:这时的拼音词和汉字之比是4.56。就是说,在相同覆盖率情况下,拼音词数量是汉字数量的4.56倍。假如把每个汉字和每个拼音词都看作是一个"视读单位"的话,那么拼音词的视读单位数量就是汉字的4.56倍了。

任何一种文字,不管是汉字还是拼音文字,要想熟练的掌握和运用,做到直书和直读,都是需要记忆的。汉字就不用说了,汉语拼音词也是需要记忆的,尽管它不必像英文那样背单词,但一些常用词不标调但要读出声调,为了区别同音词而搞的各种异拼或附加的义缀之类,这些特殊词形不记忆行吗?既然如此,两种文字要达到相同的熟练程度,对拼音文字所花费的时间,就应该是汉字所花费时间的几倍了。如果花费时间相同,使用拼音文字的熟练程度就远不及使用汉字熟练。这种不熟练,就只好用较慢的阅读速度来弥补了。

为什么汉字只用885字就覆盖了90%,而拼音词却用了4135个词呢?

语言和文字是两种不同的符号系统,语言是第一性的,文字是表现语言的手段。所以,无论用汉字还是用拼音文字表现汉语,都不可能增加或减少汉语词的数量。一篇演讲含有多少个口说的词是个常量,它不会因记录它的文字不同而改变。

当我们用汉语拼音(文字)记录汉语时,因为它是分词连写,书写的是词,有多少个词,就写出多少个词。而每个词一旦写出,就是一个相对独立的视读单位。词的表现是直观的,数量多少也一目了然。

但用汉字记录汉语时,记的则是每句话,词在这里不作独立成分处理。但词是客观存在的,所以每个词依次都得写出,否则"话"是写不出来的。因为汉字有很强的构词能力,一个字可能是个词,也可能是个词素,它会在许多词中出现。因为字的重复使用,所以用的字次虽多,但用字总的数量不大。这样就可以用不算很多的汉字,写出一篇文章来。因为需要记忆的视读单位较少,阅读的速度自然就会快些。

这是拼音文字和汉字比较,拼音文字"写的快,读的慢"的一种解释。这种解释是否正确,还有待更多的实践来验证。

有的朋友可能会提出,英文也是按词书写,为什么英文没听说"写的快,读的慢"呢?这个问题可从下面的对比资料中看出来。

根据美国哥伦比亚大学桑代克(Thorndike)教授提供的英语词频表(见香港庄以淳先生写的《5000英语基本单词速成记忆法》)。对比汉语拼音的词频和汉字的字频,问题就清楚了:

覆盖率58.83%时,英文词100个,汉语拼音词364个,汉字183个。
覆盖率82.05%时,(英)500个;(拼)1968;(汉)564;
覆盖率89.61%时,(英)1000个;(拼)3969;(汉)884;
覆盖率93.38%时,(英)1500个;(拼)6094;(汉)1158;
覆盖率95.38%时,(英)2000个;(拼)8324;(汉)1410。
......。

当覆盖率95.38%时,汉语拼音词/英文词=8324/2000=4.162倍

从上面对比数字不难看出,在相同覆盖率情况下,汉语和英语相比,是使用词汇较多的一种语言。口说的词多,自然使用的拼音词就多。所以用汉语拼音文字写的东西,在阅读速度上比英文就会慢些。
文字主要是供人阅读的,一本书或一篇文章写出来是给人看的,所以阅读速度问题是衡量一种文字实用性的重要指标。如果在设计拼音文字时不充分考虑将来的阅读问题,就会留下无法弥补的缺欠。