2005年9月13日星期二

可自动更新手机电话簿的在线式通讯录系统

  现代人基本上都是用手机记录朋友和客户的电话,如果我们不慎丢失了手机、或换了一款新的手机,想将原来的通讯录完全恢复可就不容易了;另外,如果朋友换工作、迁徙到其它地方去了,除非一个一个地通知,我们很难知道新的电话号码。科技已经发展到今天这个样子,我们维护人际关系的方式却基本还是那么低效率,真是让人不明白!
  现在来看看我的发明专利是怎么解决这个问题的:
  可自动更新手机电话簿的在线式通讯录系统,当用户更换了手机的SIM卡以后,其手机自动发送消息给服务中心,服务中心再将这个电话号码发送到用户许可的朋友的手机上、并自动更新到手机的电话簿中,整个过程无需用户干预;另外,如果用户在手机、或互联网上更改了自己的其它电话号码以后,系统也自动将新的电话号码发送到用户许可的朋友的手机的电话簿中;
  自动更新通讯录的消息既可通过短消息通道传输、也可通过GSM、CDMA、TD-SCDMA、WCDMA、CDMA2000、或其它3G、4G等数据通道传输,适用范围广。
  本项目的系统通过此项物美价廉的服务,可大量聚集手机用户到服务中心的网络上,从而可开展即时通讯IM、社交网络SNS、电子商务等互联网增值服务,也就更加丰富了利润来源。
  目前的手机用户普遍使用手机来记录个人通讯录,一旦丢失、或更换手机就难以完全恢复通讯录,为此本项目量身定做此项服务,一定会得到大多数手机用户的支持,如果以中国5亿手机用户中的10%即0.5亿用户使用本项目的服务、每人每月收取5元的服务费计算,每年收入达60亿元,如果为全球的手机用户提供此项服务则收入更加可观。
  本项目是一项独创性业务,市场上还没有竞争者,它不仅能创造很好的经济效益,也能为手机用户带来极大的方便。

2005年1月3日星期一

读汉语拼音文字

汉语拼音(文字)"写的快,读的慢",是一个值得注意的问题。这个问题早在四、五十年前,黎锦熙先生就发现了。他说:"我用注音字母写日记...后来改用国语罗马字写日记...前后近三十年。...结果是写是写得很纯熟了,看起来就慢得多。...逐字认读,时间至少(比汉字)加两倍...。试写不标调的注音字母和拼法上不分声调的拉丁化新文字,写是更快,读则更慢...,许多词儿更要从句子的上下文猜出意思来,所以读的时间比读汉字有时多到十倍"(见《国语新文字论》)。黎先生是著名的语言文字学家,是汉语拼音化的积极倡导者和实践者,同时也是一位实事求是的学者。他并没有因为大力推进汉语拉丁化,而无视拼音化过程中存在的问题。

黎先生发现的问题,论坛上的许多朋友可能也是有体验的。我们读用拼音(文字)写的帖子,总比读汉字写的帖子慢得多。黎先生说的话是实事求是的。

我们现在还没有拼音文字。假如某天有了拼音文字,若真是"写的快,读的慢",就是一个值得注意的问题了。在信息时代,各种知识、各类信息、各方面的新发现,像海啸一样迎面扑来。我们阅读用汉字写的文章尚嫌其慢,如果阅读用拼音文字写的文章更慢的话,有谁还会用它呢?

汉语拼音(文字)为什么会"写的快,读的慢"呢?这可能与拼音词定型不充分,同音词干扰,词形较难区分等有关。当然,不熟练是关键,熟能生巧嘛!但此外就没有其他原因了吗?笔者认为,和汉字相比,在相同覆盖率情况下,拼音文字需要记忆更多的东西,需要花费更多的时间练习才能熟练掌握它,是一个更重要原因。

根据《现代汉语频率词典》(北京语言学院出版社1986年出版)提供的资料:

当书面覆盖率30%时,汉字需用37字,分词连写的拼音词需用35个。

覆盖率50%时,汉字115个,拼音词191个;
覆盖率60%时,汉字194个,拼音词396个;
覆盖率70%时,汉字311个,拼音词803个;
覆盖率80%时,汉字502个(含5个词素字),拼音词1665个;
覆盖率90%时,汉字885个(含23个词素字),拼音词4138个;
覆盖率95%时,汉字1298个(含60个词素字),拼音词7838个;
覆盖率100%时,汉字4574个(含1003个词素字),拼音词31159个。

从上面提供的数据不难看出,随着汉语书面覆盖率的增加,所需用的汉字和拼音词都是增加的。但两者增长的速率有很大的不同,汉字增加的较慢,分词连写的拼音词,增加的较快,这一点可从下面的比率变化看出来:
当覆盖率为30%时,汉字和拼音词所用的数量接近1:1。但接下来,拼音词的数量就迅速超过汉字了,而且两者的距离越拉越大。

覆盖率为50%时,拼音词/汉字=191/115=1.66
覆盖率为60%时,拼音词/汉字=396/194=2.04
覆盖率为70%时,拼音词/汉字=803/311=2.57
覆盖率为80%时,拼音词/汉字=1665/502=3.32
覆盖率为90%时,拼音词/汉字=4135/885=4.56
覆盖率为95%时,拼音词/汉字=7838/1298=6.03
覆盖率为100%时,拼音词/汉字=31159/4574=6.81

我们举覆盖率为90%时的情况为例:这时的拼音词和汉字之比是4.56。就是说,在相同覆盖率情况下,拼音词数量是汉字数量的4.56倍。假如把每个汉字和每个拼音词都看作是一个"视读单位"的话,那么拼音词的视读单位数量就是汉字的4.56倍了。

任何一种文字,不管是汉字还是拼音文字,要想熟练的掌握和运用,做到直书和直读,都是需要记忆的。汉字就不用说了,汉语拼音词也是需要记忆的,尽管它不必像英文那样背单词,但一些常用词不标调但要读出声调,为了区别同音词而搞的各种异拼或附加的义缀之类,这些特殊词形不记忆行吗?既然如此,两种文字要达到相同的熟练程度,对拼音文字所花费的时间,就应该是汉字所花费时间的几倍了。如果花费时间相同,使用拼音文字的熟练程度就远不及使用汉字熟练。这种不熟练,就只好用较慢的阅读速度来弥补了。

为什么汉字只用885字就覆盖了90%,而拼音词却用了4135个词呢?

语言和文字是两种不同的符号系统,语言是第一性的,文字是表现语言的手段。所以,无论用汉字还是用拼音文字表现汉语,都不可能增加或减少汉语词的数量。一篇演讲含有多少个口说的词是个常量,它不会因记录它的文字不同而改变。

当我们用汉语拼音(文字)记录汉语时,因为它是分词连写,书写的是词,有多少个词,就写出多少个词。而每个词一旦写出,就是一个相对独立的视读单位。词的表现是直观的,数量多少也一目了然。

但用汉字记录汉语时,记的则是每句话,词在这里不作独立成分处理。但词是客观存在的,所以每个词依次都得写出,否则"话"是写不出来的。因为汉字有很强的构词能力,一个字可能是个词,也可能是个词素,它会在许多词中出现。因为字的重复使用,所以用的字次虽多,但用字总的数量不大。这样就可以用不算很多的汉字,写出一篇文章来。因为需要记忆的视读单位较少,阅读的速度自然就会快些。

这是拼音文字和汉字比较,拼音文字"写的快,读的慢"的一种解释。这种解释是否正确,还有待更多的实践来验证。

有的朋友可能会提出,英文也是按词书写,为什么英文没听说"写的快,读的慢"呢?这个问题可从下面的对比资料中看出来。

根据美国哥伦比亚大学桑代克(Thorndike)教授提供的英语词频表(见香港庄以淳先生写的《5000英语基本单词速成记忆法》)。对比汉语拼音的词频和汉字的字频,问题就清楚了:

覆盖率58.83%时,英文词100个,汉语拼音词364个,汉字183个。
覆盖率82.05%时,(英)500个;(拼)1968;(汉)564;
覆盖率89.61%时,(英)1000个;(拼)3969;(汉)884;
覆盖率93.38%时,(英)1500个;(拼)6094;(汉)1158;
覆盖率95.38%时,(英)2000个;(拼)8324;(汉)1410。
......。

当覆盖率95.38%时,汉语拼音词/英文词=8324/2000=4.162倍

从上面对比数字不难看出,在相同覆盖率情况下,汉语和英语相比,是使用词汇较多的一种语言。口说的词多,自然使用的拼音词就多。所以用汉语拼音文字写的东西,在阅读速度上比英文就会慢些。
文字主要是供人阅读的,一本书或一篇文章写出来是给人看的,所以阅读速度问题是衡量一种文字实用性的重要指标。如果在设计拼音文字时不充分考虑将来的阅读问题,就会留下无法弥补的缺欠。