设万维读者为首页 广告服务 技术服务 联系我们 关于万维
简体 繁体 手机版
分类广告
版主:诤友
万维读者网 > 教育学术 > 跟帖
有人对汉语的熵值有不同的看法。参阅我下面转的文章。
送交者: 飞星 2009月04月24日22:35:20 于 [教育学术] 发送悄悄话
回  答: aa88: 英语的优势: 另一角度看aa88 于 2009-04-24 20:15:28
http://bbs.creaders.net/education/bbsviewer.php?trd_id=352831

其他所谓的一些问题,不见得正确。有人说,英文熵(英文字母的平均信息熵)低,只有4.03比特,而汉字熵高达9.65比特,所以中文的信息处理效率特别低。而汉字优越论者却认为这是汉字的优点,熵就是信息量,熵高即含信息多。汉字形体复杂,分辨率高,确是优点,不过熵大却不是好事。平均熵的含义是,用最好的编码方法,平均一个字至少要多少比特(二进制位),当然是愈小愈好。但这里将汉字和英文字母比较是很不合理的。按计算,汉字熵比英文字母熵大一倍还多,但是谁都知道,在任何两份内容相同的中英文,英文的字母数都比中文的汉字数多两倍以上。与字母相当的应是汉字笔画,我计算汉字笔画的平均熵只有3.43比特,远比英文字母的4.03比特低。实际上,目前的文字信息编码,都没有应用熵原理。按信息论,为了达到理想情况,必须用不等长的编码:出现频率愈小的,用愈长的碼,而高频字则用短码,才能使实际的平均熵降低,接近这理论熵值。现在不管英文还是中文,都用等长码。一个字母8比特(一个字节),是平均熵的两倍。汉字如果用2字节内码,一个汉字16比特,不到平均熵的两倍,再加上中文总比英文短,效率决不会低。
0%(0)
    你装的真像,你应该去问问你的言痴  /无内容 - 并瓦 04/25/09 (136)
标  题 (必选项):
内  容 (选填项):
实用资讯
回国机票$360起 | 商务舱省$200 | 全球最佳航空公司出炉:海航获五星
海外华人福利!在线看陈建斌《三叉戟》热血归回 豪情筑梦 高清免费看 无地区限制
一周点击热帖 更多>>
一周回复热帖
历史上的今天:回复热帖
2007: 盖茨对清华与北大的评价zt
2007: 清华大学讲席教授制度回顾zt
2006: 诚信缺失困扰学术殿堂
2004: 植物研究所更名的若干思考