火，进化与人工智能（三）-教育学术-万维论坛-万维读者网（电脑版）

送交者: 扁舟 2003年10月29日20:00:09 于 [教育学术] 发送悄悄话

上回谈到，哥德尔发现，不是所有的“真”命题都能用形式化的“证明”来代替，也就是说，总存在某个陈述你既不能用某个形式系统来证明，也不能来证伪。其实，对于AI的议论本该就此打住了。再往前走可以说步步是雷区，一不小心就成伪科学了。不过，我不下地狱谁下地狱，对吧？

前几天见这里的一些网友在谈随机数，当时第一个反应就是想起了蔡汀（Gregory Chaitin）。不过由于记忆年代久远，怕出丑没敢插嘴。回去查了一下，现在转回头说上几句。第一次听蔡汀的名字，是上一门叫做FORMAL METHOD的计算机课。讲课的是一个半拉老头，有着蒋门神的体魄和气度。这厮绝对是少数那种让人看一眼就觉得深不可测的类型。花白烙腮胡子，霸道的德国英语，简直和人类导师老卡尔有一拼。据说那个发明“多世界”的是他同事，你可以想见这老家伙整天头脑里都转些啥。总之，当时听他谈蔡汀是云山雾罩的，不过现在回过头看哈也没觉得有那么玄。

蔡汀是IBM培养出来的一位牛人。他的思路是，把“复杂性”概念也象“真”概念那样，用形式化给做了。按他的说法，真是复杂性的一个子集。其实这玩意远没看上去那么吓人。试举例说明之。比如你上街看见一漂亮MM。如果她穿一身红衣服，很容易描述吧。可是如果她上身穿碎花带三角形小补丁外套，下身穿利维牛仔裤带铁环膝盖处打水牛皮装饰，你就不是一句话能说清楚了吧？直观上讲，复杂的东西需要更长的描述。

真理是简单的。蔡汀理论（CHAITIN’S THEOREM）就是说，没有程序能计算比它自身更复杂的数！如果再现一系列观测数据的最短可能（SHORTEST POSSIBLE）程序并不比观测数据本身更短，那么观测的数据就是“随机（RANDOM）”的。也就是说，对这些数据不存在某种算法构造性的生成它们。让我们看看随机数。按照蔡汀理论，一个数的复杂性可以用一台通用图林机打印出这个数的最短程序的长度来定义。如果计算一个数的最短程序长度并不比这个数本身短，那么这个数就具有最大的复杂性，就是随机的。有网友问，PI是不是随机的。回答是，不是。因为PI可以用短短几行程序来产生，而PI本身可以无限长。这里的要点是，所有的程序本身也可以形式化，用0或者1序列这样的UTM方式表示出来。这些大概都是算法复杂性101课程的内容。顺便说一下，或许是英雄所见略同吧，方舟女提的信息量子概念大概是在直觉上重复了蔡汀的研究。

如果把AI比喻成一个很难攻克的城堡，我们不妨离开一段距离，站在高空俯视一下它的轮廓。蔡汀定理实际上是对我们人类认识世界的能力提出了一个上限。假设K是我们关于物理、化学、生物等自然科学的最新知识总和，M是一台理想UTM（相当于最聪明的人，比如爱因斯坦的头脑）的能力，那么按照蔡汀定理，我们现有的知识复杂性可以表示为：

T = K的复杂性 + M的复杂性。

逻辑学家和科幻作家拉克估计：满足复杂性K的知识容量大约是1000本书，按照每本书100万字节计算，在ASCII条件下，大概是80亿比特；要了解UTM的每件事情，另外1000本书是可能的。因此，T将是个小于160亿比特的数。这就是我们现在全部知识的复杂程度的上限。按照蔡汀定理，任何观测的数据复杂程度（UTM上0或者1的长度）超出这个范围，我们都没办法构造出一个程序来证明这个观测的真伪。对于这个观测，我们没法给出一个解释，就算有了解释我们也不能够理解！超过160亿比特的复杂程度，就是超过了人类心智能明确解决它的界限。

（未完待续欢迎讨论）

0%(0)

	实用资讯

回国机票$360起 | 商务舱省$200 | 全球最佳航空公司出炉：海航获五星
海外华人福利！在线看陈建斌《三叉戟》热血归回豪情筑梦 高清免费看无地区限制

一周点击热帖

更多>>

一周回复热帖

历史上的今天：回复热帖

2002:	数字王国
2002:	人文教育与科学教育的融合