回答老拳同學的：人工智能，自由意識和量子意識-五味齋-萬維論壇-萬維讀者網（電腦版）

送交者: 職老 2016年03月14日17:08:27 於 [五味齋] 發送悄悄話

首先老拳對人工智能的目標函數下的價值計算及其建立解釋科普的不錯，看來是真懂了，特別是下面這段：

“但是對於象下圍棋一類的問題，自己每一步都有N種可能的走法。自己每走一步，對方又有N種可能的走法。因此博弈每一方的對策集合，雖然理論上仍是有限的，但卻是個天文數字，且又是個離散的集合。既不能用解析的方式（即連續函數）來表述，更無法用枚舉的方式，將所有對策窮盡。所以只能將以往的經驗作為整個對策集合的子集合輸入機器。從這個子集合開始，讓機器在實踐中不斷積累更多的對策及每一個對策的收益值（勝算概率），從而不斷擴充對策集合和集合上的收益值，並不斷修正收益值的估算（勝算概率）。這就是人工智能所謂的動態“學習”過程。然而，萬變不離其衷，最後仍可歸結為前文描述的決策過程。”

那麼，就人類的學習過程中是否真的如此呢？除了專業選手訓練，現在大企業的員工和管理層面的決策培訓外，其實人類的很多學習是建立在非決策基礎上的，也就是說：選點並不單一。其實根據量子學原理，未來決定了現在，那麼單一性選點其實並不是壞的過程，人類歷史的進程其實就是量子化的單一選點，也就是師師第4盤所說的：白78挖是當時的（走向勝利的）唯一選擇。也就是說決策論和博弈論的第一假設就是競爭基礎下的有利原則。這個原則其實在細胞裡面也是這樣存在的, 現在的研究表明，一個細胞信號的傳遞，大約要進過數十層面的傳遞，大約上白個蛋白參與的網絡結構，同時有正負反饋的參與，特別是磷酸化和去磷酸化，所以當一個外援性藥物進入細胞內，其作用並不是單一方向的，而是多層面的，和體內內源性物質存在競爭的多層面過程，非常類似下棋的過程：細胞的信號樹在不斷的積累每層的收益值，並不斷修正藥物在開始第一步引起的改變的收益的估算=正作用概率，這個其實就是藥物在細胞內動態的讓細胞學習改變的過程。

所以，老拳同學假設：機器智能無法被人類輸入產生消滅人類的決策而可能以意外事件為基礎上的自由意識和隨機意識的可能性判斷並假推了生物進化和機器進化的不可悖論性，也就是說：如果假設人類是進化來的，機器也存在這樣類似的進化，或者說如果你用熵增加來否認機器進化，同時也就否認了人類進化，如果是隨機事件作為意外事件的基礎。

在這裡，大家其實還是有一個誤區，就是認為量子事件和隨機事件是等同的，摸不准原理就是隨機事件的表徵，至少老拳是這樣理解的：

“

注意我說的是純物理性隨機變化（用職老的話來說是根植於量子層次的不確定性），而不是同常計算機蒙特卡洛模擬試驗中用到的隨機序列。後者是給頂序列生成函數所生成的，毫無任何“隨機”性的偽隨機序列。只是這個序列的各個數值合在在一起恰好符合均勻分布的性質（即分布很“均勻”），所以可以通過它產生各種需要的概率分布序列（比如正態分布，指數分布等）。純物理性隨機變化是來自物理器件的隨機不穩定性（比如一個邏輯開關元件的一個電位本來應該是“0”卻莫名奇妙產生”1”）”

但實際上，量子事件和隨機事件並不等同，所以量子層面最大的特點並不是不確定性，而恰恰是量子糾纏下的確定性，也叫做宇宙同時性的要求，所以表面上看量子似乎可以產生所謂的“意外”，但實際上夢特卡洛模擬實驗中的隨機序列，雖然是頂序函數產生的，其本質卻是在固定層面下的真實隨機序列，也就是說這個均勻分布正好表示了量子真正的隨機函數的特點：並不是真正的隨機量子。也就是說：宇宙同時性其實制約了量子所謂的隨機性，換句話說：那種所謂的隨機不穩定性因為量子的存在，反而穩定了。

這個問題怎麼思考呢？其實這樣考慮就好了：下棋其實並不是真正隨機的，也就是說，是有選擇的；在一個被智能控制的時空裡面，比如細胞內的各種充滿智能設計的蛋白，一個有意義的隨機事件並不是真正隨機的，也就是說：量子的隨機性被制約了，明白了這個就知道如果在進行藥物研究的時候，我們可以控制細胞內部產生信號的模式：從非量子化向量子化進行--量子化傳遞的細胞內隔室形成，濃度梯度和時間成正比----細胞膜是圍棋的角，細胞漿是邊，細胞核是草肚皮，從而選擇藥物產生的信號傳遞的最後產出。就這點而言，量子化意識的產生並不是隨機和意外的，而是預訂的，這個也就是DNA和RNA量子密碼下的隱含變量的概念：雖然物理上微觀粒子可能存在隨機分布，而一旦量子化，其分布就符合某種數學模式了。

就此而言，人工智能的產生並非不能超越人類，因為人工智能仍然是人類的智能，但不過是未來人類的智能，無論是自由意識還是量子意識，都不是隨機意識，因為人類和人工智能都實際處於一個叫做：數學靈界MATH SPIRIT的範圍內，是預訂的，是被公式化的，是數字化的世界。

那麼，決定這一切智慧的初始是什麼呢？也叫做：初始智慧，其本質是完美的好的，是藝術也是規律，更是哲學，且必須是神學。如果沒有這個初始意識，一切的決策，一切的競爭，一切的意識，都其實並將不婦存在。

————————————————————————
附着老拳的蚊帳：

最近李世石和阿發狗的人機大戰在中文網站上被熱議。阿發狗的出色表現更是讓人始料不及。許多人因此引發出人工智能最終將征服（奴役或毀滅）人類的驚呼。

最近李世石和阿發狗的人機大戰在中文網站上被熱議。阿發狗的出色表現更是讓人始料不及。許多人因此引發出智能機器人最終將征服（奴役或毀滅）人類的驚呼。

本人對人工智能了解甚少。但根據本人的理解，智能機器人無非是在接獲各種通過傳感器外部信息數據的輸入後作出各種判斷和決策。而這種判斷和決策一定是建立在人類理性思維基礎之上的，所以也一定和決策論（包括博弈論）和決策模型有關。

大凡決策論，簡而言之通常包含兩大部分。第一個部分是所有可供決策者選擇的對策或策略的集合。第二部分是目標函數（objective function）。它給每個對策賦予一個收益值（pay-off），從而確立了決策者的價值取向和目標。所以目標函數也稱收益函數或效用函數（utility function）。決策論的任務是如何尋找最佳策略，使得目標函數的收益值最大化。決策者的“理性”也就在於此：他/她採取的策略有明確的目的性。這個目的性就體現在目標函數的最大化上。判斷一個人的行為是盲目的還是理性的，就在於他/她的行為是否在一定程度上符合或接近某種目標函數的最大化。如果根本找不到一個目標函數來刻劃他/她的行為，那麼我們可以稱他/她的行為是盲無目的的。說得難聽點，他/她就是個不可理喻的瘋子。

當然，每個人的價值取向很不相同。張三的目標函數不等於是李四的目標函數。張三不能因為李四的行為不符合張三自己的目標函數最大化原則，就稱李四是盲目的，或罵李四是個瘋子。反之亦然。雖然很多問題上，人們有共同的價值趨向（比如各種投資策略都是為了儘可能多的賺錢），但在其它很多社會實問題上，不能用單一的目標函數刻畫所有理性人的行為模式。

通常的決策模型中，目標函數和對策集合都是給定的。因此，剩下的就是個如何找到最佳策略這個純粹的數學計算問題。計算的難易程度拒絕於對策集合及建立在這之上的目標喊函數的複雜程度。比較具有挑戰性的計算問題是所謂的動態決策問題（dynamic programming）。其中每個對策都分好幾個步驟，每個步驟都會有一個動態的收益值。最後的目標函數是將所有動態的收益指綜合在一起。

但是對於象下圍棋一類的問題，自己每一步都有N種可能的走法。自己每走一步，對方又有N種可能的走法。因此博弈每一方的對策集合，雖然理論上仍是有限的，但卻是個天文數字，且又是個離散的集合。既不能用解析的方式（即連續函數）來表述，更無法用枚舉的方式，將所有對策窮盡。所以只能將以往的經驗作為整個對策集合的子集合輸入機器。從這個子集合開始，讓機器在實踐中不斷積累更多的對策及每一個對策的收益值（勝算概率），從而不斷擴充對策集合和集合上的收益值，並不斷修正收益值的估算（勝算概率）。這就是人工智能所謂的動態“學習”過程。然而，萬變不離其衷，最後仍可歸結為前文描述的決策過程。

如果你同意人工智能可以用上述決策模型來概述，那麼我想可以回答這個問題了：人工智能最終是否會奴役甚至毀滅人類？

首先，如果人類給機器輸入的目標函數就是儘可能多的屠殺人類。並讓機器人在實踐中不斷學習不斷積累殺人策略，並使其成功概率最大化，那麼以機器的高效和精準，雖然每一步人類自己也能算到，但機器很快會得先手，搶在人類找出最佳對應策略之前，滅了人類。

其次，人類給機器輸入的目標函數即便不是直接殺人或奴役人類，但屠殺人類或奴役人類能很好地服務於這個目標函數，成為機器人策略集合中的次佳甚至最佳策略，那麼只要機器人在實踐中有機會接觸“殺人”或“奴役人”這個選項，並積累出“殺人”或“奴役人”這些選項能很好地服務於給定的目標函數這個經驗作為其最佳策略，那麼同樣機器人很快就會占先手戰勝人類。

所以，人類在發展人工智能時要深謀遠慮，注意避免給機器設定能給人類帶來災難的目標函數。即便無法徹底排除這樣的目標函數，也要設法不讓機器人有機會接觸到能服務於這些目標函數的危害人類的選項，徹底杜絕這樣的機會讓機器通過學習積累出殺人大法。

接下來的問題是，如果人類有效地做好了以上的保護措施，人工智能會否否仍然最後奴役或毀滅人類？

要回答這個問題，首先要回答，如果人類根沒有給機器人有關的目標函數，機器為什麼要征服（奴役或毀滅）人類？你也許說機器人也許會發現，屠殺人類是保證機器人生存的最佳方法。那麼我就要問你，誰給了機器人最大程度保證生存這樣一個目標函數？沒有這個目標函數，機器人為什麼要最大程度保證自己的生存？機器人像人類一樣天生怕死嗎？

這就牽涉到在給定目標函數之外的價值取向問題。機器人會在人類給定的目標函數之外，發展出和原既定目標函數無關的自己的獨立價值取向或目標函數嗎？機器人會因此獨立演變成“邪惡”的種類嗎？要回答這個問題首先要搞清楚，機器人不按原程序社定，獨立發展出一套價值取向和有關的最佳策略的源動力是什麼？

按照目前人類對世界的認知，這種不按牌理出牌“出乎意料”的變化的來源只能有兩種：自由意志和純粹的物理性隨機變化。

前面說過，每個人的價值取向不同。雖然，作為服務於一個更高的目標的手段的中間目標函數可以從這個更高的目標理性推出，但這個最終的目標函數是無法用理性和邏輯來推演的所以決策論里大都是將目標函作為給定的外在設置（After all, there is no account for tastes）。人為什麼會有不同的價值趨向？歸根結底，在於人有“自由意志”這個無法用更原始的哲學概念來定義的概念。

自由意志的概念首先出自第四世紀基督教神學家奧古斯丁，用來解釋善惡和人類原罪的起源這個基督教神學中至關重要的命題。按照這套理論，上帝在造人時給了每個人一個獨立的“位格”（即“person”）。這個獨立的位格包含完全獨立和自主的自我意識（即“我”）和同此緊密相關的獨立的自主的意志，即所謂“自由意志”。但人類誤用了“自由意志”，違背上帝的旨意，從而產生了“原罪”以及由此衍生出的各種“邪惡”。但全知全能的上帝預先知道人類會誤用自由意志而犯罪，所以一開始就預備了救贖之道：即通過耶穌基督和十字架挽回被誤用的自由意志完成救贖。這就是基督教神學和教義的高度概括和總結。（自由意志的概念後來又在康德等先哲的著作里有了更進一步的論述。）

現在的問題是：人類能賦予機器人既定程序以外的真正的位格和自由意志嗎？相信大多數人都會認為不可能。如果不可能，那麼，機器人會自發產生自由意志嗎？答案似乎也是否定的：機器在產生自由意志前都是按既定程序跑。既然只能按既定程序跑，就無法產生自由意志，除非在另一種情形下：即通過純粹物理性的隨機變化，有點象進化論那樣逐步演化出一套獨立的價值取向（包括企圖征服人類的“邪惡”取向）和隨之搭配的高度理性化的策略集合。

那麼，純粹的物理性的隨機變化會讓機器人逐步積累進化到獨立於既定程序之外的高度智慧和理性甚至“自由意志”嗎？我不想直接正面回答這個問題，因為它最終牽涉到個人的信仰判斷。但我想講一段小經歷。數年前，我和一個朋友在上班的通勤火車上相遇。這位朋友是根本不信上帝的，但對人工智能很感興趣。在火車上他和我繪聲繪色地描述這人工智能的各種圖景，可謂眉飛色舞，妙趣橫生。我問他，要是機器人最後發展到駕馭甚至征服人類的地步怎麼辦？他搖了搖頭斬釘截鐵地說：不可能。我問：為什麼？他說：這根本違背熵增原理。如果沒有外界智慧的引導，但靠隨機而無序的變化積累，機器人是不會自發進化成能具有高於人類智慧的物種的。我忍不住反問：按照進化論，高度智慧的人類不就是從一堆毫無次序的原子碰撞中逐步進化來的嗎？為什麼機器人就不可以呢？

0%(0)

	實用資訊

回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐：海航獲五星
海外華人福利！在線看陳建斌《三叉戟》熱血歸回豪情築夢 高清免費看無地區限制

一周點擊熱帖

更多>>

一周回復熱帖

歷史上的今天：回復熱帖

2015:	俺也說兩句方舟子打假，先表明一哈態度
2015:	韓寒進松江二中也是開後門啊，單獨體育
2014:	教授出去帶女生開會，會有人閒話嗎？
2014:	紫鳥是在什麼鎮政府工作？加州前段時間
2013:	方舟子的打假，如文革時的打走資派，如
2013:	ZT：韓氏父子做假的鐵證被網友抓住(分
2012:	幼稚而簡單的辦法是聘請民國的國民黨員
2012:	中國經濟體制確實比較優越
2011:	oops：小記我的一位日本女同學——原妹
2011:	我們這一代人其實已經不仇恨日本了，因