| 回答老拳同學的:人工智能,自由意識和量子意識 |
| 送交者: 職老 2016年03月14日17:08:27 於 [五 味 齋] 發送悄悄話 |
|
首先老拳對人工智能的目標函數下的價值計算及其建立解釋科普的不錯,看來是真懂了,特別是下面這段:
“但是對於象下圍棋一類的問題,自己每一步都有N種可能的走法。自己每走一步,對方又有N種可能的走法。因此博弈每一方的對策集合,雖然理論上仍是有限的,但卻是個天文數字,且又是個離散的集合。既不能用解析的方式(即連續函數)來表述,更無法用枚舉的方式,將所有對策窮盡。所以只能將以往的經驗作為整個對策集合的子集合輸入機器。從這個子集合開始,讓機器在實踐中不斷積累更多的對策及每一個對策的收益值(勝算概率),從而不斷擴充對策集合和集合上的收益值,並不斷修正收益值的估算(勝算概率)。這就是人工智能所謂的動態“學習”過程。然而,萬變不離其衷,最後仍可歸結為前文描述的決策過程。”
注意我說的是純物理性隨機變化(用職老的話來說是根植於量子層次的不確定性),而不是同常計算機蒙特卡洛模擬試驗中用到的隨機序列。後者是給頂序列生成函數所生成的,毫無任何“隨機”性的偽隨機序列。只是這個序列的各個數值合在在一起恰好符合均勻分布的性質(即分布很“均勻”),所以可以通過它產生各種需要的概率分布序列(比如正態分布,指數分布等)。純物理性隨機變化是來自物理器件的隨機不穩定性(比如一個邏輯開關元件的一個電位本來應該是“0”卻莫名奇妙產生”1”)” 最近李世石和阿發狗的人機大戰在中文網站上被熱議。阿發狗的出色表現更是讓人始料不及。許多人因此引發出人工智能最終將征服(奴役或毀滅)人類的驚呼。 最近李世石和阿發狗的人機大戰在中文網站上被熱議。阿發狗的出色表現更是讓人始料不及。許多人因此引發出智能機器人最終將征服(奴役或毀滅)人類的驚呼。 本人對人工智能了解甚少。但根據本人的理解,智能機器人無非是在接獲各種通過傳感器外部信息數據的輸入後作出各種判斷和決策。而這種判斷和決策一定是建立在人類理性思維基礎之上的,所以也一定和決策論(包括博弈論)和決策模型有關。 大凡決策論,簡而言之通常包含兩大部分。第一個部分是所有可供決策者選擇的對策或策略的集合。第二部分是目標函數(objective function)。它給每個對策賦予一個收益值(pay-off),從而確立了決策者的價值取向和目標。所以目標函數也稱收益函數或效用函數(utility function)。決策論的任務是如何尋找最佳策略,使得目標函數的收益值最大化。決策者的“理性”也就在於此:他/她採取的策略有明確的目的性。這個目的性就體現在目標函數的最大化上。判斷一個人的行為是盲目的還是理性的,就在於他/她的行為是否在一定程度上符合或接近某種目標函數的最大化。如果根本找不到一個目標函數來刻劃他/她的行為,那麼我們可以稱他/她的行為是盲無目的的。說得難聽點,他/她就是個不可理喻的瘋子。 當然,每個人的價值取向很不相同。張三的目標函數不等於是李四的目標函數。張三不能因為李四的行為不符合張三自己的目標函數最大化原則,就稱李四是盲目的,或罵李四是個瘋子。反之亦然。雖然很多問題上,人們有共同的價值趨向(比如各種投資策略都是為了儘可能多的賺錢),但在其它很多社會實問題上,不能用單一的目標函數刻畫所有理性人的行為模式。 通常的決策模型中,目標函數和對策集合都是給定的。因此,剩下的就是個如何找到最佳策略這個純粹的數學計算問題。計算的難易程度拒絕於對策集合及建立在這之上的目標喊函數的複雜程度。比較具有挑戰性的計算問題是所謂的動態決策問題(dynamic programming)。其中每個對策都分好幾個步驟, 每個步驟都會有一個動態的收益值。最後的目標函數是將所有動態的收益指綜合在一起。 但是對於象下圍棋一類的問題,自己每一步都有N種可能的走法。自己每走一步,對方又有N種可能的走法。因此博弈每一方的對策集合,雖然理論上仍是有限的,但卻是個天文數字,且又是個離散的集合。既不能用解析的方式(即連續函數)來表述,更無法用枚舉的方式,將所有對策窮盡。所以只能將以往的經驗作為整個對策集合的子集合輸入機器。從這個子集合開始,讓機器在實踐中不斷積累更多的對策及每一個對策的收益值(勝算概率),從而不斷擴充對策集合和集合上的收益值,並不斷修正收益值的估算(勝算概率)。這就是人工智能所謂的動態“學習”過程。然而,萬變不離其衷,最後仍可歸結為前文描述的決策過程。 如果你同意人工智能可以用上述決策模型來概述,那麼我想可以回答這個問題了:人工智能最終是否會奴役甚至毀滅人類? 首先,如果人類給機器輸入的目標函數就是儘可能多的屠殺人類。並讓機器人在實踐中不斷學習不斷積累殺人策略,並使其成功概率最大化,那麼以機器的高效和精準,雖然每一步人類自己也能算到,但機器很快會得先手,搶在人類找出最佳對應策略之前,滅了人類。 其次, 人類給機器輸入的目標函數即便不是直接殺人或奴役人類,但屠殺人類或奴役人類能很好地服務於這個目標函數,成為機器人策略集合中的次佳甚至最佳策略, 那麼只要機器人在實踐中有機會接觸“殺人”或“奴役人”這個選項,並積累出“殺人”或“奴役人”這些選項能很好地服務於給定的目標函數這個經驗作為其最佳策略,那麼同樣機器人很快就會占先手戰勝人類。 所以,人類在發展人工智能時要深謀遠慮,注意避免給機器設定能給人類帶來災難的目標函數。即便無法徹底排除這樣的目標函數,也要設法不讓機器人有機會接觸到能服務於這些目標函數的危害人類的選項,徹底杜絕這樣的機會讓機器通過學習積累出殺人大法。 接下來的問題是,如果人類有效地做好了以上的保護措施,人工智能會否否仍然最後奴役或毀滅人類? 要回答這個問題,首先要回答,如果人類根沒有給機器人有關的目標函數,機器為什麼要征服(奴役或毀滅)人類?你也許說機器人也許會發現,屠殺人類是保證機器人生存的最佳方法。 那麼我就要問你,誰給了機器人最大程度保證生存這樣一個目標函數?沒有這個目標函數,機器人為什麼要最大程度保證自己的生存?機器人像人類一樣天生怕死嗎? 這就牽涉到在給定目標函數之外的價值取向問題。機器人會在人類給定的目標函數之外,發展出和原既定目標函數無關的自己的獨立價值取向或目標函數嗎?機器人會因此獨立演變成“邪惡”的種類嗎?要回答這個問題首先要搞清楚,機器人不按原程序社定,獨立發展出一套價值取向和有關的最佳策略的源動力是什麼? 按照目前人類對世界的認知,這種不按牌理出牌“出乎意料”的變化的來源只能有兩種:自由意志和純粹的物理性隨機變化。 前面說過,每個人的價值取向不同。雖然,作為服務於一個更高的目標的手段的中間目標函數可以從這個更高的目標理性推出,但這個最終的目標函數是無法用理性和邏輯來推演的所以決策論里大都是將目標函作為給定的外在設置(After all, there is no account for tastes)。人為什麼會有不同的價值趨向?歸根結底,在於人有“自由意志”這個無法用更原始的哲學概念來定義的概念。 自由意志的概念首先出自第四世紀基督教神學家奧古斯丁,用來解釋善惡和人類原罪的起源這個基督教神學中至關重要的命題。按照這套理論,上帝在造人時給了每個人一個獨立的“位格”(即“person”)。這個獨立的位格包含完全獨立和自主的自我意識(即“我”)和同此緊密相關的獨立的自主的意志,即所謂“自由意志”。但人類誤用了“自由意志”,違背上帝的旨意,從而產生了“原罪”以及由此衍生出的各種“邪惡”。但全知全能的上帝預先知道人類會誤用自由意志而犯罪,所以一開始就預備了救贖之道:即通過耶穌基督和十字架挽回被誤用的自由意志完成救贖。這就是基督教神學和教義的高度概括和總結。(自由意志的概念後來又在康德等先哲的著作里有了更進一步的論述。) 現在的問題是:人類能賦予機器人既定程序以外的真正的位格和自由意志嗎?相信大多數人都會認為不可能。如果不可能,那麼,機器人會自發產生自由意志嗎?答案似乎也是否定的:機器在產生自由意志前都是按既定程序跑。既然只能按既定程序跑,就無法產生自由意志,除非在另一種情形下:即通過純粹物理性的隨機變化,有點象進化論那樣逐步演化出一套獨立的價值取向(包括企圖征服人類的“邪惡”取向)和隨之搭配的高度理性化的策略集合。 注意我說的是純物理性隨機變化(用職老的話來說是根植於量子層次的不確定性),而不是同常計算機蒙特卡洛模擬試驗中用到的隨機序列。後者是給頂序列生成函數所生成的,毫無任何“隨機”性的偽隨機序列。只是這個序列的各個數值合在在一起恰好符合均勻分布的性質(即分布很“均勻”),所以可以通過它產生各種需要的概率分布序列(比如正態分布,指數分布等)。純物理性隨機變化是來自物理器件的隨機不穩定性(比如一個邏輯開關元件的一個電位本來應該是“0”卻莫名奇妙產生”1”) 那麼,純粹的物理性的隨機變化會讓機器人逐步積累進化到獨立於既定程序之外的高度智慧和理性甚至“自由意志”嗎?我不想直接正面回答這個問題,因為它最終牽涉到個人的信仰判斷。但我想講一段小經歷。數年前,我和一個朋友在上班的通勤火車上相遇。這位朋友是根本不信上帝的,但對人工智能很感興趣。在火車上他和我繪聲繪色地描述這人工智能的各種圖景,可謂眉飛色舞,妙趣橫生。我問他,要是機器人最後發展到駕馭甚至征服人類的地步怎麼辦?他搖了搖頭斬釘截鐵地說:不可能。我問:為什麼?他說:這根本違背熵增原理。如果沒有外界智慧的引導,但靠隨機而無序的變化積累,機器人是不會自發進化成能具有高於人類智慧的物種的。我忍不住反問:按照進化論,高度智慧的人類不就是從一堆毫無次序的原子碰撞中逐步進化來的嗎?為什麼機器人就不可以呢?
|
|
![]() |
![]() |
| 實用資訊 | |
|
|
| 一周點擊熱帖 | 更多>> |
| 一周回復熱帖 |
| 歷史上的今天:回復熱帖 |
| 2015: | 俺也說兩句方舟子打假,先表明一哈態度 | |
| 2015: | 韓寒進松江二中也是開後門啊,單獨體育 | |
| 2014: | 教授出去帶女生開會,會有人閒話嗎? | |
| 2014: | 紫鳥是在什麼鎮政府工作?加州前段時間 | |
| 2013: | 方舟子的打假,如文革時的打走資派,如 | |
| 2013: | ZT:韓氏父子做假的鐵證被網友抓住(分 | |
| 2012: | 幼稚而簡單的辦法是聘請民國的國民黨員 | |
| 2012: | 中國經濟體制確實比較優越 | |
| 2011: | oops:小記我的一位日本女同學——原妹 | |
| 2011: | 我們這一代人其實已經不仇恨日本了,因 | |




