人工智能、人格和自由意志（一）-五味齋-萬維論壇-萬維讀者網（電腦版）

送交者: 對對眼 2016年03月14日07:18:09 於 [五味齋] 發送悄悄話

最近李世石和阿發狗的人機大戰在中文網站上被熱議。阿發狗的出色表現更是讓人始料不及。許多人因此引發出人工智能最終將征服（奴役或毀滅）人類的驚呼。

最近李世石和阿發狗的人機大戰在中文網站上被熱議。阿發狗的出色表現更是讓人始料不及。許多人因此引發出智能機器人最終將征服（奴役或毀滅）人類的驚呼。

本人對人工智能了解甚少。但根據本人的理解，智能機器人無非是在接獲各種通過傳感器外部信息數據的輸入後作出各種判斷和決策。而這種判斷和決策一定是建立在人類理性思維基礎之上的，所以也一定和決策論（包括博弈論）和決策模型有關。

大凡決策論，簡而言之通常包含兩大部分。第一個部分是所有可供決策者選擇的對策或策略的集合。第二部分是目標函數（objective function）。它給每個對策賦予一個收益值（pay-off），從而確立了決策者的價值取向和目標。所以目標函數也稱收益函數或效用函數（utility function）。決策論的任務是如何尋找最佳策略，使得目標函數的收益值最大化。決策者的“理性”也就在於此：他/她採取的策略有明確的目的性。這個目的性就體現在目標函數的最大化上。判斷一個人的行為是盲目的還是理性的，就在於他/她的行為是否在一定程度上符合或接近某種目標函數的最大化。如果根本找不到一個目標函數來刻劃他/她的行為，那麼我們可以稱他/她的行為是盲無目的的。說得難聽點，他/她就是個不可理喻的瘋子。

當然，每個人的價值取向很不相同。張三的目標函數不等於是李四的目標函數。張三不能因為李四的行為不符合張三自己的目標函數最大化原則，就稱李四是盲目的，或罵李四是個瘋子。反之亦然。雖然很多問題上，人們有共同的價值趨向（比如各種投資策略都是為了儘可能多的賺錢），但在其它很多社會實問題上，不能用單一的目標函數刻畫所有理性人的行為模式。

通常的決策模型中，目標函數和對策集合都是給定的。因此，剩下的就是個如何找到最佳策略這個純粹的數學計算問題。計算的難易程度拒絕於對策集合及建立在這之上的目標喊函數的複雜程度。比較具有挑戰性的計算問題是所謂的動態決策問題（dynamic programming）。其中每個對策都分好幾個步驟，每個步驟都會有一個動態的收益值。最後的目標函數是將所有動態的收益指綜合在一起。

但是對於象下圍棋一類的問題，自己每一步都有N種可能的走法。自己每走一步，對方又有N種可能的走法。因此博弈每一方的對策集合，雖然理論上仍是有限的，但卻是個天文數字，且又是個離散的集合。既不能用解析的方式（即連續函數）來表述，更無法用枚舉的方式，將所有對策窮盡。所以只能將以往的經驗作為整個對策集合的子集合輸入機器。從這個子集合開始，讓機器在實踐中不斷積累更多的對策及每一個對策的收益值（勝算概率），從而不斷擴充對策集合和集合上的收益值，並不斷修正收益值的估算（勝算概率）。這就是人工智能所謂的動態“學習”過程。然而，萬變不離其衷，最後仍可歸結為前文描述的決策過程。

如果你同意人工智能可以用上述決策模型來概述，那麼我想可以回答這個問題了：人工智能最終是否會奴役甚至毀滅人類？

0%(0)

	實用資訊

回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐：海航獲五星
海外華人福利！在線看陳建斌《三叉戟》熱血歸回豪情築夢 高清免費看無地區限制

一周點擊熱帖

更多>>

一周回復熱帖

歷史上的今天：回復熱帖

2015:	俺也說兩句方舟子打假，先表明一哈態度
2015:	韓寒進松江二中也是開後門啊，單獨體育
2014:	教授出去帶女生開會，會有人閒話嗎？
2014:	紫鳥是在什麼鎮政府工作？加州前段時間
2013:	方舟子的打假，如文革時的打走資派，如
2013:	ZT：韓氏父子做假的鐵證被網友抓住(分
2012:	幼稚而簡單的辦法是聘請民國的國民黨員
2012:	中國經濟體制確實比較優越
2011:	oops：小記我的一位日本女同學——原妹
2011:	我們這一代人其實已經不仇恨日本了，因