從遊戲理論看人類社會
迄今為止的全部經濟學都假定:個人總是在最大化自己的效用(UTILITY),換句話說:“人不為己,天誅地滅”。為了以此為根據得到有意義的解,在數學上必須假定這個效用函數是‘理性’的。所謂理性的意思就是如果一樣東西公認是‘好的’,那麼你得到的越多你的效用就應該越大;反之你的效用就應該越小。
讓我們來看一看最簡單的遊戲:犯人悖論。兩個犯人A和B面臨檢控,根據他們所做的不同選擇,兩個人將會得到不同的刑期。在下面的表格里,括號中的兩個數字前一個是A的刑期,後一個是B的刑期。例如(8,0)表示如果A否認而B認罪,那麼A將獲罪8年而B將立刻釋放。假定A與B事先並不知道對方的選擇。
┏━━━━━┯━━━━━━━┯━━━━━━━┓
┃ │ A否認 │ A認罪 ┃
┠─────┼───────┼───────┨
┃ B否認 │ (1,1) │ (0,8) ┃
┠─────┼───────┼───────┨
┃ B認罪 │ (8,0) │ (4,4) ┃
┗━━━━━┷━━━━━━━┷━━━━━━━┛
在這種情況下,A應該如何選擇呢?我們可以推理如下:如果B否認(對應上表第二行),那麼A若認罪將立刻釋放,A若否認將入獄1年,顯然A的最佳選擇是認罪;如果B認罪(對應上表第三行),那麼A若認罪將入獄4年,A若否認將入獄8年,因此A的最佳選擇仍然是認罪。根據此推理,無論B作何選擇,A都應該認罪,同樣,B也應該得到相同的結論。結果就是‘聰明的’A和B都將選擇認罪而同時獲罪4年,錯過了顯然的最優結果(1,1)。
這個遊戲的結論就是,如果假定“人不為己,天誅地滅”,那麼人類就只能存在次優資源分配中。讓我們把上述遊戲一般化一下:
┏━━━━━┯━━━━━━━━━┯━━━━━━━━━┓
┃ │ A溫和 │ A強硬 ┃
┠─────┼─────────┼─────────┨
┃ B溫和 │ (贏,贏) │ (贏多,輸多) ┃
┠─────┼─────────┼─────────┨
┃ B強硬 │ (輸多,贏多) │ (輸,輸) ┃
┗━━━━━┷━━━━━━━━━┷━━━━━━━━━┛
這個遊戲和犯人悖論的解是一樣的:無論是A還是B,在‘最大化’自己效用的名義下,不約而同地選擇了強硬,從而落入雙輸的圈套。
我們注意到,上面這個遊戲還有一個隱藏的假定,那就是假定A與B是對等的,因此輸贏的結果是對稱的。我們進一步一般化:假定A和B是不對稱的,比如A是Microsoft,B是Netscape,又會看到怎樣的結果呢?
┏━━━━━┯━━━━━━━━━┯━━━━━━━━━┓
┃ │ A合作 │ A競爭 ┃
┠─────┼─────────┼─────────┨
┃ B合作 │ (75,25) │ (100,0) ┃
┠─────┼─────────┼─────────┨
┃ B競爭 │ (55,45) │ (95,5) ┃
┗━━━━━┷━━━━━━━━━┷━━━━━━━━━┛
在這種情況下,強者A會自然而然地選擇競爭,因為它根本就不存在通過合作而提高自己效用的空間。弱者B也只有競爭這一條路可走,不然就面臨徹底被消滅的命運。這也就是為什麼‘美帝國主義’越來越‘貪婪暴虐’、‘單邊主義’的原因所在,恃強凌弱是由自己的利益所驅動的必然選擇,要不然,強大有什麼意義呢?這也是為什麼弱小國家、民族必須努力發展自己的動力:落後就要挨揍。
還有一點兒要指出的是,上述第三個遊戲中,括號里的數字是指‘市場占有率’。而雙方的利潤還決定於市場的大小和利潤率。通常情況下,競爭的市場價格相對較低,供應商一方的利潤率也會下降,但是另一方面,低價格對消費者一方較有吸引力,因此市場總值會比較高。所以,從長遠而言,最終的利潤並不能簡單地由市場占有率來決定的。
在對遊戲理論的研究中,科學家們還發現了,如果讓A和B兩人反覆重複上述‘犯人悖論’遊戲,由於每一次的結果在最終結果中所占的比例比較小,因此A和B都願意冒一些險而試探一下‘否認’的結果。經過一段時間的試探挫折之後,通常A和B是可以達成默契共同‘拒不認罪’的。
換句話說,由於人的自私和短視,人們在相對有限的時間裡通常會選擇‘鬥爭’‘不合作’。但是從長遠而言,同樣出於‘最大化自己效用’的動力,人們會發現‘合作’的價值。在這裡,我想引用以下Ebay創始人的理念來結束這段‘理工科’的探討:我們認為普通人都是好的,只要給與機會都會做正確的選擇。我唯一想要補充的是,當人與人素質上存在巨大差距時,人性中的善良一面就必然要受到壓抑,這就是上面的第三個遊戲,因為巨大的差異就是剝奪和被剝奪的最好理由。而當人與人素質比較接近時,‘合作’才會具有真實的利益,人性中善良的一面才能得以充分釋放。
|