設萬維讀者為首頁 廣告服務 技術服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:彎刀
萬維讀者網 > 競技沙龍 > 帖子
人機大戰前小結阿爾法狗的棋力
送交者: Mayi 2016年03月08日16:23:30 於 [競技沙龍] 發送悄悄話

3月9日漢城時間下午1pm(美東今天11pm),全球關注的阿爾法狗與李世石的人機大戰即將開始。此戰為五局三勝制,但無論勝負都將下滿五盤。比賽用時2小時+3次60秒,按中國規則,黑貼7.5目。


有關阿爾法狗外界知道的信息不多,谷歌團隊口緊得很,以保密條款為由拒絕透露阿爾法狗目前的棋力。儘管如此,我們還是可以從一些蛛絲馬跡發現一些有幫助的信息。


先看我們已經知道的信息。


有關阿爾法狗的文章可以總結為一句話:谷歌的機器圍棋程序歷史上首次在分先賽的回合中戰勝了人類職業圍棋選手。


上面的陳述展開來說是這樣的:在阿爾法狗問世之前世界上還沒有一個有絕對統治力的計算機圍棋程序。最近幾年的計算機圍棋程序大牛主要是法國的CrazyStone和日本的Zen。去年在阿爾法狗測試期,它們當時在KGS的棋力是6d(不過現在已降下來了)。CrazyStone雖然略強於Zen,它們之間近來的對弈卻各有勝負。但現在阿爾法狗對CrazyStone勝率達到了100%,對Zen勝率為99%(deepmind的主帥哈薩比斯說是由於一個小錯誤造成的敗局,但現在他們已經解決了那個問題),加上對另二個稍差一些的圍棋程序(Pachi和Fuego)的全勝成績,阿爾法狗對其他圍棋程序的總勝率高達494/495,證明阿爾法狗對別的圍棋程序具有碾壓性的絕對優勢。結論:阿爾法狗是世界上目前最強的計算機圍棋程序。


CrazyStone和Zen能在KGS打到6d,說明它們的棋力比大多數業餘棋手強(KGS的6d大約相當於中國的業5)。但對職業棋手呢?CrazyStone對職業棋手的最好成績是受4子勝過日本的石田芳夫和伊田紀基。Zen的最好成績是受4子勝了武宮正樹。另外韓國的程序Dolbaram受4子勝過趙治勳。然而這些程序均未有與職業選手下分先棋取勝的戰績。因此阿爾法狗是史上首次跟人類職業選手(其絕對水平另說)下分先棋並取得了完勝的計算機圍棋程序,僅此一點阿爾法狗取得的成績足以堪稱革命性的飛躍。


先不說樊二段的實力如何,阿爾法狗這個番棋勝本身就創造了歷史。歷史上CrazyStone和Zen即使對業餘選手的番棋也沒勝過。2014年CrazySton在五番棋中以1比3輸給了德國老將弗蘭茨約瑟夫業6,2015年Zen以同樣比分輸給了同一人。再做一個橫向比較,弗蘭茨約瑟夫在KGS也只是6d而已。歷史上還沒有比弗蘭茨約瑟夫6d高的棋手與圍棋程序下過番棋賽的情況。


回到樊二段,不管他與阿爾法狗比賽的結果如何,他曾經是正宗的中國職業二段這點無可爭議。他曾連續拿下三屆歐洲冠軍是事實。有爭議的只是他去年10月份的表現是否有職業二段。從對局看,樊二段除第一局表現正常外(開局甚至還領先),餘下四局是從頭到尾的完敗。其掙扎的過程的確有業4-5在讓子棋中不講道理的蠻力之嫌。根據樊二段賽後的回憶,他從第二局開始的想法就是跟阿爾法狗對殺,沒想到阿爾法狗不懼對殺,這一來他心態上就崩潰了(據他說:感覺上就象撞到了一堵牆上)。從棋的內容看差不多這樣,心態影響了棋力也完全說得過去。總而言之,圈內外對樊二段去年10月份表現的定位似乎是一致的,阿爾法狗棋力高於樊二段也沒有爭議。大家的爭論只在對阿爾法狗的最高棋力的評估上。


然而如果你堅持認為樊二段的棋力只有業5。。。。。。


前幾天,樊二段再次在第一屆歐洲職業圍棋錦標賽中以全勝成績奪冠(這次勝的對手是三位1p,一位3p),取得了代表歐洲參加今年應氏杯的資格,說明他的職業二段還是靠得住的。我看了一下這幾盤棋譜,樊二段勝得乾乾淨淨,所以谷歌的文章也是對的,樊二段曾是現在仍是歐洲最好的職業棋手。樊二段的賽後感很有意思,大意是自從去年跟機器打了一仗後,他的比賽心態有了提升,對此次獲勝幫助很大。這話換個說法就是跟阿爾法狗比賽後樊二段對棋的悟性提高了。


說這麼多樊二段是為了給分析阿爾法狗的棋力提供一個參照點。此外,似乎還有必要先解釋一下阿爾法狗和阿爾法群狗是怎麼回事。


根據谷歌文章,阿爾法狗的基本算法大致由落子選擇網絡(policy network),局面形勢判斷網絡(value network)和蒙特卡洛樹搜索(MCTS)三部分構成。前二者就是所謂的深度卷積神經網絡(DCNN),而蒙特卡洛樹搜索是CrazyStone和Zen的核心算法。換句話說,阿爾法狗與兩個前冠軍程序的相比其革命性的不同是多了兩個神經網絡。這兩個神經網絡組合本身的棋力在不加搜索時就已經比CrazyStone和Zen強大了,證據是該組合對CrazyStone的勝率可達74%,而對Zen的勝率達84%。這意味着僅兩個神經網絡的組合在KGS的棋力就能達7d水平。如把它們分別測試,單個神經網絡的棋力也有KGS 3-4d的樣子。兩個神經網絡+蒙特卡洛樹搜索就變成了更強大的阿爾法狗。阿爾法單狗和阿爾法群狗的區別僅是它們所用的CPU和GPU的不同,目的是在固定的算法下測試單純增加硬件資源後對棋力的影響。


谷歌用於與其它圍棋程序對戰測試的是阿爾法單狗(AlphaGo,48CPU+8GPU),而與樊二段對殺的是阿爾法群狗(distributed AlphaGo,1202CPU+176GPU)。他們測試過最兇狠的阿爾法群狗竟有1920CPU+280GPU。加上另外兩條低於與樊二段對殺的阿爾法群狗,谷歌發表的文章中實際上一共測試了5條不同的阿爾法狗。


統計上看,阿爾法單狗對CrazyStone和Zen讓4子的勝率分別是77%和86%。按網絡圍棋的分檔規則意味着阿爾法單狗比CrazyStone和Zen至少高4個段位。如以KGS為例,假如CrazyStone和Zen是KGS 6d,那麼阿爾法單狗至少是KGS 9d以上的水平。我最近查了一下,似乎CrazyStone和Zen現在已掉到4d左右了(我覺得網絡圍棋比現實圍棋合理在於如你不能保持棋力,別人上去了你就會被打下來。而現實圍棋是只升不降)。即使按4d算,那麼阿爾法單狗也有KGS 8d以上的棋力。


KGS 8d是個什麼概念呢?前面提到的德國老將弗蘭茨約瑟夫業6在KGS是6d。樊二段前不久在首屆歐洲職業錦標賽中戰勝的俄國的伊利亞什克辛和以色列的阿里賈巴林都是歐洲業7/1p,他們二人在KGS上都是8d。於是,我們可以大致認為阿爾法單狗的棋力已近似於伊利亞什克辛,阿里賈巴林或樊老師,有歐洲業餘高段-職業初段的水平。


那麼阿爾法群狗的棋力呢?根據谷歌文章,CrazyStone的Elo等級分大致為1918,Zen為1888;樊二段的等級分為2908(他當時的世界排名第633),與阿爾法單狗2890相當;而阿爾法群狗的棋力則被定為Elo等級分3150(見《Nature》谷歌文章的圖4a)。我估計這個分值可能是從與樊二段對戰的結果反推出來的。


如果樊二段在去年10月份的等級分為2908,如果阿爾法群狗對樊二段的勝率為80%左右,那麼根據Bayesian公式計算出阿爾法狗的等級分大約是3150分。有人要說了,他們結果不是5比0嗎?


實際上阿爾法狗與樊二段共下了10盤棋(5盤正式對局,5盤非正式對局),總比分是8比2。他們雙方事先約定最後結果只計正式對局的結果。所謂正式對局是用時1小時,3次30秒讀秒。非正式對局3次30秒讀秒,幾乎是超快棋。按通常想像,計算機下快棋應該比人有優勢,但有趣的是阿爾法狗與樊二段的5盤非正式對局結果是3:2,勝方都是中盤勝。這個結果似乎表明計算機對人並沒有圍棋棋感勝負速度上的優勢。那麼這個安排是否是阿爾法狗與樊二段在正式比賽之前的熱身賽,那個時候雙方都需要先找到“感覺”呢?不過《Nature》文章告訴我們實戰比賽的過程是這樣的:每天2盤棋,先下1盤非正式賽,然後開始正式比賽。值得注意的是樊二段勝的2盤是第一天執黑中盤勝,第五天執白中盤勝。也就是說,樊二段在第1盤和第5盤都是先勝了阿爾法狗之後才與其正式開殺的。知道了這個對局過程或許對糾正某些放水論陰謀論者的先入為主有些幫助。


有趣的是這條群狗對那條砍殺程序的單狗的實戰勝率為77%,而最兇狠的那條群狗對單狗的勝率為81%。換句話說,阿爾法群狗與單狗的差距基本上就是它與樊老師之間的差距。此外,這個結果還證明單純增加計算資源在達到一定程度後棋力提高甚微。


3150分是個什麼概念呢?目前韓國的崔顯宰三段的等級分3148(他是2013年世界業餘錦標賽冠軍),日本的姚智騰三段 3130(18歲,台灣人,11歲成台灣最年輕的7段),中國的伊凌濤三段的等級分3160(15歲,2014年戰勝四大天王之馬天放,王琛和老冠軍孫誼國獲全國業餘冠軍併入段), 李翔宇三段 3155(17歲)。中國的四大業餘天王等級分為:馬天放業7,3191;白寶祥業7,3158;胡煜清業7,3067;王琛業7,3010 。此外,俞斌的等級分是3197,聶衛平3195,芮乃偉3142,劉曉光3125。


由此看出,3150分附近的上下是業餘頂尖,新進職初/職三以及老的職業高段棋手,這與眾多職業高手僅根據棋譜所判定的阿爾法狗的棋力是基本相符的。


然而,這是去年10月份阿爾法狗的棋力。


目前對阿爾法狗的共識是,它的布局相對較弱,但它的中盤和後半盤比較強。谷歌團隊說了,阿爾法狗的目的是贏棋,而非贏得漂亮贏得多。在確定優勢的情況下,阿爾法狗會走得很保守,避免無謂糾纏,絕不走過份棋。王雷六段認為這個風格有點像大李,儘早定型,在官子上戰勝對手。


那麼這次人機大戰,小李的勝率如何呢?根據Elo等級分排名,我的計算是小李對去年10月份的阿爾法狗的勝率大約為92%。這個勝率表明小李具有壓倒性優勢,對阿爾法狗理論上是5比0的結果。


但是,我們仍然不知道今天要上陣的阿爾法狗已經進步了多少。從谷歌文章以及谷歌團隊透露的信息看,阿爾法狗每天都在進步。如果阿爾法狗這幾個月有了長足進步,那麼上面的勝率可能就要修改了。


在最近兩次的新聞發布會上,deepmind團隊的老總哈薩比斯都聲稱阿爾法狗對小李取勝的機會有50%。他還說,不管輸贏,這次比賽的內容一定不會差。還有,樊二段多次說過,阿爾法狗的確比他強很多。我想這不僅僅是他去年那10盤棋後的認識。考慮到去年10月之後deepmind團隊就聘了樊二段為顧問,樊二段那之後必定還有多次與阿爾法狗的較量,幫助阿爾法狗發現問題。這就解釋了為什麼樊二段一直有那個“保密協定”的說法而拒絕透露阿爾法狗現在的棋力。但樊二段說過,阿爾法狗的棋力到時候會驚倒你們。他還說,希望這次人機大賽後小李能給他“平反”。從這些話中我們可以間接推測阿爾法狗的棋力的確已經大大提高了。


其實,這次人機大戰中阿爾法狗的進步程度更令人關注。它的進步程度從比賽的內容就一定看得出來。


順便說一下,樊二段將是這次人機大戰的裁判長。Aja Huang(谷歌文章的共同第一作者,台灣業6)將是為阿爾法狗擺棋子的人。


Aja Huang是計算機圍棋專家,他的博士論文導師是Remi Coulom,就是CrazyStone的作者。


至於那些用騙招對陣阿爾法狗的建議,卡斯帕羅夫的忠告是,如果你老想着對電腦用騙招,到頭來只能騙自己。


讓我們靜下心來欣賞這場人機大戰吧。

0%(0)
0%(0)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制
一周點擊熱帖 更多>>
一周回復熱帖
歷史上的今天:回復熱帖
2015: 村紀檢對螞蟻和機會園丁的處理意見
2015: 快船對勇士,一對冤家...,山狼呢,怎麼
2013: 老矮: 驗兵石
2013: 今天是三八,提議村里各大離心機們每人
2012: 小林低迷,天黑了也沒盼頭。指甲哥肉絲
2012: 祝親愛女社員們節日快樂
2011: 時代真是不同了,現在連烏克蘭的球隊打
2011: 我給機會園丁道個歉