三個多小時的比賽之後,裁判宣布,執黑子的柯潔以四分之一目的微弱劣勢,敗給了AlphaGo。這場比賽在賽前就懸念不足,AI的能力已經得到廣泛的承認。發布會的前半段,專業棋手樊麾和常昊對本盤做了棋局回顧,提到值得注意的幾步棋。例如,柯潔在局中第7手早早就出了“點三三”這一落子,這在傳統棋局中,往往是在後程棋局比較密集的階段才會出現的招數。
最早是“阿老師”AlphaGo在比賽中首先嘗試,帶動了一系列年輕棋手的學習風潮。在今年的早些時候其他圍棋公開賽中,柯潔也在有意識地嘗試這種打法的延展。
在下棋的過程中,AlphaGo多次展示出職業棋手眼中不可思議的打法。比如一處,在棋手的觀念中,用“提”會讓這一區域白子更為厚實,而AlphaGo實際採取了“大飛”的策略。從局部來說“提”的策略更好,不過“大飛”的策略有助於白子向中央開拓區域。這一手充分說明了AlphaGo在全局把控上的能力。
在賽後發布會上,柯潔表示,在這場比賽之前,他已經研究過AlphaGo的打法,打點三三也是希望使用AlphaGo自己的策略來考驗他的反應。依然,在整局棋的過程中,還是碰到了很多人類選手不會出的打法。印象最深的是一手是白子的“斷”,當時給他製造了不少麻煩,不過回想來看絕對是一步好棋。總體來說,AlphaGo“下得很出色,我輸的沒有什麼脾氣 ”。在和AlphaGo包括之前的Master對弈的過程中,他對圍棋策略有了新的認識,最重要的就是,“沒有什麼棋是不可以下的”,很多AlphaGo的招數對於他來說也是一種學習。
柯潔還表示,現在的AlphaGo,很難再找到缺陷,“以前的AlphaGo還是有弱點的。現在它對棋的理解、判斷,已經遠勝我們了。現在要取勝,只能找些BUG出來。和AlphaGo對戰,是我的榮幸”。
DeepMind CEO兼創始人Demis Hassabis認為,這是一場“令人興奮的一場比賽”,與柯潔的對弈推動AlphaGo探索它的局限,這也是DeepMind團隊希望看到的。
DeepMind的大牛科學家David Silver從算法角度講解了AlphaGo一些看似不合理的打法出現的原因。對於AlphaGo來說,獲勝的概率比獲勝的程度更為重要。因而,他傾向於規避風險,儘可能謹慎地打完比賽,而非較為激烈地去爭取棋盤上的區域。他也說明,與聯網的Master賬號不同,此次對戰的AlphaGo是單機版本,基於TPU(好吧這波谷歌廣告我服)。
Demis透露,在未來一周的人工智能論壇中,DeepMind將發布更多有關AlphaGo的消息,包括新的版本和新的應用領域。