三个多小时的比赛之后,裁判宣布,执黑子的柯洁以四分之一目的微弱劣势,败给了AlphaGo。这场比赛在赛前就悬念不足,AI的能力已经得到广泛的承认。发布会的前半段,专业棋手樊麾和常昊对本盘做了棋局回顾,提到值得注意的几步棋。例如,柯洁在局中第7手早早就出了“点三三”这一落子,这在传统棋局中,往往是在后程棋局比较密集的阶段才会出现的招数。
最早是“阿老师”AlphaGo在比赛中首先尝试,带动了一系列年轻棋手的学习风潮。在今年的早些时候其他围棋公开赛中,柯洁也在有意识地尝试这种打法的延展。
在下棋的过程中,AlphaGo多次展示出职业棋手眼中不可思议的打法。比如一处,在棋手的观念中,用“提”会让这一区域白子更为厚实,而AlphaGo实际采取了“大飞”的策略。从局部来说“提”的策略更好,不过“大飞”的策略有助于白子向中央开拓区域。这一手充分说明了AlphaGo在全局把控上的能力。
在赛后发布会上,柯洁表示,在这场比赛之前,他已经研究过AlphaGo的打法,打点三三也是希望使用AlphaGo自己的策略来考验他的反应。依然,在整局棋的过程中,还是碰到了很多人类选手不会出的打法。印象最深的是一手是白子的“断”,当时给他制造了不少麻烦,不过回想来看绝对是一步好棋。总体来说,AlphaGo“下得很出色,我输的没有什么脾气 ”。在和AlphaGo包括之前的Master对弈的过程中,他对围棋策略有了新的认识,最重要的就是,“没有什么棋是不可以下的”,很多AlphaGo的招数对于他来说也是一种学习。
柯洁还表示,现在的AlphaGo,很难再找到缺陷,“以前的AlphaGo还是有弱点的。现在它对棋的理解、判断,已经远胜我们了。现在要取胜,只能找些BUG出来。和AlphaGo对战,是我的荣幸”。
DeepMind CEO兼创始人Demis Hassabis认为,这是一场“令人兴奋的一场比赛”,与柯洁的对弈推动AlphaGo探索它的局限,这也是DeepMind团队希望看到的。
DeepMind的大牛科学家David Silver从算法角度讲解了AlphaGo一些看似不合理的打法出现的原因。对于AlphaGo来说,获胜的概率比获胜的程度更为重要。因而,他倾向于规避风险,尽可能谨慎地打完比赛,而非较为激烈地去争取棋盘上的区域。他也说明,与联网的Master账号不同,此次对战的AlphaGo是单机版本,基于TPU(好吧这波谷歌广告我服)。
Demis透露,在未来一周的人工智能论坛中,DeepMind将发布更多有关AlphaGo的消息,包括新的版本和新的应用领域。