设万维读者为首页 广告服务 技术服务 联系我们 关于万维
简体 繁体 手机版
分类广告
版主:弯刀
万维读者网 > 竞技沙龙 > 帖子
人机大战前小结阿尔法狗的棋力
送交者: Mayi 2016年03月08日16:23:30 于 [竞技沙龙] 发送悄悄话

3月9日汉城时间下午1pm(美东今天11pm),全球关注的阿尔法狗与李世石的人机大战即将开始。此战为五局三胜制,但无论胜负都将下满五盘。比赛用时2小时+3次60秒,按中国规则,黑贴7.5目。


有关阿尔法狗外界知道的信息不多,谷歌团队口紧得很,以保密条款为由拒绝透露阿尔法狗目前的棋力。尽管如此,我们还是可以从一些蛛丝马迹发现一些有帮助的信息。


先看我们已经知道的信息。


有关阿尔法狗的文章可以总结为一句话:谷歌的机器围棋程序历史上首次在分先赛的回合中战胜了人类职业围棋选手。


上面的陈述展开来说是这样的:在阿尔法狗问世之前世界上还没有一个有绝对统治力的计算机围棋程序。最近几年的计算机围棋程序大牛主要是法国的CrazyStone和日本的Zen。去年在阿尔法狗测试期,它们当时在KGS的棋力是6d(不过现在已降下来了)。CrazyStone虽然略强于Zen,它们之间近来的对弈却各有胜负。但现在阿尔法狗对CrazyStone胜率达到了100%,对Zen胜率为99%(deepmind的主帅哈萨比斯说是由于一个小错误造成的败局,但现在他们已经解决了那个问题),加上对另二个稍差一些的围棋程序(Pachi和Fuego)的全胜成绩,阿尔法狗对其他围棋程序的总胜率高达494/495,证明阿尔法狗对别的围棋程序具有碾压性的绝对优势。结论:阿尔法狗是世界上目前最强的计算机围棋程序。


CrazyStone和Zen能在KGS打到6d,说明它们的棋力比大多数业余棋手强(KGS的6d大约相当于中国的业5)。但对职业棋手呢?CrazyStone对职业棋手的最好成绩是受4子胜过日本的石田芳夫和伊田纪基。Zen的最好成绩是受4子胜了武宫正树。另外韩国的程序Dolbaram受4子胜过赵治勋。然而这些程序均未有与职业选手下分先棋取胜的战绩。因此阿尔法狗是史上首次跟人类职业选手(其绝对水平另说)下分先棋并取得了完胜的计算机围棋程序,仅此一点阿尔法狗取得的成绩足以堪称革命性的飞跃。


先不说樊二段的实力如何,阿尔法狗这个番棋胜本身就创造了历史。历史上CrazyStone和Zen即使对业余选手的番棋也没胜过。2014年CrazySton在五番棋中以1比3输给了德国老将弗兰茨约瑟夫业6,2015年Zen以同样比分输给了同一人。再做一个横向比较,弗兰茨约瑟夫在KGS也只是6d而已。历史上还没有比弗兰茨约瑟夫6d高的棋手与围棋程序下过番棋赛的情况。


回到樊二段,不管他与阿尔法狗比赛的结果如何,他曾经是正宗的中国职业二段这点无可争议。他曾连续拿下三届欧洲冠军是事实。有争议的只是他去年10月份的表现是否有职业二段。从对局看,樊二段除第一局表现正常外(开局甚至还领先),余下四局是从头到尾的完败。其挣扎的过程的确有业4-5在让子棋中不讲道理的蛮力之嫌。根据樊二段赛后的回忆,他从第二局开始的想法就是跟阿尔法狗对杀,没想到阿尔法狗不惧对杀,这一来他心态上就崩溃了(据他说:感觉上就象撞到了一堵墙上)。从棋的内容看差不多这样,心态影响了棋力也完全说得过去。总而言之,圈内外对樊二段去年10月份表现的定位似乎是一致的,阿尔法狗棋力高于樊二段也没有争议。大家的争论只在对阿尔法狗的最高棋力的评估上。


然而如果你坚持认为樊二段的棋力只有业5。。。。。。


前几天,樊二段再次在第一届欧洲职业围棋锦标赛中以全胜成绩夺冠(这次胜的对手是三位1p,一位3p),取得了代表欧洲参加今年应氏杯的资格,说明他的职业二段还是靠得住的。我看了一下这几盘棋谱,樊二段胜得干干净净,所以谷歌的文章也是对的,樊二段曾是现在仍是欧洲最好的职业棋手。樊二段的赛后感很有意思,大意是自从去年跟机器打了一仗后,他的比赛心态有了提升,对此次获胜帮助很大。这话换个说法就是跟阿尔法狗比赛后樊二段对棋的悟性提高了。


说这么多樊二段是为了给分析阿尔法狗的棋力提供一个参照点。此外,似乎还有必要先解释一下阿尔法狗和阿尔法群狗是怎么回事。


根据谷歌文章,阿尔法狗的基本算法大致由落子选择网络(policy network),局面形势判断网络(value network)和蒙特卡洛树搜索(MCTS)三部分构成。前二者就是所谓的深度卷积神经网络(DCNN),而蒙特卡洛树搜索是CrazyStone和Zen的核心算法。换句话说,阿尔法狗与两个前冠军程序的相比其革命性的不同是多了两个神经网络。这两个神经网络组合本身的棋力在不加搜索时就已经比CrazyStone和Zen强大了,证据是该组合对CrazyStone的胜率可达74%,而对Zen的胜率达84%。这意味着仅两个神经网络的组合在KGS的棋力就能达7d水平。如把它们分别测试,单个神经网络的棋力也有KGS 3-4d的样子。两个神经网络+蒙特卡洛树搜索就变成了更强大的阿尔法狗。阿尔法单狗和阿尔法群狗的区别仅是它们所用的CPU和GPU的不同,目的是在固定的算法下测试单纯增加硬件资源后对棋力的影响。


谷歌用于与其它围棋程序对战测试的是阿尔法单狗(AlphaGo,48CPU+8GPU),而与樊二段对杀的是阿尔法群狗(distributed AlphaGo,1202CPU+176GPU)。他们测试过最凶狠的阿尔法群狗竟有1920CPU+280GPU。加上另外两条低于与樊二段对杀的阿尔法群狗,谷歌发表的文章中实际上一共测试了5条不同的阿尔法狗。


统计上看,阿尔法单狗对CrazyStone和Zen让4子的胜率分别是77%和86%。按网络围棋的分档规则意味着阿尔法单狗比CrazyStone和Zen至少高4个段位。如以KGS为例,假如CrazyStone和Zen是KGS 6d,那么阿尔法单狗至少是KGS 9d以上的水平。我最近查了一下,似乎CrazyStone和Zen现在已掉到4d左右了(我觉得网络围棋比现实围棋合理在于如你不能保持棋力,别人上去了你就会被打下来。而现实围棋是只升不降)。即使按4d算,那么阿尔法单狗也有KGS 8d以上的棋力。


KGS 8d是个什么概念呢?前面提到的德国老将弗兰茨约瑟夫业6在KGS是6d。樊二段前不久在首届欧洲职业锦标赛中战胜的俄国的伊利亚什克辛和以色列的阿里贾巴林都是欧洲业7/1p,他们二人在KGS上都是8d。于是,我们可以大致认为阿尔法单狗的棋力已近似于伊利亚什克辛,阿里贾巴林或樊老师,有欧洲业余高段-职业初段的水平。


那么阿尔法群狗的棋力呢?根据谷歌文章,CrazyStone的Elo等级分大致为1918,Zen为1888;樊二段的等级分为2908(他当时的世界排名第633),与阿尔法单狗2890相当;而阿尔法群狗的棋力则被定为Elo等级分3150(见《Nature》谷歌文章的图4a)。我估计这个分值可能是从与樊二段对战的结果反推出来的。


如果樊二段在去年10月份的等级分为2908,如果阿尔法群狗对樊二段的胜率为80%左右,那么根据Bayesian公式计算出阿尔法狗的等级分大约是3150分。有人要说了,他们结果不是5比0吗?


实际上阿尔法狗与樊二段共下了10盘棋(5盘正式对局,5盘非正式对局),总比分是8比2。他们双方事先约定最后结果只计正式对局的结果。所谓正式对局是用时1小时,3次30秒读秒。非正式对局3次30秒读秒,几乎是超快棋。按通常想像,计算机下快棋应该比人有优势,但有趣的是阿尔法狗与樊二段的5盘非正式对局结果是3:2,胜方都是中盘胜。这个结果似乎表明计算机对人并没有围棋棋感胜负速度上的优势。那么这个安排是否是阿尔法狗与樊二段在正式比赛之前的热身赛,那个时候双方都需要先找到“感觉”呢?不过《Nature》文章告诉我们实战比赛的过程是这样的:每天2盘棋,先下1盘非正式赛,然后开始正式比赛。值得注意的是樊二段胜的2盘是第一天执黑中盘胜,第五天执白中盘胜。也就是说,樊二段在第1盘和第5盘都是先胜了阿尔法狗之后才与其正式开杀的。知道了这个对局过程或许对纠正某些放水论阴谋论者的先入为主有些帮助。


有趣的是这条群狗对那条砍杀程序的单狗的实战胜率为77%,而最凶狠的那条群狗对单狗的胜率为81%。换句话说,阿尔法群狗与单狗的差距基本上就是它与樊老师之间的差距。此外,这个结果还证明单纯增加计算资源在达到一定程度后棋力提高甚微。


3150分是个什么概念呢?目前韩国的崔显宰三段的等级分3148(他是2013年世界业余锦标赛冠军),日本的姚智腾三段 3130(18岁,台湾人,11岁成台湾最年轻的7段),中国的伊凌涛三段的等级分3160(15岁,2014年战胜四大天王之马天放,王琛和老冠军孙谊国获全国业余冠军并入段), 李翔宇三段 3155(17岁)。中国的四大业余天王等级分为:马天放业7,3191;白宝祥业7,3158;胡煜清业7,3067;王琛业7,3010 。此外,俞斌的等级分是3197,聂卫平3195,芮乃伟3142,刘晓光3125。


由此看出,3150分附近的上下是业余顶尖,新进职初/职三以及老的职业高段棋手,这与众多职业高手仅根据棋谱所判定的阿尔法狗的棋力是基本相符的。


然而,这是去年10月份阿尔法狗的棋力。


目前对阿尔法狗的共识是,它的布局相对较弱,但它的中盘和后半盘比较强。谷歌团队说了,阿尔法狗的目的是赢棋,而非赢得漂亮赢得多。在确定优势的情况下,阿尔法狗会走得很保守,避免无谓纠缠,绝不走过份棋。王雷六段认为这个风格有点像大李,尽早定型,在官子上战胜对手。


那么这次人机大战,小李的胜率如何呢?根据Elo等级分排名,我的计算是小李对去年10月份的阿尔法狗的胜率大约为92%。这个胜率表明小李具有压倒性优势,对阿尔法狗理论上是5比0的结果。


但是,我们仍然不知道今天要上阵的阿尔法狗已经进步了多少。从谷歌文章以及谷歌团队透露的信息看,阿尔法狗每天都在进步。如果阿尔法狗这几个月有了长足进步,那么上面的胜率可能就要修改了。


在最近两次的新闻发布会上,deepmind团队的老总哈萨比斯都声称阿尔法狗对小李取胜的机会有50%。他还说,不管输赢,这次比赛的内容一定不会差。还有,樊二段多次说过,阿尔法狗的确比他强很多。我想这不仅仅是他去年那10盘棋后的认识。考虑到去年10月之后deepmind团队就聘了樊二段为顾问,樊二段那之后必定还有多次与阿尔法狗的较量,帮助阿尔法狗发现问题。这就解释了为什么樊二段一直有那个“保密协定”的说法而拒绝透露阿尔法狗现在的棋力。但樊二段说过,阿尔法狗的棋力到时候会惊倒你们。他还说,希望这次人机大赛后小李能给他“平反”。从这些话中我们可以间接推测阿尔法狗的棋力的确已经大大提高了。


其实,这次人机大战中阿尔法狗的进步程度更令人关注。它的进步程度从比赛的内容就一定看得出来。


顺便说一下,樊二段将是这次人机大战的裁判长。Aja Huang(谷歌文章的共同第一作者,台湾业6)将是为阿尔法狗摆棋子的人。


Aja Huang是计算机围棋专家,他的博士论文导师是Remi Coulom,就是CrazyStone的作者。


至于那些用骗招对阵阿尔法狗的建议,卡斯帕罗夫的忠告是,如果你老想着对电脑用骗招,到头来只能骗自己。


让我们静下心来欣赏这场人机大战吧。

0%(0)
0%(0)
标 题 (必选项):
内 容 (选填项):
实用资讯
回国机票$360起 | 商务舱省$200 | 全球最佳航空公司出炉:海航获五星
海外华人福利!在线看陈建斌《三叉戟》热血归回 豪情筑梦 高清免费看 无地区限制
一周点击热帖 更多>>
一周回复热帖
历史上的今天:回复热帖
2015: 村纪检对蚂蚁和机会园丁的处理意见
2015: 快船对勇士,一对冤家...,山狼呢,怎么
2013: 老矮: 验兵石
2013: 今天是三八,提议村里各大离心机们每人
2012: 小林低迷,天黑了也没盼头。指甲哥肉丝
2012: 祝亲爱女社员们节日快乐
2011: 时代真是不同了,现在连乌克兰的球队打
2011: 我给机会园丁道个歉