黄博士首度说明AlphaGo为何退役(ZT)-竞技沙龙-万维论坛-万维读者网（电脑版）

送交者: Mayi 2017年11月13日16:03:36 于 [竞技沙龙] 发送悄悄话

没有人会否认，过去一年来炒热全球AI的热源头，正是AlphaGo。很少人知道，AlphaGo里头九成的软件都是一个台湾工程师黄士杰负责。11月10日，衣锦还乡的黄士杰，首度在中研院人工智能年会，说清楚AlphaGo的过去与未来。

“这五年，我也没有想过会做出AlphaGo，团队的精神很强，有个远大的目标。”AlphaGo首席工程师黄士杰语说。

十一月十日，中研院人文馆“人工智能年会”大会议室已经挤满人。这天是全球人工智能AI象征“AlphaGo”幕后重要操盘手，黄士杰衣锦返乡的日子。他是DeepMind里头，除了两位创办人之外，唯一可对外代表公司发言的主管。这也是2012年加入DeepMind的黄士杰，第一次公开演讲。

回想起两个月前的最新突破，身为DeepMind第四十号员工的黄士杰，忍不住兴奋与激动。该公司投稿《自然》杂志上的论文，揭露AlphaGO的终极版“AlphaGo Zero”，不再靠人类围棋知识，就是让Zero只了解围棋最基本的规则，自己跟自己左右互奕，从彻底乱下开始，短短四十天，对上曾打败世界棋王柯洁的旧版Master，已经有超过九成的胜率，打败围棋软件累积十年的历程。

刚开始时，黄士杰认为Zero绝对赢不了Master。因为他再怎么想，都想不到如何让一个程序从零开始学，可以一夕之间赢得了花了十年研发的围棋软件?

但Zero进步神速，“三天就走过围棋几千年的历史”，让黄士杰大为吃惊。但更令人吃惊的在后头，Zero训练到21天时，就达到Master的水准，到第40天，就超越了Master。

身为业余六段棋士，把自己十几年在围棋上的研究拿掉，黄士杰自己有什么感觉?

“如果我阻碍了它，我应该被拿掉，AlphaGo知识中有99%是我做的，那是从师大的研究到现在，这是一个很好的收尾，”黄士杰坦言自己心情很复杂。

DeepMind创办人迪米斯已经和黄士杰说，AlphaGo完成任务了，“我们要往前看”。

黄士杰还记得2016年底西方同事们都准备要过年了。他刚回到台湾，迪米斯立刻要他低调地去申请网络帐号，开始上网下棋，匿名挑战全世界高手。这是AlphaGo Master诞生之始。

在演讲现场黄士杰秀出当时的照片，他当时就在自己的房间，桌上放一碗面，不断下棋，一天要下十盘。注意力要很集中，十分疲累。

刚开始因为黄士杰用的是新帐号，没有职业棋士愿意和这个无名小卒下棋，但没想到他一出手就所向披靡，第二天开始，变成许多人登门挑战。

“当时压力很大，很怕点错，或者网路断线，AlphaGo不能因为我输掉啊，”黄士杰说。当时Master每一盘都赢，下了六十盘，胜率高达95%，高到黄士杰和团队一度以为是bug。

用这个新版软件，今年5月和世界棋王柯洁九段在中国乌镇对奕。Master毫无意外的完胜。

“但这是一次人机共同探索，AI是人类的工具不是威胁，”黄士杰也强调，这套深期度学习加上强化学习的价值网络，就是AlphaGo Zero的理论。

这段AlphaGo旅程，对一名台湾土生土长，站上世界科学舞台的工程师而言，简直像“爱丽丝梦游仙境”。

然而，业界的人都等著看，围棋界已无对手的AlphaGo，接下来能否在其他产业大展身手？

AlphaGo母公司DeepMind创办人兼执行长德米斯也宣布，AlphaGo功成身退，不再比赛。

部份业者甚至持保留意见。例如，一位微软研发主管接受《天下》采访时，便酸溜溜的说，“微软做AI是拿来用的，谷歌做AlphaGo是拿来吹牛的。”他认为，当年IBM的超级电脑深蓝，打败西洋棋棋王后，因为找不到应用，团队最终解散。负责人许峰雄最后甚至离开了IBM。

而脸书人工智能实验室负责人、纽约大学终生教授Yann Lecun也曾质疑，AlphaGo可能很难应用到自驾车等热门领域。

“我们尊重他的看法，我们没有说它（AlphaGo）可以马上用到其他领域，但它可以逐渐用到其他领域，”一位听众转述Yann Lecun的质疑时，年轻的黄士杰回答得很小心翼翼。

“AlphaGo Zero主要目标就是证明不需要人类知识，也可以学习的很强。”黄士杰接下来自信的说，“我们要跟大家说，那是有可能的。”

AlphaGo Zero拿掉之前累积的人类智慧，让AlphaGo了解围棋最基本的规则。单靠机器的深度学习和强化学习。一切从零开始。

可说就是人类创造的智慧打败人类智慧与人类直觉。

“最差的状况也就不过就是IBM当年的状况，但我不认为AlphaGo会到最坏的状况，”清大电机系助理教授孙民说。

从应用的角度来看，孙民认为，只要在虚拟世界中可以虚拟的状况，AlphaGo Zero都可以做。譬如建筑设计可以虚拟设计就可以在虚拟环境中测试，硬件测试可以用这样的工具设计出好的芯片。

这和过去的虚拟3D设计有何不同？ “不同就在以前都是人去测试，虚拟软体告诉你虚拟后的结果，但改model还是人，硬体设计还是人，”孙民分析， “AlphaGo Zero 不需要人，只要告诉我规则和你要的结果, 不需要一个专家或者建筑师力学高手, chip设计师, 就可以做出来，”他说。

当然这都还是在虚拟世界中的功能，孙民认为如果在一个环境会变异的实体世界，AlphaGo就还有很多问题需要课服。但可以期待未来的应用与发展。

“我每天上班，每天都在进步，非常愉快，我们团队的精神很强，有个远大的目标，”在DeepMind人称“Aja，阿杰”的黄士杰说。

迪米斯创立Deepmind时，想要做的是通用、强人工智能。AlphaGo还只是一个弱人工智能，还没有到达什么都能学的境界。

或许现在也才迈入人工智能启蒙期的结束，AlphaGo的退役，是另一个新的开始。

0%(0)

马克，看了小胖和奥恰的比赛。应该说奥恰发挥得极好 - 红山狼 11/13/17 (303)

嗯! 他肯定花灰超长，不可能有酱的进步。看他下次行不行，要还 - 马科长 11/13/17 (268)

这太可怕了。这说明，完全自主的AI远比人类和受人类控制的AI - iHuyou 11/13/17 (293)

	实用资讯

回国机票$360起 | 商务舱省$200 | 全球最佳航空公司出炉：海航获五星
海外华人福利！在线看陈建斌《三叉戟》热血归回豪情筑梦 高清免费看无地区限制

一周点击热帖

更多>>

一周回复热帖

历史上的今天：回复热帖

2016:	NFL第10周。干饭重点晚上拍子海鸟
2015:	看得懂亚洲足球规则的给讲讲，不算与小
2015:	看得懂亚洲足球规则的给讲讲，不算与小
2014:	TNF: BUF-MIA
2014:	恶补五线谱（不喜请飘过：）
2013:	ROX-76ers, No Haden No problem
2013:	折腾一下: 11周票据市场观察
2012:	关于石头挨批，元芳，你怎么看？
2012:	湖人大战马刺咋没人看？