黄博士首度说明AlphaGo为何退役(ZT) |
送交者: Mayi 2017年11月13日16:03:36 于 [竞技沙龙] 发送悄悄话 |
没有人会否认,过去一年来炒热全球AI的热源头,正是AlphaGo。很少人知道,AlphaGo里头九成的软件都是一个台湾工程师黄士杰负责。11月10日,衣锦还乡的黄士杰,首度在中研院人工智能年会,说清楚AlphaGo的过去与未来。
“这五年,我也没有想过会做出AlphaGo,团队的精神很强,有个远大的目标。”AlphaGo首席工程师黄士杰语说。 十一月十日,中研院人文馆“人工智能年会”大会议室已经挤满人。这天是全球人工智能AI象征“AlphaGo”幕后重要操盘手,黄士杰衣锦返乡的日子。他是DeepMind里头,除了两位创办人之外,唯一可对外代表公司发言的主管。这也是2012年加入DeepMind的黄士杰,第一次公开演讲。 回想起两个月前的最新突破,身为DeepMind第四十号员工的黄士杰,忍不住兴奋与激动。该公司投稿《自然》杂志上的论文,揭露AlphaGO的终极版“AlphaGo Zero”,不再靠人类围棋知识,就是让Zero只了解围棋最基本的规则,自己跟自己左右互奕,从彻底乱下开始,短短四十天,对上曾打败世界棋王柯洁的旧版Master,已经有超过九成的胜率,打败围棋软件累积十年的历程。 刚开始时,黄士杰认为Zero绝对赢不了Master。因为他再怎么想,都想不到如何让一个程序从零开始学,可以一夕之间赢得了花了十年研发的围棋软件? 但Zero进步神速,“三天就走过围棋几千年的历史”,让黄士杰大为吃惊。但更令人吃惊的在后头,Zero训练到21天时,就达到Master的水准,到第40天,就超越了Master。 身为业余六段棋士,把自己十几年在围棋上的研究拿掉,黄士杰自己有什么感觉? “如果我阻碍了它,我应该被拿掉,AlphaGo知识中有99%是我做的,那是从师大的研究到现在,这是一个很好的收尾,”黄士杰坦言自己心情很复杂。 DeepMind创办人迪米斯已经和黄士杰说,AlphaGo完成任务了,“我们要往前看”。 黄士杰还记得2016年底西方同事们都准备要过年了。他刚回到台湾,迪米斯立刻要他低调地去申请网络帐号,开始上网下棋,匿名挑战全世界高手。这是AlphaGo Master诞生之始。 在演讲现场黄士杰秀出当时的照片,他当时就在自己的房间,桌上放一碗面,不断下棋,一天要下十盘。注意力要很集中,十分疲累。 刚开始因为黄士杰用的是新帐号,没有职业棋士愿意和这个无名小卒下棋,但没想到他一出手就所向披靡,第二天开始,变成许多人登门挑战。 “当时压力很大,很怕点错,或者网路断线,AlphaGo不能因为我输掉啊,”黄士杰说。当时Master每一盘都赢,下了六十盘,胜率高达95%,高到黄士杰和团队一度以为是bug。 用这个新版软件,今年5月和世界棋王柯洁九段在中国乌镇对奕。Master毫无意外的完胜。 “但这是一次人机共同探索,AI是人类的工具不是威胁,”黄士杰也强调,这套深期度学习加上强化学习的价值网络,就是AlphaGo Zero的理论。 这段AlphaGo旅程,对一名台湾土生土长,站上世界科学舞台的工程师而言,简直像“爱丽丝梦游仙境”。 然而,业界的人都等著看,围棋界已无对手的AlphaGo,接下来能否在其他产业大展身手? AlphaGo母公司DeepMind创办人兼执行长德米斯也宣布,AlphaGo功成身退,不再比赛。 部份业者甚至持保留意见。例如,一位微软研发主管接受《天下》采访时,便酸溜溜的说,“微软做AI是拿来用的,谷歌做AlphaGo是拿来吹牛的。”他认为,当年IBM的超级电脑深蓝,打败西洋棋棋王后,因为找不到应用,团队最终解散。负责人许峰雄最后甚至离开了IBM。 而脸书人工智能实验室负责人、纽约大学终生教授Yann Lecun也曾质疑,AlphaGo可能很难应用到自驾车等热门领域。 “我们尊重他的看法,我们没有说它(AlphaGo)可以马上用到其他领域,但它可以逐渐用到其他领域,”一位听众转述Yann Lecun的质疑时,年轻的黄士杰回答得很小心翼翼。 “AlphaGo Zero主要目标就是证明不需要人类知识,也可以学习的很强。”黄士杰接下来自信的说,“我们要跟大家说,那是有可能的。” AlphaGo Zero拿掉之前累积的人类智慧,让AlphaGo了解围棋最基本的规则。单靠机器的深度学习和强化学习。一切从零开始。 可说就是人类创造的智慧打败人类智慧与人类直觉。 “最差的状况也就不过就是IBM当年的状况,但我不认为AlphaGo会到最坏的状况,”清大电机系助理教授孙民说。 从应用的角度来看,孙民认为,只要在虚拟世界中可以虚拟的状况,AlphaGo Zero都可以做。譬如建筑设计可以虚拟设计就可以在虚拟环境中测试,硬件测试可以用这样的工具设计出好的芯片。 这和过去的虚拟3D设计有何不同? “不同就在以前都是人去测试,虚拟软体告诉你虚拟后的结果,但改model还是人,硬体设计还是人,”孙民分析, “AlphaGo Zero 不需要人,只要告诉我规则和你要的结果, 不需要一个专家或者建筑师力学高手, chip设计师, 就可以做出来,”他说。 当然这都还是在虚拟世界中的功能,孙民认为如果在一个环境会变异的实体世界,AlphaGo就还有很多问题需要课服。但可以期待未来的应用与发展。 “我每天上班,每天都在进步,非常愉快,我们团队的精神很强,有个远大的目标,”在DeepMind人称“Aja,阿杰”的黄士杰说。 迪米斯创立Deepmind时,想要做的是通用、强人工智能。AlphaGo还只是一个弱人工智能,还没有到达什么都能学的境界。 或许现在也才迈入人工智能启蒙期的结束,AlphaGo的退役,是另一个新的开始。 |
|
|
|
|
实用资讯 | |
|
|
一周点击热帖 | 更多>> |
|
|
一周回复热帖 |
|
|
历史上的今天:回复热帖 |
2016: | NFL第10周。干饭重点晚上拍子海鸟 | |
2015: | 看得懂亚洲足球规则的给讲讲,不算与小 | |
2015: | 看得懂亚洲足球规则的给讲讲,不算与小 | |
2014: | TNF: BUF-MIA | |
2014: | 恶补五线谱(不喜请飘过:) | |
2013: | ROX-76ers, No Haden No problem | |
2013: | 折腾一下: 11周票据市场观察 | |
2012: | 关于石头挨批,元芳,你怎么看? | |
2012: | 湖人大战马刺咋没人看? | |