设万维读者为首页 广告服务 技术服务 联系我们 关于万维
首   页 新   闻 论   坛 文   墨 博   客 黄   页 分类广告 购   物
版主:弯刀
登 录 论 坛
用 户 桌 面
 
 
[ads_url_inside]
 
State Farm Drama
万维读者网>竞技沙龙>帖子
黄博士首度说明AlphaGo为何退役(ZT)
送交者: Mayi 2017年11月13日16:03:36 于 [竞技沙龙] 发送悄悄话
没有人会否认,过去一年来炒热全球AI的热源头,正是AlphaGo。很少人知道,AlphaGo里头九成的软件都是一个台湾工程师黄士杰负责。11月10日,衣锦还乡的黄士杰,首度在中研院人工智能年会,说清楚AlphaGo的过去与未来。

“这五年,我也没有想过会做出AlphaGo,团队的精神很强,有个远大的目标。”AlphaGo首席工程师黄士杰语说。

十一月十日,中研院人文馆“人工智能年会”大会议室已经挤满人。这天是全球人工智能AI象征“AlphaGo”幕后重要操盘手,黄士杰衣锦返乡的日子。他是DeepMind里头,除了两位创办人之外,唯一可对外代表公司发言的主管。这也是2012年加入DeepMind的黄士杰,第一次公开演讲。

回想起两个月前的最新突破,身为DeepMind第四十号员工的黄士杰,忍不住兴奋与激动。该公司投稿《自然》杂志上的论文,揭露AlphaGO的终极版“AlphaGo Zero”,不再靠人类围棋知识,就是让Zero只了解围棋最基本的规则,自己跟自己左右互奕,从彻底乱下开始,短短四十天,对上曾打败世界棋王柯洁的旧版Master,已经有超过九成的胜率,打败围棋软件累积十年的历程。

刚开始时,黄士杰认为Zero绝对赢不了Master。因为他再怎么想,都想不到如何让一个程序从零开始学,可以一夕之间赢得了花了十年研发的围棋软件?

但Zero进步神速,“三天就走过围棋几千年的历史”,让黄士杰大为吃惊。但更令人吃惊的在后头,Zero训练到21天时,就达到Master的水准,到第40天,就超越了Master。

身为业余六段棋士,把自己十几年在围棋上的研究拿掉,黄士杰自己有什么感觉?

“如果我阻碍了它,我应该被拿掉,AlphaGo知识中有99%是我做的,那是从师大的研究到现在,这是一个很好的收尾,”黄士杰坦言自己心情很复杂。

DeepMind创办人迪米斯已经和黄士杰说,AlphaGo完成任务了,“我们要往前看”。

黄士杰还记得2016年底西方同事们都准备要过年了。他刚回到台湾,迪米斯立刻要他低调地去申请网络帐号,开始上网下棋,匿名挑战全世界高手。这是AlphaGo Master诞生之始。

在演讲现场黄士杰秀出当时的照片,他当时就在自己的房间,桌上放一碗面,不断下棋,一天要下十盘。注意力要很集中,十分疲累。

刚开始因为黄士杰用的是新帐号,没有职业棋士愿意和这个无名小卒下棋,但没想到他一出手就所向披靡,第二天开始,变成许多人登门挑战。

“当时压力很大,很怕点错,或者网路断线,AlphaGo不能因为我输掉啊,”黄士杰说。当时Master每一盘都赢,下了六十盘,胜率高达95%,高到黄士杰和团队一度以为是bug。

用这个新版软件,今年5月和世界棋王柯洁九段在中国乌镇对奕。Master毫无意外的完胜。

“但这是一次人机共同探索,AI是人类的工具不是威胁,”黄士杰也强调,这套深期度学习加上强化学习的价值网络,就是AlphaGo Zero的理论。

这段AlphaGo旅程,对一名台湾土生土长,站上世界科学舞台的工程师而言,简直像“爱丽丝梦游仙境”。

然而,业界的人都等著看,围棋界已无对手的AlphaGo,接下来能否在其他产业大展身手?

AlphaGo母公司DeepMind创办人兼执行长德米斯也宣布,AlphaGo功成身退,不再比赛。

部份业者甚至持保留意见。例如,一位微软研发主管接受《天下》采访时,便酸溜溜的说,“微软做AI是拿来用的,谷歌做AlphaGo是拿来吹牛的。”他认为,当年IBM的超级电脑深蓝,打败西洋棋棋王后,因为找不到应用,团队最终解散。负责人许峰雄最后甚至离开了IBM。

而脸书人工智能实验室负责人、纽约大学终生教授Yann Lecun也曾质疑,AlphaGo可能很难应用到自驾车等热门领域。

“我们尊重他的看法,我们没有说它(AlphaGo)可以马上用到其他领域,但它可以逐渐用到其他领域,”一位听众转述Yann Lecun的质疑时,年轻的黄士杰回答得很小心翼翼。

“AlphaGo Zero主要目标就是证明不需要人类知识,也可以学习的很强。”黄士杰接下来自信的说,“我们要跟大家说,那是有可能的。”

AlphaGo Zero拿掉之前累积的人类智慧,让AlphaGo了解围棋最基本的规则。单靠机器的深度学习和强化学习。一切从零开始。

可说就是人类创造的智慧打败人类智慧与人类直觉。

“最差的状况也就不过就是IBM当年的状况,但我不认为AlphaGo会到最坏的状况,”清大电机系助理教授孙民说。

从应用的角度来看,孙民认为,只要在虚拟世界中可以虚拟的状况,AlphaGo Zero都可以做。譬如建筑设计可以虚拟设计就可以在虚拟环境中测试,硬件测试可以用这样的工具设计出好的芯片。

这和过去的虚拟3D设计有何不同? “不同就在以前都是人去测试,虚拟软体告诉你虚拟后的结果,但改model还是人,硬体设计还是人,”孙民分析, “AlphaGo Zero 不需要人,只要告诉我规则和你要的结果, 不需要一个专家或者建筑师力学高手, chip设计师, 就可以做出来,”他说。

当然这都还是在虚拟世界中的功能,孙民认为如果在一个环境会变异的实体世界,AlphaGo就还有很多问题需要课服。但可以期待未来的应用与发展。

“我每天上班,每天都在进步,非常愉快,我们团队的精神很强,有个远大的目标,”在DeepMind人称“Aja,阿杰”的黄士杰说。

迪米斯创立Deepmind时,想要做的是通用、强人工智能。AlphaGo还只是一个弱人工智能,还没有到达什么都能学的境界。

或许现在也才迈入人工智能启蒙期的结束,AlphaGo的退役,是另一个新的开始。
标  题 (必选项):
内  容 (选填项):
    
发龙药业大回馈!美国专利骨胶原、活心素、灯盏素、排毒养颜宝购买两疗程免费邮寄中国
天天养生,保健礼品,物超所值,疯狂现金折扣,直销美加,港台,大陆,东南亚
最劲爆,最给力美国专利产品<骨精华>消除关节痛、骨质疏松<心血通>预防心肌梗塞
免开通费,30天免费试用中文电视万花筒, 无捆绑服务,月费5.99
西洋参、羊胎盘、鱼油卵磷脂200多种送礼自用健康佳品,全部特价!由此进入
留美学生医疗保险$39/月,短期访美旅游保险,不需体检无年龄限制
特 别 推 荐
 - 海外华人首选中文电视
 - 新一代骨精华消除关节痛
 - 全美第一汽车保险公司
 - 华语电视 免费试用30天
 - 母亲节最抢手礼物大减价
 - 最新实惠型卡拉OK伴唱机