黃博士首度說明AlphaGo為何退役(ZT)-競技沙龍-萬維論壇-萬維讀者網（電腦版）

送交者: Mayi 2017年11月13日16:03:36 於 [競技沙龍] 發送悄悄話

沒有人會否認，過去一年來炒熱全球AI的熱源頭，正是AlphaGo。很少人知道，AlphaGo裡頭九成的軟件都是一個台灣工程師黃士傑負責。11月10日，衣錦還鄉的黃士傑，首度在中研院人工智能年會，說清楚AlphaGo的過去與未來。

“這五年，我也沒有想過會做出AlphaGo，團隊的精神很強，有個遠大的目標。”AlphaGo首席工程師黃士傑語說。

十一月十日，中研院人文館“人工智能年會”大會議室已經擠滿人。這天是全球人工智能AI象徵“AlphaGo”幕後重要操盤手，黃士傑衣錦返鄉的日子。他是DeepMind裡頭，除了兩位創辦人之外，唯一可對外代表公司發言的主管。這也是2012年加入DeepMind的黃士傑，第一次公開演講。

回想起兩個月前的最新突破，身為DeepMind第四十號員工的黃士傑，忍不住興奮與激動。該公司投稿《自然》雜誌上的論文，揭露AlphaGO的終極版“AlphaGo Zero”，不再靠人類圍棋知識，就是讓Zero只了解圍棋最基本的規則，自己跟自己左右互奕，從徹底亂下開始，短短四十天，對上曾打敗世界棋王柯潔的舊版Master，已經有超過九成的勝率，打敗圍棋軟件累積十年的歷程。

剛開始時，黃士傑認為Zero絕對贏不了Master。因為他再怎麼想，都想不到如何讓一個程序從零開始學，可以一夕之間贏得了花了十年研發的圍棋軟件?

但Zero進步神速，“三天就走過圍棋幾千年的歷史”，讓黃士傑大為吃驚。但更令人吃驚的在後頭，Zero訓練到21天時，就達到Master的水準，到第40天，就超越了Master。

身為業餘六段棋士，把自己十幾年在圍棋上的研究拿掉，黃士傑自己有什麼感覺?

“如果我阻礙了它，我應該被拿掉，AlphaGo知識中有99%是我做的，那是從師大的研究到現在，這是一個很好的收尾，”黃士傑坦言自己心情很複雜。

DeepMind創辦人迪米斯已經和黃士傑說，AlphaGo完成任務了，“我們要往前看”。

黃士傑還記得2016年底西方同事們都準備要過年了。他剛回到台灣，迪米斯立刻要他低調地去申請網絡帳號，開始上網下棋，匿名挑戰全世界高手。這是AlphaGo Master誕生之始。

在演講現場黃士傑秀出當時的照片，他當時就在自己的房間，桌上放一碗麵，不斷下棋，一天要下十盤。注意力要很集中，十分疲累。

剛開始因為黃士傑用的是新帳號，沒有職業棋士願意和這個無名小卒下棋，但沒想到他一出手就所向披靡，第二天開始，變成許多人登門挑戰。

“當時壓力很大，很怕點錯，或者網路斷線，AlphaGo不能因為我輸掉啊，”黃士傑說。當時Master每一盤都贏，下了六十盤，勝率高達95%，高到黃士傑和團隊一度以為是bug。

用這個新版軟件，今年5月和世界棋王柯潔九段在中國烏鎮對奕。Master毫無意外的完勝。

“但這是一次人機共同探索，AI是人類的工具不是威脅，”黃士傑也強調，這套深期度學習加上強化學習的價值網絡，就是AlphaGo Zero的理論。

這段AlphaGo旅程，對一名台灣土生土長，站上世界科學舞台的工程師而言，簡直像“愛麗絲夢遊仙境”。

然而，業界的人都等著看，圍棋界已無對手的AlphaGo，接下來能否在其他產業大展身手？

AlphaGo母公司DeepMind創辦人兼執行長德米斯也宣布，AlphaGo功成身退，不再比賽。

部份業者甚至持保留意見。例如，一位微軟研發主管接受《天下》採訪時，便酸溜溜的說，“微軟做AI是拿來用的，谷歌做AlphaGo是拿來吹牛的。”他認為，當年IBM的超級電腦深藍，打敗西洋棋棋王后，因為找不到應用，團隊最終解散。負責人許峰雄最後甚至離開了IBM。

而臉書人工智能實驗室負責人、紐約大學終生教授Yann Lecun也曾質疑，AlphaGo可能很難應用到自駕車等熱門領域。

“我們尊重他的看法，我們沒有說它（AlphaGo）可以馬上用到其他領域，但它可以逐漸用到其他領域，”一位聽眾轉述Yann Lecun的質疑時，年輕的黃士傑回答得很小心翼翼。

“AlphaGo Zero主要目標就是證明不需要人類知識，也可以學習的很強。”黃士傑接下來自信的說，“我們要跟大家說，那是有可能的。”

AlphaGo Zero拿掉之前累積的人類智慧，讓AlphaGo了解圍棋最基本的規則。單靠機器的深度學習和強化學習。一切從零開始。

可說就是人類創造的智慧打敗人類智慧與人類直覺。

“最差的狀況也就不過就是IBM當年的狀況，但我不認為AlphaGo會到最壞的狀況，”清大電機系助理教授孫民說。

從應用的角度來看，孫民認為，只要在虛擬世界中可以虛擬的狀況，AlphaGo Zero都可以做。譬如建築設計可以虛擬設計就可以在虛擬環境中測試，硬件測試可以用這樣的工具設計出好的芯片。

這和過去的虛擬3D設計有何不同？ “不同就在以前都是人去測試，虛擬軟體告訴你虛擬後的結果，但改model還是人，硬體設計還是人，”孫民分析， “AlphaGo Zero 不需要人，只要告訴我規則和你要的結果, 不需要一個專家或者建築師力學高手, chip設計師, 就可以做出來，”他說。

當然這都還是在虛擬世界中的功能，孫民認為如果在一個環境會變異的實體世界，AlphaGo就還有很多問題需要課服。但可以期待未來的應用與發展。

“我每天上班，每天都在進步，非常愉快，我們團隊的精神很強，有個遠大的目標，”在DeepMind人稱“Aja，阿傑”的黃士傑說。

迪米斯創立Deepmind時，想要做的是通用、強人工智能。AlphaGo還只是一個弱人工智能，還沒有到達什麼都能學的境界。

或許現在也才邁入人工智能啟蒙期的結束，AlphaGo的退役，是另一個新的開始。

0%(0)

馬克，看了小胖和奧恰的比賽。應該說奧恰發揮得極好 - 紅山狼 11/13/17 (303)

嗯! 他肯定花灰超長，不可能有醬的進步。看他下次行不行，要還 - 馬科長 11/13/17 (268)

這太可怕了。這說明，完全自主的AI遠比人類和受人類控制的AI - iHuyou 11/13/17 (293)

	實用資訊

回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐：海航獲五星
海外華人福利！在線看陳建斌《三叉戟》熱血歸回豪情築夢 高清免費看無地區限制

一周點擊熱帖

更多>>

一周回復熱帖

歷史上的今天：回復熱帖

2016:	NFL第10周。乾飯重點晚上拍子海鳥
2015:	看得懂亞洲足球規則的給講講，不算與小
2015:	看得懂亞洲足球規則的給講講，不算與小
2014:	TNF: BUF-MIA
2014:	惡補五線譜（不喜請飄過：）
2013:	ROX-76ers, No Haden No problem
2013:	折騰一下: 11周票據市場觀察
2012:	關於石頭挨批，元芳，你怎麼看？
2012:	湖人大戰馬刺咋沒人看？