設萬維讀者為首頁 廣告服務 技術服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:彎刀
萬維讀者網 > 競技沙龍 > 帖子
黃博士首度說明AlphaGo為何退役(ZT)
送交者: Mayi 2017年11月13日16:03:36 於 [競技沙龍] 發送悄悄話
沒有人會否認,過去一年來炒熱全球AI的熱源頭,正是AlphaGo。很少人知道,AlphaGo裡頭九成的軟件都是一個台灣工程師黃士傑負責。11月10日,衣錦還鄉的黃士傑,首度在中研院人工智能年會,說清楚AlphaGo的過去與未來。

“這五年,我也沒有想過會做出AlphaGo,團隊的精神很強,有個遠大的目標。”AlphaGo首席工程師黃士傑語說。

十一月十日,中研院人文館“人工智能年會”大會議室已經擠滿人。這天是全球人工智能AI象徵“AlphaGo”幕後重要操盤手,黃士傑衣錦返鄉的日子。他是DeepMind裡頭,除了兩位創辦人之外,唯一可對外代表公司發言的主管。這也是2012年加入DeepMind的黃士傑,第一次公開演講。

回想起兩個月前的最新突破,身為DeepMind第四十號員工的黃士傑,忍不住興奮與激動。該公司投稿《自然》雜誌上的論文,揭露AlphaGO的終極版“AlphaGo Zero”,不再靠人類圍棋知識,就是讓Zero只了解圍棋最基本的規則,自己跟自己左右互奕,從徹底亂下開始,短短四十天,對上曾打敗世界棋王柯潔的舊版Master,已經有超過九成的勝率,打敗圍棋軟件累積十年的歷程。

剛開始時,黃士傑認為Zero絕對贏不了Master。因為他再怎麼想,都想不到如何讓一個程序從零開始學,可以一夕之間贏得了花了十年研發的圍棋軟件?

但Zero進步神速,“三天就走過圍棋幾千年的歷史”,讓黃士傑大為吃驚。但更令人吃驚的在後頭,Zero訓練到21天時,就達到Master的水準,到第40天,就超越了Master。

身為業餘六段棋士,把自己十幾年在圍棋上的研究拿掉,黃士傑自己有什麼感覺?

“如果我阻礙了它,我應該被拿掉,AlphaGo知識中有99%是我做的,那是從師大的研究到現在,這是一個很好的收尾,”黃士傑坦言自己心情很複雜。

DeepMind創辦人迪米斯已經和黃士傑說,AlphaGo完成任務了,“我們要往前看”。

黃士傑還記得2016年底西方同事們都準備要過年了。他剛回到台灣,迪米斯立刻要他低調地去申請網絡帳號,開始上網下棋,匿名挑戰全世界高手。這是AlphaGo Master誕生之始。

在演講現場黃士傑秀出當時的照片,他當時就在自己的房間,桌上放一碗麵,不斷下棋,一天要下十盤。注意力要很集中,十分疲累。

剛開始因為黃士傑用的是新帳號,沒有職業棋士願意和這個無名小卒下棋,但沒想到他一出手就所向披靡,第二天開始,變成許多人登門挑戰。

“當時壓力很大,很怕點錯,或者網路斷線,AlphaGo不能因為我輸掉啊,”黃士傑說。當時Master每一盤都贏,下了六十盤,勝率高達95%,高到黃士傑和團隊一度以為是bug。

用這個新版軟件,今年5月和世界棋王柯潔九段在中國烏鎮對奕。Master毫無意外的完勝。

“但這是一次人機共同探索,AI是人類的工具不是威脅,”黃士傑也強調,這套深期度學習加上強化學習的價值網絡,就是AlphaGo Zero的理論。

這段AlphaGo旅程,對一名台灣土生土長,站上世界科學舞台的工程師而言,簡直像“愛麗絲夢遊仙境”。

然而,業界的人都等著看,圍棋界已無對手的AlphaGo,接下來能否在其他產業大展身手?

AlphaGo母公司DeepMind創辦人兼執行長德米斯也宣布,AlphaGo功成身退,不再比賽。

部份業者甚至持保留意見。例如,一位微軟研發主管接受《天下》採訪時,便酸溜溜的說,“微軟做AI是拿來用的,谷歌做AlphaGo是拿來吹牛的。”他認為,當年IBM的超級電腦深藍,打敗西洋棋棋王后,因為找不到應用,團隊最終解散。負責人許峰雄最後甚至離開了IBM。

而臉書人工智能實驗室負責人、紐約大學終生教授Yann Lecun也曾質疑,AlphaGo可能很難應用到自駕車等熱門領域。

“我們尊重他的看法,我們沒有說它(AlphaGo)可以馬上用到其他領域,但它可以逐漸用到其他領域,”一位聽眾轉述Yann Lecun的質疑時,年輕的黃士傑回答得很小心翼翼。

“AlphaGo Zero主要目標就是證明不需要人類知識,也可以學習的很強。”黃士傑接下來自信的說,“我們要跟大家說,那是有可能的。”

AlphaGo Zero拿掉之前累積的人類智慧,讓AlphaGo了解圍棋最基本的規則。單靠機器的深度學習和強化學習。一切從零開始。

可說就是人類創造的智慧打敗人類智慧與人類直覺。

“最差的狀況也就不過就是IBM當年的狀況,但我不認為AlphaGo會到最壞的狀況,”清大電機系助理教授孫民說。

從應用的角度來看,孫民認為,只要在虛擬世界中可以虛擬的狀況,AlphaGo Zero都可以做。譬如建築設計可以虛擬設計就可以在虛擬環境中測試,硬件測試可以用這樣的工具設計出好的芯片。

這和過去的虛擬3D設計有何不同? “不同就在以前都是人去測試,虛擬軟體告訴你虛擬後的結果,但改model還是人,硬體設計還是人,”孫民分析, “AlphaGo Zero 不需要人,只要告訴我規則和你要的結果, 不需要一個專家或者建築師力學高手, chip設計師, 就可以做出來,”他說。

當然這都還是在虛擬世界中的功能,孫民認為如果在一個環境會變異的實體世界,AlphaGo就還有很多問題需要課服。但可以期待未來的應用與發展。

“我每天上班,每天都在進步,非常愉快,我們團隊的精神很強,有個遠大的目標,”在DeepMind人稱“Aja,阿傑”的黃士傑說。

迪米斯創立Deepmind時,想要做的是通用、強人工智能。AlphaGo還只是一個弱人工智能,還沒有到達什麼都能學的境界。

或許現在也才邁入人工智能啟蒙期的結束,AlphaGo的退役,是另一個新的開始。
0%(0)
0%(0)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制
一周點擊熱帖 更多>>
一周回復熱帖
歷史上的今天:回復熱帖
2016: NFL第10周。乾飯重點晚上拍子海鳥
2015: 看得懂亞洲足球規則的給講講,不算與小
2015: 看得懂亞洲足球規則的給講講,不算與小
2014: TNF: BUF-MIA
2014: 惡補五線譜(不喜請飄過:)
2013: ROX-76ers, No Haden No problem
2013: 折騰一下: 11周票據市場觀察
2012: 關於石頭挨批,元芳,你怎麼看?
2012: 湖人大戰馬刺咋沒人看?