黃博士首度說明AlphaGo為何退役(ZT) |
送交者: Mayi 2017年11月13日16:03:36 於 [競技沙龍] 發送悄悄話 |
沒有人會否認,過去一年來炒熱全球AI的熱源頭,正是AlphaGo。很少人知道,AlphaGo裡頭九成的軟件都是一個台灣工程師黃士傑負責。11月10日,衣錦還鄉的黃士傑,首度在中研院人工智能年會,說清楚AlphaGo的過去與未來。
“這五年,我也沒有想過會做出AlphaGo,團隊的精神很強,有個遠大的目標。”AlphaGo首席工程師黃士傑語說。 十一月十日,中研院人文館“人工智能年會”大會議室已經擠滿人。這天是全球人工智能AI象徵“AlphaGo”幕後重要操盤手,黃士傑衣錦返鄉的日子。他是DeepMind裡頭,除了兩位創辦人之外,唯一可對外代表公司發言的主管。這也是2012年加入DeepMind的黃士傑,第一次公開演講。 回想起兩個月前的最新突破,身為DeepMind第四十號員工的黃士傑,忍不住興奮與激動。該公司投稿《自然》雜誌上的論文,揭露AlphaGO的終極版“AlphaGo Zero”,不再靠人類圍棋知識,就是讓Zero只了解圍棋最基本的規則,自己跟自己左右互奕,從徹底亂下開始,短短四十天,對上曾打敗世界棋王柯潔的舊版Master,已經有超過九成的勝率,打敗圍棋軟件累積十年的歷程。 剛開始時,黃士傑認為Zero絕對贏不了Master。因為他再怎麼想,都想不到如何讓一個程序從零開始學,可以一夕之間贏得了花了十年研發的圍棋軟件? 但Zero進步神速,“三天就走過圍棋幾千年的歷史”,讓黃士傑大為吃驚。但更令人吃驚的在後頭,Zero訓練到21天時,就達到Master的水準,到第40天,就超越了Master。 身為業餘六段棋士,把自己十幾年在圍棋上的研究拿掉,黃士傑自己有什麼感覺? “如果我阻礙了它,我應該被拿掉,AlphaGo知識中有99%是我做的,那是從師大的研究到現在,這是一個很好的收尾,”黃士傑坦言自己心情很複雜。 DeepMind創辦人迪米斯已經和黃士傑說,AlphaGo完成任務了,“我們要往前看”。 黃士傑還記得2016年底西方同事們都準備要過年了。他剛回到台灣,迪米斯立刻要他低調地去申請網絡帳號,開始上網下棋,匿名挑戰全世界高手。這是AlphaGo Master誕生之始。 在演講現場黃士傑秀出當時的照片,他當時就在自己的房間,桌上放一碗麵,不斷下棋,一天要下十盤。注意力要很集中,十分疲累。 剛開始因為黃士傑用的是新帳號,沒有職業棋士願意和這個無名小卒下棋,但沒想到他一出手就所向披靡,第二天開始,變成許多人登門挑戰。 “當時壓力很大,很怕點錯,或者網路斷線,AlphaGo不能因為我輸掉啊,”黃士傑說。當時Master每一盤都贏,下了六十盤,勝率高達95%,高到黃士傑和團隊一度以為是bug。 用這個新版軟件,今年5月和世界棋王柯潔九段在中國烏鎮對奕。Master毫無意外的完勝。 “但這是一次人機共同探索,AI是人類的工具不是威脅,”黃士傑也強調,這套深期度學習加上強化學習的價值網絡,就是AlphaGo Zero的理論。 這段AlphaGo旅程,對一名台灣土生土長,站上世界科學舞台的工程師而言,簡直像“愛麗絲夢遊仙境”。 然而,業界的人都等著看,圍棋界已無對手的AlphaGo,接下來能否在其他產業大展身手? AlphaGo母公司DeepMind創辦人兼執行長德米斯也宣布,AlphaGo功成身退,不再比賽。 部份業者甚至持保留意見。例如,一位微軟研發主管接受《天下》採訪時,便酸溜溜的說,“微軟做AI是拿來用的,谷歌做AlphaGo是拿來吹牛的。”他認為,當年IBM的超級電腦深藍,打敗西洋棋棋王后,因為找不到應用,團隊最終解散。負責人許峰雄最後甚至離開了IBM。 而臉書人工智能實驗室負責人、紐約大學終生教授Yann Lecun也曾質疑,AlphaGo可能很難應用到自駕車等熱門領域。 “我們尊重他的看法,我們沒有說它(AlphaGo)可以馬上用到其他領域,但它可以逐漸用到其他領域,”一位聽眾轉述Yann Lecun的質疑時,年輕的黃士傑回答得很小心翼翼。 “AlphaGo Zero主要目標就是證明不需要人類知識,也可以學習的很強。”黃士傑接下來自信的說,“我們要跟大家說,那是有可能的。” AlphaGo Zero拿掉之前累積的人類智慧,讓AlphaGo了解圍棋最基本的規則。單靠機器的深度學習和強化學習。一切從零開始。 可說就是人類創造的智慧打敗人類智慧與人類直覺。 “最差的狀況也就不過就是IBM當年的狀況,但我不認為AlphaGo會到最壞的狀況,”清大電機系助理教授孫民說。 從應用的角度來看,孫民認為,只要在虛擬世界中可以虛擬的狀況,AlphaGo Zero都可以做。譬如建築設計可以虛擬設計就可以在虛擬環境中測試,硬件測試可以用這樣的工具設計出好的芯片。 這和過去的虛擬3D設計有何不同? “不同就在以前都是人去測試,虛擬軟體告訴你虛擬後的結果,但改model還是人,硬體設計還是人,”孫民分析, “AlphaGo Zero 不需要人,只要告訴我規則和你要的結果, 不需要一個專家或者建築師力學高手, chip設計師, 就可以做出來,”他說。 當然這都還是在虛擬世界中的功能,孫民認為如果在一個環境會變異的實體世界,AlphaGo就還有很多問題需要課服。但可以期待未來的應用與發展。 “我每天上班,每天都在進步,非常愉快,我們團隊的精神很強,有個遠大的目標,”在DeepMind人稱“Aja,阿傑”的黃士傑說。 迪米斯創立Deepmind時,想要做的是通用、強人工智能。AlphaGo還只是一個弱人工智能,還沒有到達什麼都能學的境界。 或許現在也才邁入人工智能啟蒙期的結束,AlphaGo的退役,是另一個新的開始。 |
|
|
|
|
實用資訊 | |
|
|
一周點擊熱帖 | 更多>> |
|
|
一周回復熱帖 |
|
|
歷史上的今天:回復熱帖 |
2016: | NFL第10周。乾飯重點晚上拍子海鳥 | |
2015: | 看得懂亞洲足球規則的給講講,不算與小 | |
2015: | 看得懂亞洲足球規則的給講講,不算與小 | |
2014: | TNF: BUF-MIA | |
2014: | 惡補五線譜(不喜請飄過:) | |
2013: | ROX-76ers, No Haden No problem | |
2013: | 折騰一下: 11周票據市場觀察 | |
2012: | 關於石頭挨批,元芳,你怎麼看? | |
2012: | 湖人大戰馬刺咋沒人看? | |