設萬維讀者為首頁 廣告服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:紅樹林
萬維讀者網 > 五 味 齋 > 帖子
中國式思維:人類的尊嚴在下棋
送交者: 溪谷閒人 2017年05月30日16:17:04 於 [五 味 齋] 發送悄悄話



前不久,一個網友,轉貼了一篇中國傻逼文人祁同偉的一篇“雄文”《天局》。把圍棋吹了個神乎其神,不着邊際,通篇胡說八道。一看就知道這位祁某人不怎麼會下圍棋,頂多是個半瓶子醋,越是這類二百五一樣的傢伙,約會神吹神侃,當然了,吹喇叭抬轎子的也不少。

中國的官方媒體,也好不到哪兒去,在最近的所謂“人機圍棋世紀大戰”之前,中國官方開足了馬力,要為“中國人”爭光,說是“為人類的尊嚴而戰”。

參加比賽的中國超一流棋手、世界圍棋冠軍柯潔,在官媒吹捧、萬眾拍馬的氣氛中,自吹自擂,在網上推特中發布豪言壯語,說是“阿法狗勝得了李世石,勝不了我”,這句話讓這位“少年天才”成為超級網紅。更何況,被吹捧為“為祖國而戰”。

可結果呢?三連敗!第三局還是中盤認輸。諸位,棋手要是中盤認輸,那丟人丟大了。更可憐、可嘆的是,對弈途中失控痛哭,您瞧瞧這點兒出息。

不過中國官媒到最後還舔着臉吹牛逼呢,說是:“為祖國而戰,雖敗猶榮”。

下面是一篇轉自“華人生活網”的文章,文章中又轉載了谷歌的研究團隊曾發過的一篇博文,專門介紹阿爾法圍棋所用的算法和策略。供諸位學習學習,提高提高,最起碼,知道“人機對戰”究竟是怎麼回子事兒,少聽那些瞎掰、瞎忽悠。

每一次的人機大賽,都是世紀大戰。

本場比賽,主辦方對於人機大戰獎金的毫不吝嗇——三番棋獲勝方將會獲得150萬美元的獎勵,折合人民幣1000萬左右,而不管勝敗,他們的出場費也高達30萬美元。

世界排名第一的中國圍棋國手柯潔九段,27日與谷歌人工智能系統“阿法狗”(AlphaGo)的第三場對戰也以中盤認輸告終,這位19歲的棋王一度在對弈期間失控痛哭。

去年李世石完敗阿法狗之後,柯潔曾在網上發布豪言說“阿法狗勝得了李世石,勝不了我”,這句話讓這位少年天才成為超級網紅。

當早在預料之中的3:0的比賽結果變為現實的那一刻,所有人都有些絕望了!

中國媒體清一色用了“雖敗猶榮”送給在賽場被AlphaGo虐哭的傲慢天才少年柯潔,把“圍棋上帝”給了“贏了也不會笑的”AlphaGo,這裡面有敬畏,還有一絲不服,人類一直擁有的優越感和尊嚴被他們製造的機器徹底毀滅了。

中國媒體習慣用“為人類尊嚴而戰”這樣的標題來形容,不管是曾經的李世石、古力,還是今日的柯潔,他們都被認為是代表人類出征的戰士。一黑一白的不是棋子,是天人交戰的滾滾戰火,不是你死就是我活。

和去年對陣李世石時不同,在時間分配上,當時李世石對AlphaGo的用時是每方2小時,1分鐘讀秒5次,而此次則是每方用時3小時,1分鐘讀秒5次,增加用時適當地“照顧”了人類棋手。

不過,即使這樣,世界第一柯潔也沒有成為被看好的一方。在前輩古力的眼中,柯潔三番戰贏一盤的可能性僅為10%,而“棋聖”聶衛平更是直言,柯潔能贏一盤就是燒高香了。

在人機大戰中三連敗的柯潔,於賽後的記者會上哽咽著說,“它太冷靜、太完美了,不給你任何希望。我跟它下棋特別痛苦,只能猜它一半的棋,差距太大。這是我與人工智能的最後三盤棋”。“棋聖”聶衛平則表示,AlphaGo的水平至少有20段。

那麼阿爾法圍棋到底是何方神聖?

計算機程序具有擊敗人類的頂尖棋手的能力已經是不爭的事實。其實大多數人不懂“黑暗”的力量有多麼強大。

阿爾法圍棋獲勝的真正秘訣不是硬件,而是在於蒙特卡洛樹搜索(Monte-Carlo Tree Search)的算法。正是這個算法,使得程序具有了自我學習的能力,並且能有效地控制搜索的復性。

上次同李世石比賽的阿法狗使用了1202個CPU和176個GPU,同時可以有40個搜素線程,擁有極為巨大的計算能力。(CPU和GPU之所以大不相同,是由於其設計目標的不同,它們分別針對了兩種不同的應用場景。CPU需要很強的通用性來處理各種不同的數據類型,同時又要邏輯判斷又會引入大量的分支跳轉和中斷的處理。這些都使得CPU的內部結構異常復。而GPU面對的則是類型高度統一的、相互無依賴的大規模數據和不需要被打斷的純淨的計算環境。)

這次,新的阿法狗除了算法上的改進之外,也特別強調了谷歌雲和TPU(向量處理單元)等計算資源上的改進的巨大提升作用。谷歌使用的TPU就是自家開發的Tensor處理器,這是一款具有學習能力的可定製處理器。針對人工智能設計,有更高效的利用率。

這真的不能算是公平的比賽,就像對手裡端着機關槍,柯潔拿的是一把破菜刀。人和起重機舉重哪個牛,古語有云,力舉千斤,一個有力氣的人最多也就能千斤,起重機能舉起多少斤呢,哪個更厲害,明眼人一看就知道。這次比賽說白了就是人和計算機比計算。

谷歌的研究團隊曾發過一篇博文,介紹阿爾法圍棋所用的算法和策略。這也可以讓那些不服氣的棋迷死的明白:以下是原文:

阿爾法圍棋:使用機器學習掌握古老的圍棋

AlphaGo: Mastering the ancient game of Go with Machine Learning

遊戲是測試與人類解決問題方法相似的更聰明,更靈活的算法的一個很好的試驗場。人類很早就開始創造能比最好的人玩遊戲玩的更好的程序 – 作為1952年一個博士生的畢業設計,計算機學會了第一個經典的遊戲 – 玩圈和十字架(noughts and crosses),也稱為tic-tac-toe。接着1994年計算機在跳棋(checkers)上打敗人類高手。

IBM的“深藍”在1997年擊敗國際象棋大師Kasparov曾經轟動一時。計算機的成功並不局限於棋類,IBM的“華生”(Waston)在2011年獲得Jeopardy的冠軍。僅根據原始象素的輸入,谷歌的算法還學會了玩數十種Atari遊戲。

但有一種遊戲一直讓人工智能的企圖遭受挫敗:古老的圍棋。2500年前在中國發明,目前世界範圍下圍棋的人數超過四千萬人。圍棋的規則很簡單:玩家輪流將黑色或白色的棋子放在棋盤上,試圖捕捉對手的棋子或者圍成空地而得分。孔子曾經寫過這個遊戲,它的美感讓它被提升到任何中國學者必需具備的四種技藝之一(琴棋書畫)。下圍棋主要靠直覺和感受,很多世紀以來一直因其精妙博大和思維的深度而讓人們着迷。

但儘管規則很簡單,圍棋其實是極為復的遊戲,圍棋的搜索空間是如此的巨大,是10的100次方倍大於國際象棋的搜索空間 – 這個數字比整個宇宙所有原子的總和還要大。其結果是,傳統的“蠻力”(brute force)人工智能方法 – 構建一個所有可能的下法的搜索樹,這在圍棋上無法做到。迄今為止,電腦下圍棋的水平還是業餘級的。專家預測至少需要10年時間電腦才有可能擊敗頂級專業圍棋手。

我們認為這是一個難以拒絕的挑戰!我們開始構建一個系統,阿爾法圍棋(AlphaGo),來克服種種障礙。AlphaGo程序關鍵是將圍棋巨大的搜索空間減少到可以對付的規模。要做到這一點,它將最先進的樹搜索(tree search)方法同兩個深度神經網絡相結合,每個神經網絡包含很多層的數以百萬計的像神經元樣的聯結。一個神經網絡稱為“策略網絡”(policy network)用來預測下一步的行動,通過只考最有可能導致勝利的下法來縮小搜索範圍。另外一個神經網絡叫“價值網絡”(value network)用於減少搜索樹的深度 – 評估在走每一步贏的可能性,一路搜索到遊戲的結束。

AlphaGo的搜索算法比以前的方法更接近人的思維方法。例如,當“深藍”下棋時,它使用比AlphaGo多數千倍的蠻力搜索。相反,AlphaGo使用一種稱為蒙特卡洛樹搜索(Monte-Carlo Tree Search)在它腦子中一遍又一遍地把剩下的棋下完。同以前的蒙特卡羅程序不同的是,AlphaGo使用深層神經網絡來指導其搜索。在每個模擬遊戲中,策略網絡建議最聰明的下法,而價值網絡則精確地評估下完這步後局面的優劣。最後,AlphaGo選擇在模擬中最成功的下法。

我們首先使用從人類下的棋中的3千萬種常用招法來訓練策略網絡,直到它可以以57%的準確度預測出人類的回應(AlphaGo前之前的紀錄是44%)。但是,我們的目標是擊敗最好的人類棋手,而不僅僅是模仿他們。要做到這一點,AlphaGo必須學會發現新的策略。通過在神經網絡之間下數以千記的棋,並在一種被稱為“強化學習”一個試錯的過程中不斷改進。這種做法導致了更好的策略網絡,這個網絡是如此強大的,即使僅僅是沒有樹搜索的原始的神經網絡就可以打敗最先進的建立龐大的搜索樹的程序。

這些策略網絡再用來訓練價值網絡,同樣是通過自我下棋來學習改進。這些價值網絡可以評估任何圍棋的局面,並計算出最後的優勝者 – 這個任務非常的困難一直被認為是不可能完成的問題。

當然,所有這些都需要巨大的計算能力,所以我們大量使用谷歌雲平台(Google Cloud Platform),這使得做人工智能(AI)和機器學習(ML)的研究人員能按照需求彈性的運用計算、存儲和網絡的能力。此外,用來數量計算的數據流圖的開源庫,如TensorFlow,使研究人員能夠高效地部署多個中央處理器(CPU)或圖像處理器(GPU)來滿足深度學習算法的計算需要。

然而,這一切對我們來說最有意義的是AlphaGo不僅僅手工編寫的規則,建立了一個“專家系統”,而是使用通用的機器學習的技術,通過觀看和自我下棋不斷完善自身。雖然遊戲是開發和快速高效地測試人工智能算法的完美平台,最終我們希望將這些技術應用於重要的現實問題上。因為我們所用的方法是通用的,我們希望有一天它們可以被擴展到幫助我們解決一些社會的最棘手和最緊迫的問題,從氣候建模到復的疾病分析。

…………全文完。

在打敗圍棋界所有人類高手後,AlphaGo獲封史上最年輕圍棋九段,但所有人都知道,人類在棋盤上看到的未來,也許遠遠不如AlphaGo的深。但好在,它的製造公司谷歌宣布,它就不再參與人機大賽了。

AlphaGo的下一個目標是——解決癌症問題。可以看到的是,科學家預測的,人類70%的工作將被人工智能取代並非虛話。


0%(0)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制