設萬維讀者為首頁 廣告服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:紅樹林
萬維讀者網 > 五 味 齋 > 帖子
圍棋的每一步有多少種可能的下法?
送交者: mingcheng99 2021年12月24日12:54:30 於 [五 味 齋] 發送悄悄話

圍棋可能是變化最多最複雜的棋類。 但是,對圍棋的誤解甚多,最出名的就是圍棋有多少種變化?一種簡單的算法是: 

“根據圍棋的行棋規則,其變化是黑白兩子交替選擇的結果,19路標準棋盤一共有361交叉點,第一步有361個點可以選擇,即有361種變化,第二步有360個點……以此類推,其變化應該是361×360×359×……2×1,即361!,約1.43*10的768次方。”

這是一個廣泛流傳的天文數字,但這個算法其實沒有任何實際意義。 在真實下棋的時候,有意義的是圍棋的每一步有多少可能的下法? 這才是棋手,包括AL棋手才需要考慮的問題。 

在關於棋類的AI專業文章裡面,有同樣的誤解, 比如: 

These possible steps increase exponentially as the game goes forward. 

Monte Carlo Tree Search MCTS For Every Data Science Enthusiast

https://towardsdatascience.com/monte-carlo-tree-search-158a917a8baa

其實,隨着對局的深入, 可選擇點是越來越少的。 有人提出可選擇的有效值的概念,https://zhuanlan.zhihu.com/p/95699910 跟我的提法是一樣的。 

他提出第一手棋有55種變化,這個數字差不多。 如果我們從實際對局來看。 第一手棋甚至沒有這麼多。 審閱任意的100局專業棋手對局,你會發現99局第一手的下法不會超出20個選擇。 所以在20裡面選一就好。如果有棋手選了20以外的下法,你甚至不用理會,自己下自己的。 比如說他第一手下在天元或者附近,你根本就不用管,繼續下在角邊,或者下在星位。 開局其實都是定式。 沒有那麼複雜。專業棋手和業餘段位棋手甚至沒有太多區別。

到了中盤,業餘段位棋手往往被專業棋手一擊則潰。這是計算的問題。 業餘棋手的計算一般不超過10步,而且常常錯算。 而專業棋手,頂尖的如李昌鎬,他自己說要算100步。 差了一個數量級,所以一擊則潰。 而計算機算到極致,也只不過是一秒鐘的問題。 所以計算機是不怕算的。  

如果我們一直審閱到終局,我們發現可選擇的有效下法一直在幾十個這樣的數量級,而不會是幾百或幾千,到後來,棋盤上根本就沒有多少地方可以落子了。 

所以,AI只是在幾十個選擇裡面選一個就可以了,不是很難。 但這幾十個選擇如何確定? 就按我上一篇文章的意見就可以。 見, 

淺論如何在AI圍棋中引入數學物理原理。

用專業的語言來說。 At a high-level, all algorithms, both Value-based and Policy-based, have four basic operations that they perform. They start with arbitrary estimates of the quantity they want to find, and then incrementally improve those estimates by getting data from the environment. 

Reinforcement Learning Explained Visually (Part 3): Model-free solutions, step-by-step

https://towardsdatascience.com/reinforcement-learning-explained-visually-part-3-model-free-solutions-step-by-step-c4bbb2b72dcf

不同之處在於,我們實際上是在Model-free 方法裡面混合了, Model-based (aka Planning) 方法,利用一定的數學物理方法作為我們的 strategy 來選擇最佳落子的第一步,再做計算。 

很奇怪的是,千千萬萬的圍棋書,包括AI的圍棋書,沒有一本談到數學。其實圍棋就是數學,第一手為什麼下在三路,因為圍出一個眼,至少要三路。 但從來沒有人談到過這點。


Refrences:

Reinforcement Learning Made Simple (Part 1): Intro to Basic Concepts and TerminologyA Gentle Guide to applying Markov Decision Processes, in Plain English

https://towardsdatascience.com/reinforcement-learning-made-simple-part-1-intro-to-basic-concepts-and-terminology-1d2a87aa060


 





0%(0)
  ==============  /無內容 - mingcheng99 12/24/21 (123)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制