Info-五味斋-万维论坛-万维读者网（电脑版）

送交者: mingcheng99 2021年12月16日23:42:22 于 [五味斋] 发送悄悄话

浅论如何在AI围棋中引入数学物理原理。

AlphaGO是出名的AI围棋程序，称霸世界，所向无敌。也是AI应用的一个重要成果。从研究AlphaGO过程中得到一个想法是：如何在AI中应用数学物理原理。

我们先来看看AplphaGO 怎么下棋。

根据DeepMind 在“自然”上的文章。AplphaGO应用了 Monte-Carlo tree search 和 the neural networks. Monte-Carlo tree基本是数据搜索，就是简单的大数据应用。这个数据随着下棋的数量不断增加和优化。这些也可以看成是一种普适的和简单的数学物理应用，但这两者一般归在IT领域，或AI领域。

AI最主要的特点就是学习和进化，而非具体的IT应用。

从逻辑上说，AlphaGO用的还是围棋界的传统逻辑，从下棋经验中学习形势判断和生死定式。从大量对局中学习，从而总结最佳选择。而实际上依靠的是计算机的计算能力和大数据优势，AI实际上只是做了优化。让AlphaGO立于不败之地。关于这个我们以后还要详细述说。简单说来，在确定了一步新手之后，计算机很容易判断这是不是好手，但可以选择的点太多，不能一个一个地去试。实际上棋手在下棋的时候，他也自动地忽略了大多数点。

今天主要是想想谈谈一种新的思路，将数学物理原理引入AI。用以选择可能的落点，这样所选择的范围就大大减少。引入数学物理原理，也需要计算，但与棋手下棋凭感觉不同。所谓的棋感，这AlphaGO是不会有的。棋感, 棋手可以一看局面可以立即得到，而AlphaGO需要计算。

举例说明，在AlphaGO对战顶尖棋手柯洁时候，曾经下出一手五路尖压。被誉为天外飞来之手。因为位置太高，一般棋手不会那么下。但实际上五路尖和四路尖没有优劣之分。这取决于以后的下法、只是所需要的计算多一点，所以棋手习惯上不这么下而已。如同吴清源第三手落天元，其他棋手都不这样下。吴清源当时这样下，被视为对名人的不尊敬，同样，计算机也不会有这样的心理，除非你放hard code 进去: 见了很有名的对手要尊重，计算机是不管对手的。

但是，如果我们从数学的角度考虑，这样下并非不可。如果我们根据一条简单的数学原理，让落子落在最占空间之处，但又与原来的落子有最大关联。这是可以具体计算的，落在五路就比四路要好。落在天元最占空间，但离开其他落子甚远。

那么，我们如何选择合适的数学物理原理呢？有一个简单的办法，就是把高手的对局复盘，从中找出一定的数学规律。比如我们上面所说的最大空间和最多关联。是不是合理？可以验证。

但文章没有谈到围棋的具体逻辑如何与Monte-Carlo tree 和网络结合，其实这才是最重要的。Monte-Carlo tree search 和都是具体的技术层面。任何AI程序都可以应用。

下面我们审视一下棋手下棋的过程和思考。AI程序其实就是模仿这个过程和思考。理解得越清楚，越不难模仿。

下棋，无非就是两种思考，形势判断，和生死判断，

形势判断，细节上，以前的旧式软件都可以做的很好，虽然越开始越难，在中局以前比较不容易做判断。但同时形势好坏不是那么确定。

生死判断基本是定式，是计算机的强项。

下棋就是对对手的棋做出回应，根据对手的棋来决定，这也是AI需要下大量的棋的一个原因。

第一，生死判断，有没有影响到自己的棋的生死。有的话做出回应。需要摆棋

第二，没有影响生死，对方在扩大势力。对比对方原来的势力和下了新手后的势力，可以看出对方的势力增加在那里（这一点容易做到），找出应手，这一点就是AI需要做的。这也要对比自己原来的势力和下了新手后的势力。也要摆棋。

关键在于如何学习。复盘是学习的最好方法。复盘高手的棋。 AI如何从复盘中学习？

0%(0)

	实用资讯

回国机票$360起 | 商务舱省$200 | 全球最佳航空公司出炉：海航获五星
海外华人福利！在线看陈建斌《三叉戟》热血归回豪情筑梦 高清免费看无地区限制

一周点击热帖

更多>>

一周回复热帖

历史上的今天：回复热帖

2020:	皮肤，大家对你的愤怒不是黑川，而是川
2020:	从电视剧《装台》想起的一件事
2019:	十年了，上海出来遛遛？
2019:	那些住在海外天天骂美国的注意了
2018:	老中，老外，和放火的房东
2018:	孟晚舟我们已经输了
2017:	雪夜
2017:	天下丐帮聚京师
2016:	逸草：曾在某论坛被打假的趣事
2016:	日俄终止敌对状态了。日美俄要联手整习