| Info |
| 送交者: mingcheng99 2021年12月16日23:42:22 于 [五 味 斋] 发送悄悄话 |
|
浅论如何在AI围棋中引入数学物理原理。 AlphaGO是出名的AI围棋程序,称霸世界,所向无敌。 也是AI应用的一个重要成果。从研究AlphaGO过程中得到一个想法是:如何在AI中应用数学物理原理。 我们先来看看AplphaGO 怎么下棋。 根据DeepMind 在“自然”上的文章。AplphaGO应用了 Monte-Carlo tree search 和 the neural networks. Monte-Carlo tree基本是数据搜索,就是简单的大数据应用。 这个数据随着下棋的数量不断增加和优化。 这些也可以看成是一种普适的和简单的数学物理应用,但这两者一般归在IT领域,或AI领域。 AI最主要的特点就是学习和进化,而非具体的IT应用。 从逻辑上说,AlphaGO用的还是围棋界的传统逻辑,从下棋经验中学习形势判断和生死定式。从大量对局中学习,从而总结最佳选择。而实际上依靠的是计算机的计算能力和大数据优势,AI实际上只是做了优化。让AlphaGO立于不败之地。 关于这个我们以后还要详细述说。简单说来,在确定了一步新手之后,计算机很容易判断这是不是好手,但可以选择的点太多,不能一个一个地去试。实际上棋手在下棋的时候,他也自动地忽略了大多数点。 今天主要是想想谈谈一种新的思路,将数学物理原理引入AI。 用以选择可能的落点,这样所选择的范围就大大减少。 引入数学物理原理,也需要计算,但与棋手下棋凭感觉不同。所谓的棋感,这AlphaGO是不会有的。棋感, 棋手可以一看局面可以立即得到,而AlphaGO需要计算。 举例说明,在AlphaGO对战顶尖棋手柯洁时候,曾经下出一手五路尖压。 被誉为天外飞来之手。 因为位置太高, 一般棋手不会那么下。但实际上五路尖和四路尖没有优劣之分。这取决于以后的下法、只是所需要的计算多一点,所以棋手习惯上不这么下而已。 如同吴清源第三手落天元,其他棋手都不这样下。 吴清源当时这样下, 被视为对名人的不尊敬, 同样,计算机也不会有这样的心理,除非你放hard code 进去: 见了很有名的对手要尊重,计算机是不管对手的。 但是,如果我们从数学的角度考虑,这样下并非不可。 如果我们根据一条简单的数学原理,让落子落在最占空间之处,但又与原来的落子有最大关联。这是可以具体计算的,落在五路就比四路要好。落在天元最占空间,但离开其他落子甚远。 那么,我们如何选择合适的数学物理原理呢? 有一个简单的办法,就是把高手的对局复盘,从中找出一定的数学规律。比如我们上面所说的最大空间和最多关联。是不是合理? 可以验证。 但文章没有谈到围棋的具体逻辑如何与Monte-Carlo tree 和网络结合,其实这才是最重要的。Monte-Carlo tree search 和都是具体的技术层面。任何AI程序都可以应用。 下面我们审视一下棋手下棋的过程和思考。AI程序其实就是模仿这个过程和思考。 理解得越清楚,越不难模仿。 下棋,无非就是两种思考,形势判断,和生死判断, 形势判断,细节上,以前的旧式软件都可以做的很好,虽然越开始越难,在中局以前比较不容易做判断。 但同时形势好坏不是那么确定。 生死判断基本是定式,是计算机的强项。 下棋就是对对手的棋做出回应, 根据对手的棋来决定,这也是AI需要下大量的棋的一个原因。 第一,生死判断,有没有影响到自己的棋的生死。 有的话做出回应。 需要摆棋 第二, 没有影响生死,对方在扩大势力。 对比对方原来的势力和下了新手后的势力,可以看出对方的势力增加在那里(这一点容易做到),找出应手,这一点就是AI需要做的。 这也要对比自己原来的势力和下了新手后的势力。 也要摆棋。 关键在于如何学习。 复盘是学习的最好方法。 复盘高手的棋。 AI如何从复盘中学习? |
|
![]() |
![]() |
| 实用资讯 | |
|
|
| 一周点击热帖 | 更多>> |
| 一周回复热帖 |
| 历史上的今天:回复热帖 |
| 2020: | 皮肤,大家对你的愤怒不是黑川,而是川 | |
| 2020: | 从电视剧《装台》想起的一件事 | |
| 2019: | 十年了,上海出来遛遛? | |
| 2019: | 那些住在海外天天骂美国的注意了 | |
| 2018: | 老中,老外,和放火的房东 | |
| 2018: | 孟晚舟我们已经输了 | |
| 2017: | 雪夜 | |
| 2017: | 天下丐帮聚京师 | |
| 2016: | 逸草:曾在某论坛被打假的趣事 | |
| 2016: | 日俄终止敌对状态了。日美俄要联手整习 | |




