【人工智能Alphago背后的秘密】全网最全面的蒙特卡洛树搜索算法讲解：系统、简洁、易懂！

2024-02-12 15:20:01
开发
49

本文力求做到系统、准确、简洁、易懂的讲解蒙特卡洛搜索树算法，为此参考了大量资料和文章。

前言

人工智能Alphago，成为最顶尖的围棋大师，不由得让人产生探索它背后的算法的兴趣。

在搜索空间巨大的围棋问题中，Alphago是通过什么算法能在较短的时间搜索每一个局面的（近似）最优解？

Alphago使用的算法如下：

蒙特卡洛树搜索
残余卷积神经网络 - 用于游戏评估和移动先验概率估计的策略和价值网络
用于通过自我游戏训练网络的强化学习

蒙特卡洛树搜索的适用范围

蒙特卡洛树搜索算法本质上是一种启发式搜索算法。

通过蒙特卡洛方法设计出较为准确的估价函数，使得问题在仅需迭代较少的次数就能得出（近似）最优解。

通常，在博弈问题中可以采用蒙特卡洛数搜索。

对于以下情况特别适用：

搜索空间特别大。
难以采用传统方法（如：dp，贪心）直接设计出特别通用的估价函数（比如围棋）。

蒙特卡洛树搜索的作用

要先明确算法有什么作用：

蒙特卡洛树算法用于求当前局面如何决策是最优的。

在围棋中，每次再对手走完一步新局面产生的时候，都要重新运行蒙特卡洛树算法找出面对当前局面自己的最优解。

算法流程

前置：蒙特卡洛方法

用途：评估当前局面选取哪个决策最优

以围棋为例，难以直接用传统的dp，贪心等方法设计出估价函数。

这时可以采用蒙特卡洛方法：

对于每个局面，随机轮流走棋，直到最后定出胜负。

在随机走大量次数的时候，取获胜次数最多的。

这时一个正确性难以保证的伪算法：

对于某个局面的某步决策，如果对方有几乎所有情况都将处于劣势，但是只要有一种情况必胜，那么这样的决策是绝对不可能采取的。

但是直接采用上面的蒙特卡洛方法恰恰容易采取这样的决策，因为这种决策胜率特别高。

流程

算法的设计思路：

类似人的下棋思维，在考虑

原文地址:https://blog.csdn.net/m0_56602010/article/details/136061301 本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：https://www.suanlizi.com/kf/1756941207927394304.html 如若内容造成侵权/违法违规/事实不符，请联系《酸梨子》网邮箱：1419361763@qq.com进行投诉反馈，一经查实，立即删除！

阅读全部

最近更新

题解 - 序列

2024-02-12 15:20:01 122 阅读
CST热仿真案例——电动车直流快充Cable热仿真

2024-02-12 15:20:01 109 阅读
docker php8.1+nginx base 镜像 dockerfile 配置

2024-02-12 15:20:01 98 阅读
Could not load dynamic library ‘cudart64_100.dll‘

2024-02-12 15:20:01 106 阅读
NoSQL之Redis非关系型数据库

2024-02-12 15:20:01 108 阅读
2024.7.22 作业

2024-02-12 15:20:01 106 阅读
GDB调试正在运行的程序

2024-02-12 15:20:01 87 阅读
昇思25天学习打卡营第18天| DCGAN生成漫画头像

2024-02-12 15:20:01 90 阅读
在Django里面运行非项目文件

2024-02-12 15:20:01 87 阅读
SSD基本架构与工作原理

2024-02-12 15:20:01 95 阅读
在誉天学习完HCIE就业吗？

2024-02-12 15:20:01 98 阅读
【合同专题】合同终止协议书、项目合作协议、交底纪要、管理台账

2024-02-12 15:20:01 90 阅读
驾驭云原生日志洪流：高效分析与管理的策略集

2024-02-12 15:20:01 92 阅读
go 协程池的实现

2024-02-12 15:20:01 93 阅读
Shell脚本循环语句与函数

2024-02-12 15:20:01 96 阅读
连锁店收银系统源码（收银称重pos+聚合支付+ERP进销存+营销+会员管理）

2024-02-12 15:20:01 98 阅读
TIA博途V19无法勾选来自远程对象的PUT/GET访问的解决办法

2024-02-12 15:20:01 90 阅读
四大引用——强软弱虚

2024-02-12 15:20:01 92 阅读
Python语言-面向对象

2024-02-12 15:20:01 96 阅读
如何分清楚常见的 Git 分支管理策略Git Flow、GitHub Flow 和 GitLab Flow

2024-02-12 15:20:01 91 阅读
网站安全-CDN篇

2024-02-12 15:20:01 94 阅读