极小极大搜索的个人理解（alpha-beta剪枝）

极小极大搜索的算法过程：

参考文档：http://www.xqbase.com/computer/search_minimax.htm （经典）

　　主要思想比较简单，但说清楚也不大容易。其核心思想是通过对于以后的状态进行预见式的暴搜，对可能的状态进行分析。理论上，如果能够搜索到最终状态，那么之后的走法都已经是确定的了。（这个地方觉得有些糊涂）

　　对于局面形式的估计首先需要一个合理的估价函数。实际上是因为真正的搜索几乎都是无法搜索到所有的可能性，否则完全用0和1就能表示当前局面的胜负态了。所以需要对局面进行较为合理的分析估价。对于某一方来说都是要使得最终局面状态值（理论上，最终局面状态有且仅有一个）获得最大，所以对于两方来说，可以通过一方估价正越大表示胜率越大，另一方估价正越小（负越大）表示胜率越大。

　　因此出现了极小极大搜索算法。

　　从最简单的情况开始分析，首先确定我方要使得最终局面估价最大，而非当前局面估价最大，所以需要预测下一个我方局面的估价如何。而在此之前的一步掌握权在对方的手上，自然会选择对他有利的状态（一定是最终局面形式最大的状态走法），也就是走对于对方最终局面估价最大的状态。因此我方的落子是根据所有下一个状态对方会如何走来决定的。最终局面估价是双方共同决定的。

　　（常常会被Min和Max状态搞乱，其实不要管这个，花时间弄明白其中的含义，写出来自然能够明白（其实Min()表示走到当前可预见的最后的状态的最小值，Max()反之））

伪代码如下：

int MinMax(int depth) {

　if (SideToMove() == WHITE) {　// 白方是“最大”者

　　return Max(depth);

　} else {　　　　　　　　　　　// 黑方是“最小”者

　　return Min(depth);

　}

}

　

int Max(int depth) {

　int best = -INFINITY;

　if (depth <= 0) {

　　return Evaluate();

　}

　GenerateLegalMoves();

　while (MovesLeft()) {

　　MakeNextMove();

　　val = Min(depth - 1);

　　UnmakeMove();

　　if (val > best) {

　　　best = val;

　　}

　}

　return best;

}

　

int Min(int depth) {

　int best = INFINITY;　// 注意这里不同于“最大”算法

　if (depth <= 0) {

　　return Evaluate();

　}

　GenerateLegalMoves();

　while (MovesLeft()) {

　　MakeNextMove();

　　val = Max(depth - 1);

　　UnmakeMove();

　　if (val < best) { 　// 注意这里不同于“最大”算法

　　　best = val;

　　}

　}

　return best;

}

一个简便的实现方法，通过来回正负的变化来减少代码量，便于维护。

int NegaMax(int depth) {

　int best = -INFINITY;

　if (depth <= 0) {

　　return Evaluate();

　}

　GenerateLegalMoves();

　while (MovesLeft()) {

　　MakeNextMove();

　　val = -NegaMax(depth - 1); // 注意这里有个负号。

　　UnmakeMove();

　　if (val > best) {

　　　best = val;

　　}

　}

　return best;

}

剪枝方法也有很多，最经典的莫过于alpha-beta剪枝了。

参考文档：http://www.xqbase.com/computer/search_alphabeta.htm

　　1）β剪枝：

　　说的通俗一些，比如当前是我方下子，并且下一个我方局面的估价已经完成（递归），即博弈树的第三层已经预知。中间第二层即对方局面，可知对方走的必然是使得最终局面估价最小的一步，故我方当前要下子显然要使得在对方走估价最小的一步能达到的最大的估价。也就是第一层选取的走法是走向第二层每一个局面对应的最小最终估价走法到达的最大的局面。

　　实现中，你实际上不是站在第一层的视角来看，而是在第二层搜索时进行的，故需要保留第一层已经搜索的最大值，而对于第二层的对手来说，我们是敌人。从上帝视角来看，alpha值为当前棋手预估的最终估价的最大值，beta值为上一个局面（实际上先前那个局面还没下，保留对于先前那个局面）对手棋手预估的最终估价的最小值。也就是如果当前走法能够走到比先前那个局面的棋手预估的最终估价的最小值要大（对手显然不会走这步，因为至少估价比当前小），就直接返回（因为对手不会让你走到这个状态，所以之后怎么走都不用管了）。

　　2) α剪枝：即相反的情况。

伪代码如下：

int AlphaBeta(int depth, int alpha, int beta) {

　if (depth == 0) {

　　return Evaluate();

　}

　GenerateLegalMoves();

　while (MovesLeft()) {

　　MakeNextMove();

　　val = -AlphaBeta(depth - 1, -beta, -alpha);

　　UnmakeMove();

　　if (val >= beta) {

　　　return beta;

　　}

　　if (val > alpha) {

　　　alpha = val;

　　}

　}

　return alpha;

}

极小极大搜索的个人理解（alpha-beta剪枝）的更多相关文章

Triangle War POJ - 1085 极小极大搜索
参考链接:https://www.cnblogs.com/nwpuacmteams/articles/5697873.html 极小极大搜索的个人理解(alpha-beta剪枝):https://w ...
极小极大搜索方法、负值最大算法和Alpha-Beta搜索方法
1. 极小极大搜索方法一般应用在博弈搜索中,比如:围棋,五子棋,象棋等.结果有三种可能:胜利.失败和平局.暴力搜索,如果想通过暴力搜索,把最终的结果得到的话,搜索树的深度太大了,机器不能满足, ...
转：极小极大搜索方法、负值最大算法和Alpha-Beta搜索方法
转自:极小极大搜索方法.负值最大算法和Alpha-Beta搜索方法 1. 极小极大搜索方法一般应用在博弈搜索中,比如:围棋,五子棋,象棋等.结果有三种可能:胜利.失败和平局.暴力搜索,如果想通 ...
软件发布版本区别介绍-Alpha,Beta,RC,Release
Alpha: Alpha是内部测试版,一般不向外部发布,会有很多Bug.除非你也是测试人员,否则不建议使用. 是希腊字母的第一位,表示最初级的版本 alpha就是α,beta就是β alpha版就是比 ...
软工+C(4): Alpha/Beta换人
// 上一篇:超链接 // 下一篇:工具和结构化注:在一次软件工程讨论课程进度设计的过程中,出现了这个关于 Alpha/Beta换人机制的讨论,这个机制在不同学校有不同的实施,本篇积累各方观点,持续 ...
软工+C(2017第4期) Alpha/Beta换人
// 上一篇:超链接 // 下一篇:工具和结构化注:在一次软件工程讨论课程进度设计的过程中,出现了这个关于 Alpha/Beta换人机制的讨论,这个机制在不同学校有不同的实施,本篇积累各方观点,持续 ...
K 班1-7,alpha,beta 作业成绩汇总
K 班1-7,alpha,beta 作业成绩汇总千帆竞发详细得分短学号名 1 2 3 4 5 6 7 alpha beta TOTAL 505 基智 4.55 1 -2 0 0 -10 4.3 ...
软件版本GA,RC,alpha,beta含义
软件版本GA,RC,alpha,beta含义 (1)RC:(Release Candidate) Candidate是候选人的意思,用在软件上就是候选版本.Release.Candidate.就是发行 ...
扩增子分析解读6进化树 Alpha Beta多样性
分析前准备 # 进入工作目录 cd example_PE250 上一节回顾:我们的OTU获得了物种注释,并学习OTU表的各种操作————添加信息,格式转换,筛选信息. 接下来我们学习对OTU序列的 ...

随机推荐

Windows server 2003 伪静态配置方法
Windows server 2003 伪静态配置方法先我们下载Rewrite伪静态组件到服务器,然后解压到D:\Rewrite下,解压后如下图: 提示:ReWrite组件所在目录要有网站所有者 ...
Python3 安装第三方包
打开cmd(切记是cmd,不是Python3.6那个敲代码环境)输入 pip3 install numpy 即可(安装numpy包)
Java-线程池专题（什么是线程池，如何使用，为什么要用）
1.什么是线程池: java.util.concurrent.Executors提供了一个 java.util.concurrent.Executor接口的实现用于创建线程池多线程技术主要解决处理 ...
JVM 内存知识总结
本文主要参考内容: http://hllvm.group.iteye.com/group/wiki/3053-JVM http://my.oschina.net/xishuixixia/blog/13 ...
mysql 手动安装和管理
版本:5.7.10 my.ini简单配置 [client] default-character-set=utf8 [mysqld] port = 3306 basedir =D:/programs/M ...
Android事件处理下（按键、触摸屏和滚动球的一些实现细节)
http://www.cnblogs.com/andtt/articles/2145563.html 对于按键事件,调用mDevices[i]->layoutMap->map进行映射.映射 ...
【Python】错误、调试和测试
链接到错误处理链接到调试链接到单元测试链接到文档测试 [错误处理] 小结:遇到错误怎么办? 1.不理它. 2.捕获它,再抛出. 3.捕获并处理错误. raise 不懂如何处理错误就直接抛出(ra ...
20135320赵瀚青LINUX内核分析第三周学习笔记
赵瀚青原创作品转载请注明出处<Linux内核分析>MOOC课程http://mooc.study.163.com/course/USTC-1000029000 概述本周是学习的主要是构造 ...
c#结构体和字节流之间的相互转换
结构体转byte数组 1 首先要明白 ,是在那个命名空间下 System.Runtime.InteropServices; 2 首先得到结构体的大小 2 开辟相应的内存空间 3 将结构体填 ...
vscode调试pomelo和pomelo使用vscode调试
使用vscode 通过端口remote attach进行调试 pomelo. 0. 网上好多调试pomelo的都是webstorm.或者vscode调试node的教程.但没找到vscode调试pome ...

极小极大搜索 的个人理解（alpha-beta剪枝）

极小极大搜索 的个人理解（alpha-beta剪枝）的更多相关文章

随机推荐

热门专题

极小极大搜索的个人理解（alpha-beta剪枝）

极小极大搜索的个人理解（alpha-beta剪枝）的更多相关文章