新手立体四子棋AI教程(3)——极值搜索与Alpha-Beta剪枝
上一篇我们讲了评估函数,这一篇我们来讲讲立体四子棋的搜索函数。
一、极值搜索
极值搜索是game playing领域里非常经典的算法,它使用深度优先搜索(因为限制最大层数,所以也可以称为迭代加深搜索)来遍历未来n步的走子情况。在每层模拟中都会选择对自己最优的位置,通过最大化自己的利益(也就是上一篇提到的评估算法)来取胜。α-β剪枝也是类似的思想,只不过效率更高,因为它删减了一些不需要遍历的结点。
下图是一个极小极大算法的例子,MAX层代表自己,总是选取下面三个结点中的最大值,MIN层代表对手,总是选取下面一层结点中的最小值。在此例子中,MAX下一步会选择a1。

Minimax的伪代码如下(递归实现):
function minimax(node, depth) // 指定当前节点和搜索深度
// 如果能得到确定的结果或者深度为零,使用评估函数返回局面得分
if node is a terminal node or depth =
return the heuristic value of node
// 如果轮到对手走棋,是极小节点,选择一个得分最小的走法
if the adversary is to play at node
let α := +∞
foreach child of node
α := min(α, minimax(child, depth-))
// 如果轮到我们走棋,是极大节点,选择一个得分最大的走法
else {we are to play at node}
let α := -∞
foreach child of node
α := max(α, minimax(child, depth-))
return α;
二、实现
首先我们声明可能会用到的函数:
int dfs(int board[][][], int deep = );
int findWhiteScoreMaxValue(int board[][][],int deep);
int findWhiteScoreMinValue(int board[][][],int deep);
dfs函数是我们函数对外调用的接口,也是DFS搜索的启动函数。接下来的搜索为了避免混乱,我们都将白方考虑为自己。
findWhiteScoreMaxValue(board, deep);
在dfs函数中中我们通过上述语句开始搜索。
int ChessBoard::findWhiteScoreMaxValue(int board[][][], int deep)
{if(deep <= )
{
int score = getSideScore(board, chessPicesStatus::white) -
getSideScore(board, chessPicesStatus::black);
return score;
}
else
{
int maxVal = -;
PicesPosList list = getAvailablePos(board,chessPicesStatus::white);
for(auto iter = list.begin();iter != list.end();iter++)
{
board[iter->x][iter->y][iter->z] = chessPicesStatus::white;
int val = findWhiteScoreMinValue(board, deep -);
if(val > maxVal)
{
maxVal = val;
whiteTargetPos.x = iter->x;
whiteTargetPos.y = iter->y;
whiteTargetPos.z = iter->z;
}
board[iter->x][iter->y][iter->z] = chessPicesStatus::empty;
} return maxVal;
}
}
在上述代码中,我们首先判断是不是叶子节点,如果是则直接返回当前的结果,如果不是,开始下一步迭代。
在迭代中,我们用第一篇介绍过的方法,产生当前所有可能的落子位置,然后在每个位置下棋,进入Min层(对手走子)的搜索,在当前节点所有可能性搜索完毕后,判断当前节点是否是最大节点,如果是则保存当前最大值以及走子位置,如果不是则继续搜索下一个位置。Min层与Max大部分代码一致,此处不再贴出。
三、Alpha-Beta剪枝算法
在大部分棋类AI中,剪枝是必须的。假设我们计算未来六步的结果,也就是六层的迭代,每层都有16中可能性,那么节点数量将达到16^6=16,777,216个,耗时极大,实际上最好一步能控制在 5 秒 以内。顺便说一下层数的问题,首先思考层数必须是偶数。因为奇数节点是AI,偶数节点是玩家,如果AI下一个子不考虑玩家防守一下,那么这个估分明显是有问题的。然后,至少需要进行4层思考,如果连4四层都考虑不到,那就是只看眼前利益,那么棋力会非常非常弱。 如果能进行6层思考基本可以达到随便赢普通玩家的水平了。
Alpha Beta 剪枝算法的基本依据是:棋手不会做出对自己不利的选择。依据这个前提,如果一个节点明显是不利于自己的节点,那么就可以直接剪掉这个节点。
前面讲到过,AI会在MAX层选择最大节点,而玩家会在MIN层选择最小节点。那么如下两种情况就是分别对双方不利的选择:
- 在MAX层,假设当前层已经搜索到一个最大值 X, 如果发现下一个节点的下一层(也就是MIN层)会产生一个比X还小的值,那么就直接剪掉此节点。
解释一下,也就是在MAX层的时候会把当前层已经搜索到的最大值X存起来,如果下一个节点的下一层会产生一个比X还小的值Y,那么之前说过玩家总是会选择最小值的。也就是说这个节点玩家的分数不会超过Y,那么这个节点显然没有必要进行计算了。
通俗点来讲就是,AI发现这一步是对玩家更有利的,那么当然不会走这一步。
- 在MIN层,假设当前层已经搜索到一个最小值 Y, 如果发现下一个节点的下一层(也就是MIN层)会产生一个比Y还大的值,那么就直接剪掉此节点。
这个是一样的道理,如果玩家走了一步棋发现其实对AI更有利,玩家必定不会走这一步。

如上图所示,在第二层,也就是MIN层,当计算到第三个节点的时候,已知前面有一个3和一个6,也就是最小值为3。 在计算第三个节点的时候,发现它的第一个孩子的结果是5,因为它的孩子是MAX节点,而MAX节点是会选择最大值的,那么此节点的值不会比5小,因此此节点的后序孩子就没有必要计算了,因为这个节点不可能小于5,而同一层已经有一个值为3的节点了。
其实这个图里面第三层分数为7的节点也是不需要计算的。
这是 MAX 节点的剪枝,MIN节点的剪枝也是同样的道理,就不再讲了。 Alpha Beta 剪枝的 Alpha 和 Beta 分别指的是MAX 和 MIN节点。
我们直接上代码:
int ChessBoard::findWhiteScoreMaxValue(int board[][][], int deep,int alpha,int beta)
{
if(deep <= )
{
int score = getSideScore(board, chessPicesStatus::white) -
getSideScore(board, chessPicesStatus::black);
return score;
}
else
{
int maxVal = -;
PicesPosList list = getAvailablePos(board,chessPicesStatus::white);
for(auto iter = list.begin();iter != list.end();iter++)
{
board[iter->x][iter->y][iter->z] = chessPicesStatus::white;
int val = findWhiteScoreMinValue(board, deep -,alpha,maxVal > beta ? maxVal : beta);
if(val > maxVal)
{
maxVal = val;
whiteTargetPos.x = iter->x;
whiteTargetPos.y = iter->y;
whiteTargetPos.z = iter->z;
}
board[iter->x][iter->y][iter->z] = chessPicesStatus::empty;
if(maxVal > alpha)
break;
}
return maxVal;
}
} int ChessBoard::findWhiteScoreMinValue(int board[][][], int deep,int alpha,int beta)
{
if(deep <= ) {
int score = getSideScore(board, chessPicesStatus::white) -
getSideScore(board, chessPicesStatus::black);
return score;
}
else
{
int minVal = ;
PicesPosList list = getAvailablePos(board,chessPicesStatus::black);
for(auto iter = list.begin();iter != list.end();iter++)
{
board[iter->x][iter->y][iter->z] = chessPicesStatus::black;
int val = findWhiteScoreMaxValue(board, deep -, minVal < alpha ? minVal : alpha ,beta);
if(val < minVal)
{
minVal = val;
blackTargetPos.x = iter->x;
blackTargetPos.y = iter->y;
blackTargetPos.z = iter->z;
}
board[iter->x][iter->y][iter->z] = chessPicesStatus::empty;
if(val < beta)
break;
}
return minVal;
}
}
至此,我们的搜索函数已经基本完成。但是此时的剪枝效率非常低,因为剪枝的效率依赖于大小排列是否整齐。比如在Max层,最理想的效果一定是各个节点从大到小排列,Min层也是一样的道理。所以在下一篇文章中我会讲到到启发式搜索。
参考文献:
https://www.cnblogs.com/pangxiaodong/archive/2011/05/26/2058864.html
https://www.zhihu.com/question/27221568/answer/127599152
http://blog.csdn.net/lihongxun945/article/details/50668253
致谢!
新手立体四子棋AI教程(3)——极值搜索与Alpha-Beta剪枝的更多相关文章
- 新手立体四子棋AI教程(1)——基础扫盲
一.引言 最近身边好几个朋友开始玩立体四子棋,激起了我的好奇心.那么首先来说什么是[立体四子棋],规则又是如何呢? 上图即为立体四子棋,规则类似于五子棋四子连在一起,但是四子棋更加多样.丰富.不仅可以 ...
- 新手立体四子棋AI教程(2)——价值评估函数
上一篇我们完成了整个程序的基础框架,那么在讲到真正的搜索算法前,我们先来看看五子棋如何评估当前局势,以及如何计算某个位置的价值. 一.五子棋 在五子棋中,包括成五,活三,活二等定势,下图为山东师范大学 ...
- 新手立体四子棋AI教程(4)——启发式搜索与主程序
通过前面几篇文章的学习,我们的四子棋程序已经有了框架.搜索几大部分,但是还有着不少问题,我们的程序只能迭代很有限的步骤,导致棋力低下,在这一篇我们将通过启发式搜索极大的优化搜索效率. 一.原因 我们之 ...
- swing桌面四子棋程序开发过程中遇到的一些问题记录(二)
第二个遇到的问题是将JButton按钮设置成透明的按钮.首先UI给我一张透明的图片,如果我直接给Button按钮设置背景图片的话,是没有透明的效果的,只会留下白色的底,设置前后的效果如下图 制作透明的 ...
- 五子棋AI教程
https://github.com/Chuck-Ai/gobang 我写了非常详细的中文教程,教你如何一步步编写自己的五子棋AI: 五子棋AI设计教程第二版一:前言 五子棋AI设计教程第二版二:博弈 ...
- codevs1004四子连棋[BFS 哈希]
1004 四子连棋 时间限制: 1 s 空间限制: 128000 KB 题目等级 : 黄金 Gold 题目描述 Description 在一个4*4的棋盘上摆放了14颗棋子,其中有7颗 ...
- Codevs p1004 四子连棋
四子连棋 题目描述 Description 在一个4*4的棋盘上摆放了14颗棋子,其中有7颗白色棋子,7颗黑色棋子,有两个空白地带,任何一颗黑白棋子都可以向 ...
- 【宽度优先搜索】神奇的状态压缩 CodeVs1004四子连棋
一.写在前面 其实这是一道大水题,而且还出在了数据最水的OJ上,所以实际上这题并没有什么难度.博主写这篇blog主要是想写下一个想法--状态压缩.状态压缩在记录.修改状态以及判重去重等方面有着极高的( ...
- codevs 1004 四子连棋
1004 四子连棋 时间限制: 1 s 空间限制: 128000 KB 题目等级 : 黄金 Gold 题目描述 Description 在一个4*4的棋盘上摆放了14颗棋子,其中有7颗白 ...
随机推荐
- Hidden Markov Models(HMM) 初理解
1. 一个简单例子
- RHEL64 缺少ISO 9660图像 安装程序试图挂载映像#1,在硬盘上无法找到该映像
用光盘安装Linux,很容易,按照提示一步一步就好.如果没有光驱,只好想办法用硬盘或者U盘安装了. 首先说说怎样用U盘启动Linux的安装程序:1.将ISO镜像文件拷贝到U盘中,并解压到U盘根目录.将 ...
- 第一次C语言实验报告
一.实验题目,设计思路,实现方法 实验四4-2-9三个数由小到大输出,要求比较三数大小并按顺序输出.运用穷举法列举所有可能性再对应输出.运用多分支结构. 实验四4-2-4 三天打鱼两天晒网,运用循环结 ...
- EF Core下利用Mysql进行数据存储在并发访问下的数据同步问题
小故事 在开始讲这篇文章之前,我们来说一个小故事,纯素虚构(真实的存钱逻辑并非如此) 小刘发工资后,赶忙拿着现金去银行,准备把钱存起来,而与此同时,小刘的老婆刘嫂知道小刘的品性,知道他发工资的日子,也 ...
- ASP.NET 初识Cookie
1.ASP.NET中使用Cookie 0.说明 Cookie存在客户端电脑上,Session存在服务器上,所以保存登录信息等敏感信息时不能使用Cookie,用户个性化设置可以使用Cookie 1.新建 ...
- Keras官方中文文档:函数式模型API
\ 函数式模型接口 为什么叫"函数式模型",请查看"Keras新手指南"的相关部分 Keras的函数式模型为Model,即广义的拥有输入和输出的模型,我们使用M ...
- 凸包--Graham扫描法
一直听大佬们说:凸包.凸包.凸包 一直不会..... 然后.... 今天考试,考了一道计算几何的简单题.... 这,,,还是学一下吧.. 然后考试现场学习一下凸包算法. 先理解一下凸包是啥东西. 看看 ...
- [HDU5765]Bonds
题面 题意 给出一张\(n\)点\(m\)边无向连通图,求每条边出现在多少个割集中. \(n\le20,m\le\frac{n(n-1)}{2}\) sol 所谓割集,就是指把\(n\)个点分成两个集 ...
- [CQOI2015]任务查询系统
把一个任务拆成两个,在s时加入,在e+1时减去即可 直接离散化后上主席树 # include <bits/stdc++.h> # define IL inline # define RG ...
- 检测flash是否安装及版本号
<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/ ...