2018年星际争霸AI挑战赛–三星与FB获冠亚军,中科院自动化所夺得季军
雷锋网 AI 科技评论消息,2018 年 11 月 13-17 日,AAAI 人工智能与交互式数字娱乐大会 (AI for Interactive Digital Entertainment) 在阿尔伯塔大学举办。会上宣布了一年一度的星际争霸 AI 挑战赛结果;这也是即时战略(RTS)游戏 AI 比赛中最重要的比赛之一。
第八届(2018 年) AIIDE StarCraft AI Competition 星际争霸 AI 挑战赛共有 27 支团队参赛,包括知名机构如三星、中科院自动化所、Facebook 等,知名高校如 Stanford University,以及许多独立参赛队伍。挑战赛使用 12 台计算机进行了大约 2 星期的比赛。经过每个 bot 平均大约 2600 局、每组对手平均大约 100 局,共 34694 局车轮战 1v1 比赛之后,三星、Facebook 以及中科院自动化研究所分别以 95.91%、90.86%、87.11% 的胜率荣获前三名。
AIIDE StarCraft AI 挑战赛自 2011 年起已连续举办八届,该竞赛以星际争霸 1 为载体,以促进和评估用于实时战略游戏(RTS)的人工智能水平为目的。近年来,它更是成为博弈对抗、强化学习、模仿学习、多任务学习等乃至通用人工智能算法研究的主要平台和工具。由于包括对手不确定在内的信息不完全以及状态动作空间巨大等问题,使得星际争霸 AI 较围棋 AI 更极具挑战性,因此也吸引了包括 DeepMind、Facebook、三星、斯坦福大学、中国科学院自动化研究所在内的国内外顶尖研究机构投入研究,相关核心技术可以广泛应用在金融学、经济学、生物学、政治学和军事等领域。
前三名方案介绍
第三名 中科院自动化所,神族 bot 「CSE」
在 2017 年的星际争霸 AI 挑战赛中,来自中科院自动化所的 AI「CPAC」就以 71% 的胜率获得了第四名的成绩。雷锋网 AI 科技评论报道文章请见《中科院自动化所拿下星际争霸 AI 竞赛第四名,顺便发布了一个训练 AI“大局观”的数据集》。
今年的比赛中,由中科院自动化所智能系统与工程研究中心(CRISE)开发的神族 bot「CSE」以 87.11% 的胜率获得季军。据了解,该中心为自动化所独立建制的科研部门,致力于研究博弈对抗与自主进化智能研究,包括感知智能与认知决策智能。「CSE」的作者包括:张俊格、郭玮、尹奇跃、詹东、王琦玮、胡益珲、申生奇和黄凯奇。2017 年的 CPAC 也是由该团队主要人员开发。
「CSE」使用的种族是神族(Protoss),采用的是规则和学习联合驱动的方式。比如何时采用隐刀偷袭吸纳了人类玩家的经验知识;在建造队列为空的时候,「CSE」使用深度学习来预测待构建单位,等等。
第二名 Facebook,虫族 bot「CherryPi」
相比去年比赛中的 69% 胜率、第六名成绩,来自 Facebook 的「CherryPi」今年有了大幅改进,取得了 90.86% 的胜率。「CherryPi」首先对于每个种族的对手有 8~13 种预先准备的不同的策略,利用比赛是多场 1v1 比赛的特点,它会根据与对手的过往比赛的胜率选择最优的策略。除此之外,它还使用了一个预训练的机器模型,根据当前比赛状态估算不同可用策略的胜率,然后在某些状况下切换为胜率最高的策略。这种切换的设计也产生了「混合策略」的效果。「CherryPi」中使用的机器学习技术还包括用于绕开障碍物、避战与放风筝的寻路搜索算法、根据人类数据学习建筑布置、离线强化学习与在线学习等。「CherryPi」也是今年唯一一个使用了 GPU 计算能力的 bot。
第一名三星,人族 bot 「SAIDA」
我们都知道星际争霸在韩国尤为盛行,自 2002 年来,韩国职业星际选手陆续加入了职业战队,并由包括三星、SK Telecom 等知名公司赞助。「SAIDA」的成功很有可能来自其职业星际选手的助力。
根据介绍,「SAIDA」bot 的核心是使用了一个稳定的游戏策略,它会首先考虑防守,然后在游戏中期伺机一波带走对方。他们认为这种策略能应对绝大多数对手的策略,弱点也最少。
「SAIDA」也应用了一些 AI 技术。在 UAlbertaBot 的技术基础上(下文还会提到),他们使用了一个有限状态机来控制单位和建筑。每个单位和建筑在每种战局下都有一个特定的状态。并且使用了多个搜索算法来寻找敌方基地或者可以建造建筑的区域。
在开发过程中「SAIDA」还探索了使用 CNN 和编解码器结构向人类选手学习进攻时机、在局部游戏中用多智能体强化学习方法学习单位微操,不过这些技术并没有添加到此次参加比赛的版本中。
雷锋网 AI 科技评论消息,2018 年 11 月 13-17 日,AAAI 人工智能与交互式数字娱乐大会 (AI for Interactive Digital Entertainment) 在阿尔伯塔大学举办。会上宣布了一年一度的星际争霸 AI 挑战赛结果;这也是即时战略(RTS)游戏 AI 比赛中最重要的比赛之一。
第八届(2018 年) AIIDE StarCraft AI Competition 星际争霸 AI 挑战赛共有 27 支团队参赛,包括知名机构如三星、中科院自动化所、Facebook 等,知名高校如 Stanford University,以及许多独立参赛队伍。挑战赛使用 12 台计算机进行了大约 2 星期的比赛。经过每个 bot 平均大约 2600 局、每组对手平均大约 100 局,共 34694 局车轮战 1v1 比赛之后,三星、Facebook 以及中科院自动化研究所分别以 95.91%、90.86%、87.11% 的胜率荣获前三名。
AIIDE StarCraft AI 挑战赛自 2011 年起已连续举办八届,该竞赛以星际争霸 1 为载体,以促进和评估用于实时战略游戏(RTS)的人工智能水平为目的。近年来,它更是成为博弈对抗、强化学习、模仿学习、多任务学习等乃至通用人工智能算法研究的主要平台和工具。由于包括对手不确定在内的信息不完全以及状态动作空间巨大等问题,使得星际争霸 AI 较围棋 AI 更极具挑战性,因此也吸引了包括 DeepMind、Facebook、三星、斯坦福大学、中国科学院自动化研究所在内的国内外顶尖研究机构投入研究,相关核心技术可以广泛应用在金融学、经济学、生物学、政治学和军事等领域。
前三名方案介绍
第三名 中科院自动化所,神族 bot 「CSE」
在 2017 年的星际争霸 AI 挑战赛中,来自中科院自动化所的 AI「CPAC」就以 71% 的胜率获得了第四名的成绩。雷锋网 AI 科技评论报道文章请见《中科院自动化所拿下星际争霸 AI 竞赛第四名,顺便发布了一个训练 AI“大局观”的数据集》。
今年的比赛中,由中科院自动化所智能系统与工程研究中心(CRISE)开发的神族 bot「CSE」以 87.11% 的胜率获得季军。据了解,该中心为自动化所独立建制的科研部门,致力于研究博弈对抗与自主进化智能研究,包括感知智能与认知决策智能。「CSE」的作者包括:张俊格、郭玮、尹奇跃、詹东、王琦玮、胡益珲、申生奇和黄凯奇。2017 年的 CPAC 也是由该团队主要人员开发。
「CSE」使用的种族是神族(Protoss),采用的是规则和学习联合驱动的方式。比如何时采用隐刀偷袭吸纳了人类玩家的经验知识;在建造队列为空的时候,「CSE」使用深度学习来预测待构建单位,等等。
第二名 Facebook,虫族 bot「CherryPi」
相比去年比赛中的 69% 胜率、第六名成绩,来自 Facebook 的「CherryPi」今年有了大幅改进,取得了 90.86% 的胜率。「CherryPi」首先对于每个种族的对手有 8~13 种预先准备的不同的策略,利用比赛是多场 1v1 比赛的特点,它会根据与对手的过往比赛的胜率选择最优的策略。除此之外,它还使用了一个预训练的机器模型,根据当前比赛状态估算不同可用策略的胜率,然后在某些状况下切换为胜率最高的策略。这种切换的设计也产生了「混合策略」的效果。「CherryPi」中使用的机器学习技术还包括用于绕开障碍物、避战与放风筝的寻路搜索算法、根据人类数据学习建筑布置、离线强化学习与在线学习等。「CherryPi」也是今年唯一一个使用了 GPU 计算能力的 bot。
第一名三星,人族 bot 「SAIDA」
我们都知道星际争霸在韩国尤为盛行,自 2002 年来,韩国职业星际选手陆续加入了职业战队,并由包括三星、SK Telecom 等知名公司赞助。「SAIDA」的成功很有可能来自其职业星际选手的助力。
根据介绍,「SAIDA」bot 的核心是使用了一个稳定的游戏策略,它会首先考虑防守,然后在游戏中期伺机一波带走对方。他们认为这种策略能应对绝大多数对手的策略,弱点也最少。
「SAIDA」也应用了一些 AI 技术。在 UAlbertaBot 的技术基础上(下文还会提到),他们使用了一个有限状态机来控制单位和建筑。每个单位和建筑在每种战局下都有一个特定的状态。并且使用了多个搜索算法来寻找敌方基地或者可以建造建筑的区域。
在开发过程中「SAIDA」还探索了使用 CNN 和编解码器结构向人类选手学习进攻时机、在局部游戏中用多智能体强化学习方法学习单位微操,不过这些技术并没有添加到此次参加比赛的版本中。
2018年星际争霸AI挑战赛–三星与FB获冠亚军,中科院自动化所夺得季军的更多相关文章
- 【转载】 星际争霸2的AI环境搭建
原文地址: https://blog.csdn.net/qq_40244666/article/details/80957644 作者:BOY_IT_IT 来源:CSDN -------------- ...
- 人类又被AI碾压,这次是星际争霸
还记得2017年,那个血洗围棋界的“阿尔法狗”吗? 这个由谷歌旗下 DeepMind 公司开发的 AI ,对阵世界顶尖围棋选手,打出完全碾压式的战绩: AlphaGo vs. 樊麾 - 5 : ...
- 星际争霸2 AI开发(持续更新)
准备 我的环境是python3.6,sc2包0.11.1 机器学习包下载链接:pysc2 地图下载链接maps pysc2是DeepMind开发的星际争霸Ⅱ学习环境. 它是封装星际争霸Ⅱ机器学习API ...
- FaceBook 发布星际争霸最大 AI 数据集
简介 我们刚发布了最大的星际争霸:Brood War 重播数据集,有 65646 个游戏.完整的数据集经过压缩之后有 365 GB,1535 million 帧,和 496 million 操作动作. ...
- 星际争霸的虫王IA退役2年搞AI,自叹不如了
------------恢复内容开始------------ 金磊 发自 凹非寺 量子位|公众号 QbitA 这年头,直播讲AI,真算不上什么新鲜事.但要是连职业电竞选手,都开播主讲呢?没开玩笑,是真 ...
- 300万大奖:欢迎参加美团联合主办的全球AI挑战赛
2018年8月29日,由美团.创新工场.搜狗.美图联合主办的“AI Challenger 2018全球AI挑战赛”正式启动.美团CTO罗道峰.创新工场CEO李开复.搜狗CEO王小川和美图CEO吴欣鸿共 ...
- 20. 星际争霸之php设计模式--适配器模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
- 19. 星际争霸之php设计模式--迭代器模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
- 18. 星际争霸之php设计模式--观察者模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
随机推荐
- 转sklearn保存模型
训练好了一个Model 以后总需要保存和再次预测, 所以保存和读取我们的sklearn model也是同样重要的一步. 比如,我们根据房源样本数据训练了一下房价模型,当用户输入自己的房子后,我们就需要 ...
- [分布式系统学习] 6.824 LEC2 RPC和线程 笔记
6.824的课程通常是在课前让你做一些准备.一般来说是先读一篇论文,然后请你提一个问题,再请你回答一个问题.然后上课,然后布置Lab. 第二课的准备-Crawler 第二课的准备不是论文,是让你实现G ...
- Redis的启动过程
本文主要介绍Redis启动加载过程,总体上可以分为如下几步: 1. 初始化全局服务器配置 2. 加载配置文件(如果指定了配置文件,否则使用默认配置) 3. 初始化服务器 4. 加载数据库 5. 网络监 ...
- poj3259 Wormholes【最短路-bellman-负环】
While exploring his many farms, Farmer John has discovered a number of amazing wormholes. A wormhole ...
- 高盛为什么认为中国AI领域将超越美国?
不久前,高盛发布的名为<中国在人工智能领域崛起>的研究报告,报告中,高盛认为中国已经成为AI领域的主要竞争者,中国政府建设“智慧型经济”和“智慧社会”的目标将有可能推动中国未来GDP的增长 ...
- stat命令的实现-mysate
任务详情 学习使用stat(1),并用C语言实现 提交学习stat(1)的截图 man -k,grep -r的使用 伪代码 产品代码mystate.c,提交码云链接 测试代码,mysate与stat( ...
- HDU 1083 - Courses - [匈牙利算法模板题]
题目链接:http://acm.split.hdu.edu.cn/showproblem.php?pid=1083 Time Limit: 20000/10000 MS (Java/Others) M ...
- SQL Fundamentals: 数据更新及事务处理(INSERT INTO,UPDATE,DELETE,事务,锁)
SQL Fundamentals || Oracle SQL语言 在SQL语句中,数据操作语言DML由两部分组成,查询(DQL).更新操作(增加,修改,删除). 增加数据(INSERT INTO) 数 ...
- TensorFlow softmax的互熵损失
函数:tf.nn.softmax_cross_entropy_with_logits(logits, labels, name=None) 功能:这个函数的作用是计算 logits 经 softmax ...
- python数据结构之动态数组
数组列表:动态数组(Array List) 简介: 最基础简单的数据结构.最大的优点就是支持随机访问(O(1)),但是增加和删除操作效率就低一些(平均时间复杂度O(n)) 动态数组也称数组列表,在py ...