人类又被AI碾压,这次是星际争霸
还记得2017年,那个血洗围棋界的“阿尔法狗”吗?
这个由谷歌旗下 DeepMind 公司开发的 AI ,对阵世界顶尖围棋选手,打出完全碾压式的战绩:
AlphaGo vs. 樊麾 - 5 : 0
AlphaGo vs. 李世石 - 4 : 1
AlphaGo vs. 柯洁 - 3 : 0
那时人们都绝望地说,在围棋上,人类可能再也赢不了AI了。
很遗憾,这就是棋类游戏的现状。
去年,阿尔法狗的终极版AlphaZero,已经在国际象棋、将棋和围棋三种棋类游戏中,全面超越人类。
DeepMind 与它的阿尔法 AI 大军,在吊打了各路顶级选手之后,甩下一句话:
“下次我们想试试打星际争霸。”
那时候,是2016年。经过两年多的训练,这一天,终于来了。
昨天,DeepMind 和暴雪进行一场直播,秀了一把他们在《星际争霸II》中,与人类选手对战吊打的成果。
这一回,出场的选手,是阿尔法狗的亲戚 AlphaStar。
暴雪邀请了,来自职业战队 Team Liquid 的两位职业选手, TLO 和 MaNa,和 AlphaStar 各打了5局。
结果...
被剃了光头,AlphaStar 十局全胜。
机哥非常好奇,像星际2这样操作如此复杂的RTS游戏,究竟AI需要强到什么程度,才可以做到“吊打”人类选手?
于是机哥借着写稿的机会,在上班时间,公然撸完了,这一场快三个小时的直播,看了个究竟。
AlphaStar 和 AlphaGo 血缘关系密切,训练的方式都非常相似。
借着暴雪开放星际2 API 的机会,AlphaStar 获得了大量来自玩家的 Replay 档案,借此大量地学习并模仿,真实玩家的操作和战术。
像星际争霸这样的即时战略游戏,和之前的各种棋,有着一处关键性的不同——战争迷雾。一种限制玩家获取对方完整信息的机制。
这样,AlphaStar 就不能像在下棋的时候一样,获得敌我双方的完整信息,必须要有非常强大的预判和即时决策的能力。
AlphaStar的目标是模拟人类的操作,为了让操作更接近人类,DeepMind 甚至对它的操作做出了各种限制。
比如说,将它的反应速度限制在偏低的 350 毫秒。
再比如说,AlphaStar的平均 APM 也在 277 左右,远低于星际职业选手的水平。
即使如此,在和两位职业选手的对战中,还是获得了十战全胜,这 AI 真的就这么无敌吗。
不好意思,是的,真的是打不过。
即使有着诸多限制,AI操作的精度,仍然是人类选手无法达到的。别看人家APM低,不过它可以说没有任何的冗余操作,每一次操作都是有效的。
而人类选手就不一样,人类选手的高APM,参杂了各种热手、误操作和多余的操作,很多时候你以为的骚操作,都是瞎JB浪。
这回AlphaStar之所以能赢的如此彻底,靠的就是骚操作,精确到每一个单位的骚操作。
蓝方:AlphaStar,丝血反杀后撤退
并且,在这10场比赛中,AlphaStar 有着覆盖了所有可见区域的全局视野,就像开了挂一样。人类被碾压,很正常。
不过还好,MaNa选手在直播的最后,和AlphaStar打了一场表演赛。这回,人类赢了。
这全都是因为,这一次,AlphaStar使用了另一个版本。这次,它失去了上帝视角,必须像人类一样切换视角观察战场,被MaNa用放风筝战术拖死。
没了视野,任你操作再骚,也要翻车。
果不其然,星际圈流传的老梗诚不我欺:
玩笑归玩笑,DeepMind的这次“成果展示”,代表着AI玩家的触手,已经正式深入到了电子竞技领域。
AlphaStar,现已正式约战世界冠军serral。机哥对下一场,还是非常期待的。
人类就真的没有未来么?我不信。
换我来,肯定能赢
现在都在知道人工智能对未来的一个发展趋势,对那些没有学习人的老铁们是真的无奈,不知道去往哪方面学习提升的!!
但你们是幸运的的,遇到了我,在前些天我整理出了一套人工智能的学习资料,不管是小白还是有一定的编程基础都是可以学习的。
如果有需要的老铁们可以微信扫扫下方二维码关注公众号,关键字回复【AI】资料领取!!

人类又被AI碾压,这次是星际争霸的更多相关文章
- 2018年星际争霸AI挑战赛–三星与FB获冠亚军,中科院自动化所夺得季军
雷锋网 AI 科技评论消息,2018 年 11 月 13-17 日,AAAI 人工智能与交互式数字娱乐大会 (AI for Interactive Digital Entertainment) 在阿尔 ...
- 星际争霸2 AI开发(持续更新)
准备 我的环境是python3.6,sc2包0.11.1 机器学习包下载链接:pysc2 地图下载链接maps pysc2是DeepMind开发的星际争霸Ⅱ学习环境. 它是封装星际争霸Ⅱ机器学习API ...
- 星际争霸的虫王IA退役2年搞AI,自叹不如了
------------恢复内容开始------------ 金磊 发自 凹非寺 量子位|公众号 QbitA 这年头,直播讲AI,真算不上什么新鲜事.但要是连职业电竞选手,都开播主讲呢?没开玩笑,是真 ...
- 【转载】 星际争霸2的AI环境搭建
原文地址: https://blog.csdn.net/qq_40244666/article/details/80957644 作者:BOY_IT_IT 来源:CSDN -------------- ...
- FaceBook 发布星际争霸最大 AI 数据集
简介 我们刚发布了最大的星际争霸:Brood War 重播数据集,有 65646 个游戏.完整的数据集经过压缩之后有 365 GB,1535 million 帧,和 496 million 操作动作. ...
- 14. 星际争霸之php设计模式--状态模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
- 【转载】 Deepmind星际争霸2平台使用第一轮-完成采矿
原文地址: https://blog.csdn.net/woaipichuli/article/details/78645999 ----------------------------------- ...
- 20. 星际争霸之php设计模式--适配器模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
- 19. 星际争霸之php设计模式--迭代器模式
题记==============================================================================本php设计模式专辑来源于博客(jymo ...
随机推荐
- 设置联想键盘恢复F1~F12默认按键的操作办法
背景 默认都是笔记本键盘才有Fn组合功能键,台式机很少有.今天领到的是联想键盘,给我的台式机使用后F12很麻烦,必须Fn+F12才可以. 需求 恢复默认的F1~F12功能 方案 只需要下载驱动安装: ...
- JDK5 新特性之 可变参数的方法(2)---asList
> Arrays.asList(T - a)方法的使用 >UnsupportedOperationException分析 Arrays.asList(T - a)方法的使用 pac ...
- MySQL面试题36道
MySQL数据库是在免费的数据库中最受欢迎的一款,尤其是在一些小型项目以及项目资金有限的情况下,选择MySQL来作为数据存储的工具,那些不差钱并且数据吞吐量非常大的互联网公司一般都是会用付费的Orac ...
- 某某D的手伸的实在太长了,路由器也未能幸免,致被阉割的TP-Link
前段时间整了个服务器架上l2tp.server, TP-Link路由连上去后,全网走l2tp通道,而且不能配置相关的路由表 然后研究啊 找啊 查啊,确定是路由没有这功能 找客服问了一下,他一听就懂了, ...
- 2019 wannafly winter camp
2019 wannafly winter camp Name Rank Solved A B C D E F G H I J K day1 9 5/11 O O O O O day2 5 3/11 O ...
- Beta阶段第五次冲刺
Beta阶段第五次冲刺 严格按照Git标准来,组员有上传Git的才有贡献分没有的为0 代码签入图 1.part1 -站立式会议照片 2.part2 -项目燃尽图 3.part3 -项目进展 1.正在进 ...
- JS中的防抖与节流
什么是防抖?and什么是节流?一起来开心的学习下吧. 首先什么是防抖:就是在一定的时间内事件只发生一次,比如你点击button按钮,1秒内任你单身30年手速点击无数次,他也还是只触发一次.举个例子,当 ...
- Netty入门(五)ChanneHandler
本节主要讨论了 Netty 的数据处理组件 ChannelHandler. 一.Channel 生命周期 Channel 有个简单但强大的状态模型,下面是 Channel 的四个状态: Channel ...
- Drools实战系列(三)之eclipse创建工程
web工程和maven工程是目前比较常用的,当然对现在而言,maven工程是开发中最常用的. 两种Drools项目的创建方式,一种是直接创建Drools项目,另一种是基于Maven创建Drools项目 ...
- shiro实战系列(十三)之单元测试
由于我们已经涉及到了 Subject reference,我们知道 Subject 是“当前执行”用户的特定安全视图,且该 Subject 实 例绑定到一个线程来确保我们知道在线程执行期间的任何时间是 ...