9月17日,2018 世界人工智能大会在上海拉开帷幕。在 SAIL 榜单入围项目中,我看到了小爱同学、小马智行、微软小冰、腾讯觅影等等,这不仅让我大开了眼界,也不禁让我感慨 AI 的发展神速。犹记得去年在中国乌镇围棋峰会上,AlphaGo 与排名世界第一的世界围棋冠军柯洁对战,以 3 比 0 的总比分获胜,那时候只感觉这条“狗”真牛。

这也让我回想起了更年少打“人机”的时光——“人机”模式总是很简单,电脑很弱,给玩家的体验并不好。我也曾给设计师出过加强电脑实力的主意——这些主意听起来不错,但不足以延长游戏体验的时间。

直到最近,我觉得 AI 是一种能够提高“人机”对战体验的途径——让电脑更聪明,而不是预先设定更多的套路。

人机对战的不足:电脑太弱

我曾经有三个一起玩人机的室友。其中一个叫做二狗子,他提议周五晚上去云蛟网吧开黑玩“人机”大战。

“四瓶可乐,服务员。你和小胖都没玩过,今天玩人机熟悉一下吧。”二狗子皮肤有点黑,头转过来一边和我说着,一边登上了自己的账号。

“电脑都很傻的,你随便打就好了,选个远程,勾引过来用技能耗。这个辅助和射手就是等会和你对线的,小胖中路打这个法师,上路对这个,打野的话你就当他不存在吧,我等会会来帮你的。”按着二狗子说的,我选了一个看上去很厉害(漂亮)的打射手。

果然“人机”对战里的电脑都很傻。每盘射手和辅助都会固定前往三条路线中的下路,而且在游戏难度模式不变的情况下,射手的英雄都是固定两位更替,似乎电脑端只会使用这两套技能。

英雄之间也几乎看不出有任何配合,辅助和射手各自作战,有技能放技能,血量低于一定量的时候会立刻“光速”释放保命技能逃跑。对我这个不熟悉操作的倒是一个难题,每当残血时的快速逃跑,让我很难击败对面英雄获得点数。

还有一个特点是,电脑从来不会冒险追击,电脑控制的人物都有自己的巡逻范围,设下陷阱后再引诱,往往会在中招前早早的折返回去。就像我找到了一个位置,刚好我能击中对方,而对方准备还击时,却因为超出范围,折返回去,以此慢慢消耗对方,但往往会触发对方的逃跑机制。

二狗子把游戏改到困难模式后,电脑的英雄变得多样,释放技能更加频繁,甚至还有多人合作。开局我就被打得节节退败,但失败多次后简单总结观察,掌握了电脑方的套路后,简简单单又赢了。

并不靠谱的主意:多套路,加数值

“果然人机都很傻。”赢了之后,我总结道。“不过这人机的设计师,似乎还真的有点本事。许多看上去很傻的行为,现在想想都有点道理,”

我开了另一瓶可乐,发出哧溜的气响,“要是我来设计,肯定不这样。”

“首先,大量收集每场战斗的数据,作为一个样本。之后,根据玩家选择的英雄来选择电脑英雄的作战方式,比如碰到闪避型的玩家英雄,根据之前数据的统计,采取防御守塔的方式,消磨对方的耐心,对面就算闪来闪去操作灵活,但短时间内也无法立即攻破。碰到防御型的玩家英雄,则采取进攻欲望强的方式,抢占先机。

之后就是套路,遇到玩家在固定地点埋伏等待时,立刻更改行军路线,并根据失败率较低的样本来规划路线。

最后就是加强电脑英雄的能力,在身体素质上压制,毕竟在霸道的力量面前,大部分的策略都是以卵击石。”

我讲得似乎很来劲,但是二狗子只是敷衍地嗯嗯,然后说了一句:“我偷塔不就好了。”

到现在我还是没有办法反驳二狗子的话,因为人类玩家总有办法靠套路获胜,纵使电脑端不断采取获胜概率较大的方案——电脑在“吸取教训”后,也就是所谓的机器学习,给玩家会有很直观的体验,觉得电脑变聪明了,但这一学习方法很快就会遇到瓶颈,玩家也会随机固定出一套打法,人机游戏体验也就到了尽头。

直到最近,我觉得似乎有理由反驳二狗子的话了,虽然都到了喝轻怡可乐的年数。

人机对战的进阶:人工神经网络

“你打开这个视频看看,DOTA 2 国际赛上这个 OpenAI,就很强。才过去这么几年,现在拿来虐虐我一点问题都没有。”

二狗子直接丢了一句“懒得看”,并立马贴了一篇文章给我。

“笔记记得再厚,概率算得再准是没用的,你那一套思路最多只能把游戏从困难变成超级困难,之后提升难度只能靠改名字来唬人,人家大厂几年前就用‘人工神经网络’来优化 AI 了。”

“也就是,人造英雄对抗人?”

“是的,我给你讲讲大概原理,你听不听?“二狗子发了个“大兵”表情,并处于“正在输入中”:

“人工神经网络通过前向传播对输入值,进行权值运算,最后一层层传下去得到最终输出预测的值。再通过反向传播,与真实值做对比修正前向传播的权值和偏置。你看看这个图理解一下。”二狗子马上发了一个奇怪的图——

“不懂。你再说详细一点。”

二狗子:“上面这图提到的就是反向传播,反向传播在不断的更新参数 W 和 B 通过梯度下降的算法,运用梯度下降的算法可以找出一组 W 和 B,使得函数 C 最小,在样本上找到最优或者近似最优的 W 和 B ,之后使用 W 和 B 进行预测。你再看看这个图理解一下。”

“哦!哦!!原来是这样啊,也就是比赛 AI 那边还坐着一排游戏选手对吧。“

二狗子继续:“差不多,您是不是感觉视频里就跟真人玩家互相竞赛一样呢?这种体验才是能延长人机游戏生命周期的关键。首先从数据上,样本采集自然是不可或缺的,但是样本采集后不是死的,得活用起来,你就好比用样本来塑造一个职业选手的形象,红色样本代表进攻较强并取得胜利的对战数据,再用这个红色样本堆砌成一名红色选手,命名为好战的斯巴达,然后此基础上,让斯巴达有一定计算能力,分析游戏开始 15 分钟这一时间段的各类数据,再接着比较使用特洛伊还是长坂坡等方案的胜率。”

“我更喜欢沉稳的杰尼龟。”我总觉得得说点什么,不然显得我不如二狗子,“那就是电脑计算能力够强,5 分钟总结一次,1 分钟总结一次,那岂不是天下第一了。我还可以预知一下人类玩家的策略,这类竞技游戏套路全都输入到数据库后,比如一看见三名玩家聚在一起,我先综合比较一下战局的优劣势,AI 优势则 4 人围剿,一人守家,AI 劣势则 4 人防守,一人偷塔。AI 也要你尝尝被偷塔的滋味。”

深度学习三要素:数据、模型、计算

“恩,反正差不多这个意思,深度学习实际上就这三点:数据、模型、计算。竞技游戏像 DOTA 这种就十分考究这三点的综合程度。但往往日常功能里,按照这个框架走,就有很好的效果。你看又拍云的这个内容识别功能,就是深度学习的经典案例。你看看这个,我先去开瓶可乐。”二狗子发了一张图给我,我仿佛听见电脑的那一段,“哧溜”的气泡声。

图片中的内容,应该就是他所说的经典三点式:

  1. 视频直播,视频点播,图片,文本,就是数据;
  2. 人工处理,训练平台得到模型;
  3. 内容识别系统,就是计算的过程;

我尝试上传几张图片之后,马上就能得出结果了,像这样:

不知道二狗子可乐喝光了没有,我还是挺想和他有空再去玩人机对战的。对,就像那天在云蛟网吧里面的一局,电脑英雄斯维因拿了我和小胖 25 个击杀后,又轻松把二狗子秒杀的神奇局。

“要不是你们这两个猪队友,送成这样我会打不过?晚上可乐你买单。”

"人机"对战:电脑太简单了,我是射手 skr~skr~skr的更多相关文章

  1. 介绍一款Android小游戏--交互式人机对战五子棋

    文章转载至CSDN社区罗升阳的安卓之旅,原文地址:http://blog.csdn.net/luoshengyang/article/details/6589025 学习Android系统开发之余,编 ...

  2. 完全自制的五子棋人机对战游戏(VC++实现)

    五子棋工作文档 1说明: 这个程序在创建初期的时候是有一个写的比较乱的文档的,但是很可惜回学校的时候没有带回来……所以现在赶紧整理一下,不然再过一段时间就忘干净了. 最初这个程序是受老同学所托做的,一 ...

  3. Python:游戏:五子棋之人机对战

    本文代码基于 python3.6 和 pygame1.9.4. 五子棋比起我之前写的几款游戏来说,难度提高了不少.如果是人与人对战,那么,电脑只需要判断是否赢了就可以.如果是人机对战,那你还得让电脑知 ...

  4. HTML5+JS 《五子飞》游戏实现(八)人机对战

    要想实现人机对战,就必须让电脑自动下棋,而且要知道自动去查找对方的棋子,看看有没有可以挑一对的,有没有可以夹一个的,这样下起来才有意思. 当电脑用户下完棋后,电脑应立即搜索用户的棋子,然后如果没有被吃 ...

  5. js实现五子棋人机对战源码

    indexhtml <!DOCTYPE html> <html lang="en"> <head> <meta charset=" ...

  6. Pyhton实践项目之(一)五子棋人机对战

    1 """五子棋之人机对战""" 2 3 import random 4 import sys 5 6 import pygame 7 im ...

  7. 在VS2012中实现Ext JS的智能提示太简单了

    Visual Studio 2012太强大了,居然能自己会去提取Ext JS的类的属性和方法,从而实现只能提示.下面就来介绍一下实现这个功能. 在Visual Studio 2012中随便创建一个We ...

  8. java 五子棋之人机对战思路详解

    最近做了五子棋,记录下自己完成五子棋的人机对战的思路. 首先,思路是这样的:每当人手动下一颗棋子(黑子)的时候,应当遍历它周围棋子的情况,并赋予周围棋子一定的权值,当在机器要下棋子(白子)守护之前,会 ...

  9. std::hash实现太简单分布不匀

    std::hash实现太简单分布不匀(金庆的专栏 2017.5)#include <iostream>#include <functional>using namespace ...

随机推荐

  1. 利用Google趋势来预测比特币价格

    预测市场是件极其困难和不可能的事情,特别是预测市场的短期行为.长期预期相对而言简单很多,因为很多事情把时间拉长,都可以预测,比如我预测烧汽油的车最终都会消失,把时间拉长,都是没问题的.但是这种预测没法 ...

  2. Android进阶:四、RxJava2 源码解析 1

    本文适合使用过Rxjava2或者了解Rxjava2的基本用法的同学阅读 一.Rxjava是什么 Rxjava在GitHub 主页上的自我介绍是 "a library for composin ...

  3. BigDecimal.valueOf

    Those are two separate questions: "What should I use for BigDecimal?" and "What do I ...

  4. Influxdb+Grafana+Telegraf及docker中运行

    目录 参考资料 1. InfluxDB 1. 特征: 2. 特点: 3. 功能及默认 4. 主要概念 1) 与SQL的名词做比较 2) InfluxDB的独有概念 5. 常用命令 1. 用户管理: 6 ...

  5. APM(pixhawk)飞控疑难杂症解决方法汇总(持续更新)

    本文转自下面博主 https://blog.csdn.net/junzixing/article/details/79310159 APM/Pixhawk常用链接汇总(持续更新) https://bl ...

  6. [Tips] Git使用经验

    brach 查看目前branch git branch 显示结果: * master *表示这是当前的branch. 建立分支 git branch 分支名 删除分支 git branch -d 分支 ...

  7. windows10 docker镜像存储位置修改

    =====================================下面做法无效,无法成功启动docker=================================== 安装Docker ...

  8. jQuery(三)

    jquery链式调用 jquery对象的方法会在执行完后返回这个jquery对象,所有jquery对象的方法可以连起来写: $('#div1') // id为div1的元素 .children('ul ...

  9. PS2键盘扫描码:通码与断码

    键盘扫描码(实用于标准PC的101.102和104 键的键盘),按下发送通码,弹起发送断码. 说明: 第一类按键,通码为1字节,断码为 0xF0+通码 形式.如A键,其通码为 0x1C,断码为 0xF ...

  10. MyBatis返回map数据

    (1)接口中编写方法 //单行 public Map<String, Object> getEmpReturnMap(Integer id); //多行 @MapKey("id& ...