强化学习 课程:Q-Learning强化学习(李宏毅).深度强化学习 强化学习是一种允许你创造能从环境中交互学习的AI Agent的机器学习算法,其通过试错来学习.如上图所示,大脑代表AI Agent并在环境中活动.当每次行动过后,Agent接收到环境反馈.反馈包括回报Reward和环境的下个状态State,回报由模型设计者定义.如果类比人类学习自行车,可以将车从起始点到当前位置的距离定义为回报. 分类: 1)基于价值Value的强化学习算法 - Q-learning 基本思想:根据当前的状态,…
系列文章 基于.NetCore开发博客项目 StarBlog - (1) 为什么需要自己写一个博客? 基于.NetCore开发博客项目 StarBlog - (2) 环境准备和创建项目 ... 基于.NetCore开发博客项目 StarBlog - 接口返回值包装 基于.NetCore开发博客项目 StarBlog - 上传图片功能 基于.NetCore开发博客项目 StarBlog - 身份认证功能 基于.NetCore开发博客项目 StarBlog - 前端相关 基于.NetCore开发博客…
-------小基原创,转载请给我一个面子 正所谓,工欲善其事,必现准备好电脑.接下来跟着小基一步一步来搭建你的开发环境吧 1.下载安装unity 上面的那个是破解软件,下面是unity5.5.6的安装文件,先双击安装程序 点击Next 打钩后继续Next 第一个是unity必选,第二个是代码的编程工具,可以使用自带的MonoDevelop,如果想用其他软件如VS,Sublime等,可以不安装MonoDevelop 至于各个编程工具的优缺点,大家可以了解后再决定,后面在unity里面可以选择使用…
-------小基原创,转载请给我一个面子 上回书说道,英雄和魔王都做完了,子弹也能发射了,就是不知道啥时候能干死魔王.那小基得做个血条来展示一下,他离死不远了(•౪• ) 其实血条也可以看作是进度条的一种用法,大家经常看到的loading图各式各样,无非都是在表示进度的百分比.所以下面小基来演示怎么做一个比较low的通用进度条. 上面是几个例子,最后一个什么鬼小基也不知道,有会做的老司机请手把手教我,谢谢( ᐛ ) 第一步先把组件拼装好 创建空物体起名叫做BossHpBar,本例非常直观的叫法…
-------小基原创,转载请给我一个面子 现在移动游戏越来越火,大家都拿手机平板玩游戏,没有键盘和手柄输入,所以就不得不看看虚拟摇杆怎么搞?(小基对于没有实体反馈不是很喜欢呢) 首先要清楚,鼠标操作输入,应该在2d的UI平面上做一个虚拟摇杆,如下图 Hierarchy面板下点Create创建一个UI里面的Image 会自动创建一个Canvas(画布),UI方面的东西都在这里面显示 我们再创建一个专门处理UI的摄像机(这个主要处理鼠标点击时候,获取屏幕坐标,来处理移动逻辑,如果使用默认的Main…
-------小基原创,转载请给我一个面子 小基认为电子游戏与电影最重要的区别就是交互,如果电子游戏没有让你输入的交互功能的话,全程都"只可远观,而不可鼓捣"的话,你可能是在看视频,怕不是玩了假游戏.所以小基来讲讲如何输入并控制物体移动 首先双击unity 点击NEW,给你的工程(游戏)起个有意思的名字(突发发现小基随便起的这个Test1856有<教团1886>的既视感XD) 创建之后就是一个空场景,右上角的布局小基习惯用2by3这种风格,你可以自行选择. 点击create…
package javaes.zixue.wangshang.daima; 2 3 import java.awt.Cursor; import java.awt.Image; import java.awt.Point; import java.awt.Toolkit; import java.awt.event.ActionEvent; import java.awt.event.ActionListener; import java.awt.event.MouseEvent; import…
-------小基原创,转载请给我一个面子 主角都能移动了,那不得做点什么伸张正义,守护世界和平的事嘛,拿起家伙biu~biu~biu~ 首先得做一个好人和一个坏人 老规矩,Canvas下创建两个Image,一个叫做player,一个叫做enemy1好了   一个红色,一个蓝色(自古红蓝出CP,不好意思,走错片场了●﹏●) 新知识:要加BoxCollider2D 子弹打到别人,其实是碰撞检测的过程 一种是根据位置坐标,判断子弹有没有打中,另一种是使用物理碰撞系统(小基这里使用后者) 两个物体物理…
-------小基原创,转载请给我一个面子 一望无际的...空旷场景,看着实在是难受,不如添加些背景吧.如果要真的想好好设计关卡背景的话,最好是做一个地图编辑器,不过做开发工具毕竟有点点复杂且枯燥,以后放在别的系列里面再聊.本篇就做个非常简单的滚动屏幕吧 滚动屏幕的思路就是 两种与屏幕一样大小的背景图片A,B,让它俩无缝拼接同时同方向移动,当A移除视野后,坐标设置为B的后面.当B移除视野时,后面的A就能来"前赴后继",然后B再跑到A后面,循环这个过程.(当然如果你有好多个背景串起来,跟…
1. np.stack((x_t, x_t, x_t, x_t), axis=2)  将图片进行串接的操作,使得图片的维度为[80, 80, 4] 参数说明: (x_t, x_t, x_t, x_t) 表示需要进行串接的图片, axis = 2 表示在第三个维度上进行串接操作 2. cv2.resize(x, [80, 80])  # 将图片的维度变化为80 * 80的维度 参数说明, x为输入的图片,80, 80表示图片变化的维度 3.cv2.cvtColor(x_t, tf.COLOR_RG…