reinforcement learning常用的游戏环境，gym框架使用的标准Atari游戏集合

reinforcement learning常用的游戏环境，gym框架使用的标准Atari游戏集合。*.bin文件为Atari2600游戏的常用游戏环境的模拟文件，也称为roms文件。

文件地址：

https://gitee.com/devilmaycry812839668/atari_roms

======================================================

在强化学习中使用gym搭建游戏环境，操作如下：

pip install gym[atari]

可以看到使用gym 安装atari游戏环境的时候其实也是自动去安装 Atari环境库的，即，atari-py

https://github.com/openai/atari-py/

安装成功后运行环境：

import gym

env = gym.make("SpaceInvaders-v0")

发现运行 Atari环境下的游戏是报错的，提示就是没有 roms文件，也就是 https://gitee.com/devilmaycry812839668/atari_roms 下的 *.bin 文件。

解决方法就是在 https://gitee.com/devilmaycry812839668/atari_roms 中把里面的 *.bin 文件下载下来放到自己本机 atari_py 模块下的 atari_roms文件夹下面。

具体：

查找 gym 的安装路径：

通过gym的路径找到 atari_py 的路径（ gym 一般与atari_py 安装在同一目录下）：

把下载好的 bin 文件拷贝到 atari_py 下面的 atari_roms 中：

测试是否安装成功：

成功运行 atari 游戏环境。

reinforcement learning常用的游戏环境，gym框架使用的标准Atari游戏集合的更多相关文章

18 Issues in Current Deep Reinforcement Learning from ZhiHu
深度强化学习的18个关键问题 from: https://zhuanlan.zhihu.com/p/32153603 85 人赞了该文章深度强化学习的问题在哪里?未来怎么走?哪些方面可以突破? 这两 ...
Discovering Reinforcement Learning Algorithms
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:2007.08794v1 [cs.LG] 17 Jul 2020 Abstract 强化学习(RL)算法根据经过多年研究手动发 ...
Statistics and Samples in Distributional Reinforcement Learning
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1902.08102v1 [stat.ML] 21 Feb 2019 Abstract 我们通过递归估计回报分布的统计量,提供 ...
(转) Deep Learning in a Nutshell: Reinforcement Learning
Deep Learning in a Nutshell: Reinforcement Learning Share: Posted on September 8, 2016by Tim Dettm ...
转:高层游戏引擎——基于OGRE所实现的高层游戏引擎框架
高层游戏引擎——基于OGRE所实现的高层游戏引擎框架这是意念自己的毕业论文,在一个具体的实践之中,意念主要负责的是物件和GUI之外的其他游戏系统.意念才学疏陋,望众位前辈不吝赐教.由于代码质量不高. ...
github上DQN代码的环境搭建，及运行（Human-Level Control through Deep Reinforcement Learning）conda配置
最近师弟在做DQN的实验,由于是强化学习方面的东西,正好和我现在的研究方向一样于是我便帮忙跑了跑实验,于是就有了今天的这个内容. 首先在github上进行搜寻,如下图: 发现第一个星数最多,而且远高于 ...
Deep Reinforcement Learning: Pong from Pixels
这是一篇迟来很久的关于增强学习(Reinforcement Learning, RL)博文.增强学习最近非常火!你一定有所了解,现在的计算机能不但能够被全自动地训练去玩儿ATARI(译注:一种游戏机) ...
[Reinforcement Learning] 强化学习介绍
随着AlphaGo和AlphaZero的出现,强化学习相关算法在这几年引起了学术界和工业界的重视.最近也翻了很多强化学习的资料,有时间了还是得自己动脑筋整理一下. 强化学习定义先借用维基百科上对强化 ...
Reinforcement Learning, Fast and Slow
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! 1 DeepMind, London, UK2 University College London, London, UK3 Prince ...
Improved robustness of reinforcement learning policies upon conversion to spiking neuronal network platforms applied to Atari Breakout game
郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1903.11012v3 [cs.LG] 19 Aug 2019 Neural Networks, 25 November 2 ...

随机推荐

配置系统未能初始化。“System.Transactions.Diagnostics.DiagnosticTrace”的类型初始值设定项引发异常。
配置系统未能初始化."System.Transactions.Diagnostics.DiagnosticTrace"的类型初始值设定项引发异常. 1.是检查当前程序的 App.c ...
restful接口返回JSONObject和父类抽象实现类设计,请求头获取sign和支付宝RSA签名验签工具类方法
restful接口返回JSONObject和父类抽象实现类设计,请求头获取sign和支付宝RSA签名验签工具类方法 1.JSONObject可以通用数据的灵活性,类似Map数据,数据字段不清晰.具体返 ...
RIP总结
RIP 两种更新方式:定期更新和触发更新管理距离为120,更新使用UDP520,更新周期30s,使用跳数作为度量值,最大15 RIP有三个版本RIPv1,RIPv2,RIPn ...
Kubernetes(K8s)之Pod
Pod介绍 Pod是K8s的最小调度单位内部是一组Container容器,根容器Pause和其他业务容器拥有唯一Pod IP 小贴士: 在生产环境中,极少单独Pod的情况一般都是使用Deploy ...
SpringBoot动态数据源配置
SpringBoot动态数据源配置序:数据源动态切换流程图如下: 1:pom.xml文件依赖声明 <dependency> <groupId>org.springfram ...
Linux 内核：设备驱动模型学习总结
背景其实之前就转载过别人针对Linux的设备驱动模型(Linux Device Driver Model,LDDM)的文章,但是受限于自身的能力,因此花了点时间重新学习了一下. 前人写的文章很好,我 ...
Markdown 文章跳转
背景在查阅一些文档的时候,一些比较优秀博客在文章中是带有目录的,点击就会跳转到指定的锚点. 在本人的某些文章中,也想尝试这样的效果. 做法实现这样的效果有2种做法(不同之处在于超链接的写法不同) ...
python基础-入门必备知识
1 标识符标识符是编程时使用的名字,用于给变量.函数.语句块等命名,Python 中标识符由字母.数字.下划线组成,不能以数字开头,区分大小写. 以下划线开头的标识符有特殊含义,单下划线开头的标识符 ...
SpringBoot能同时处理多少请求
SpringBoot默认的内嵌容器是Tomcat,也就是我们的程序实际上是运行在Tomcat里的.所以与其说SpringBoot可以处理多少请求,到不如说Tomcat可以处理多少请求. 关于Tomca ...
Docker开始收费了，开始转学podman【第一篇podman容器的安装和基本操作】
podman 什么是Podman?Podman是无守护程序容器引擎,用于在Linux系统上开发,管理和运行OCI容器.容器可以以root用户或无根模式运行.简而言之:`alias docker = p ...

reinforcement learning常用的游戏环境，gym框架使用的标准Atari游戏集合

reinforcement learning常用的游戏环境，gym框架使用的标准Atari游戏集合的更多相关文章

随机推荐

热门专题