强化学习baseline论文—— rainbow算法中给出实验结果的54个atari2600游戏名称列表
alien
amidar
assault
asterix
asteroids
atlantis bank_heist
battle_zone
beam_rider
berzerk
bowling
boxing
breakout centipede
chopper_command
crazy_climber defender
demon_attack
double_dunk enduro fishing_derby
freeway
frostbite gopher
gravitar hero ice_hockey kangaroo
krull
kung_fu_master montezuma_revenge
ms_pacman name_this_game phoenix
pitfall
pong
private_eye qbert road_runner
robotank seaquest
skiing
solaris
space_invaders
star_gunner
surround tennis
time_pilot
tutankham venture
video_pinball wizard_of_wor yars_revenge zaxxon
个人整理的 bin 文件地址:
https://gitee.com/devilmaycry812839668/atari_roms
原bin地址:
https://github.com/Kojoley/atari-py/tree/master/atari_py/atari_roms
测试本地环境下是否已经安装好这54个游戏的环境:
前提:
已经安装atari_py库,同时在atari_py库下的atari_roms文件夹下存放了所有的游戏bin文件。
测试代码:


import atari_py games="""
alien
amidar
assault
asterix
asteroids
atlantis bank_heist
battle_zone
beam_rider
berzerk
bowling
boxing
breakout centipede
chopper_command
crazy_climber defender
demon_attack
double_dunk enduro fishing_derby
freeway
frostbite gopher
gravitar hero ice_hockey kangaroo
krull
kung_fu_master montezuma_revenge
ms_pacman name_this_game phoenix
pitfall
pong
private_eye qbert road_runner
robotank seaquest
skiing
solaris
space_invaders
star_gunner
surround tennis
time_pilot
tutankham venture
video_pinball wizard_of_wor yars_revenge zaxxon
""" def fun(games):
ok = 0
no_ok = 0
for i in games.split():
if i in set(atari_py.list_games()):
ok += 1
else:
no_ok += 1
print(i, "not in environment !!!") print(ok, " games in local environment")
print(no_ok, " games not in local environment") fun(games)
结果:
=======================================================
atari_2600 游戏镜像权威下载地址:
http://www.atarimania.com/rom_collection_archive_atari_2600_roms.html
=======================================================
注意:( 更正 !!! )
这里的surround.bin 文件无法导入内存,该款游戏无法正常运行。另外pacman游戏也有这个问题。本文中的54个游戏其实只有53个是可以正常运行的。
强化学习baseline论文—— rainbow算法中给出实验结果的54个atari2600游戏名称列表的更多相关文章
- temporal credit assignment in reinforcement learning 【强化学习 经典论文】
Sutton 出版论文的主页: http://incompleteideas.net/publications.html Phd 论文: temporal credit assignment i ...
- 强化学习(Reinforcement Learning)中的Q-Learning、DQN,面试看这篇就够了!
1. 什么是强化学习 其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报. ...
- (转) 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文)
本文转自:http://mp.weixin.qq.com/s/aAHbybdbs_GtY8OyU6h5WA 专题 | 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文) 原创 201 ...
- ICML论文|阿尔法狗CTO讲座: AI如何用新型强化学习玩转围棋扑克游戏
今年8月,Demis Hassabis等人工智能技术先驱们将来到雷锋网“人工智能与机器人创新大会”.在此,我们为大家分享David Silver的论文<不完美信息游戏中的深度强化学习自我对战&g ...
- 【转载】 DeepMind发表Nature子刊新论文:连接多巴胺与元强化学习的新方法
原文地址: baijiahao.baidu.com/s?id=1600509777750939986&wfr=spider&for=pc 机器之心 18-05-15 14:26 - ...
- 强化学习中的无模型 基于值函数的 Q-Learning 和 Sarsa 学习
强化学习基础: 注: 在强化学习中 奖励函数和状态转移函数都是未知的,之所以有已知模型的强化学习解法是指使用采样估计的方式估计出奖励函数和状态转移函数,然后将强化学习问题转换为可以使用动态规划求解的 ...
- 【强化学习】DQN 算法改进
DQN 算法改进 (一)Dueling DQN Dueling DQN 是一种基于 DQN 的改进算法.主要突破点:利用模型结构将值函数表示成更加细致的形式,这使得模型能够拥有更好的表现.下面给出公式 ...
- 深度强化学习中稀疏奖励问题Sparse Reward
Sparse Reward 推荐资料 <深度强化学习中稀疏奖励问题研究综述>1 李宏毅深度强化学习Sparse Reward4 强化学习算法在被引入深度神经网络后,对大量样本的需求更加 ...
- Deep Learning专栏--强化学习之从 Policy Gradient 到 A3C(3)
在之前的强化学习文章里,我们讲到了经典的MDP模型来描述强化学习,其解法包括value iteration和policy iteration,这类经典解法基于已知的转移概率矩阵P,而在实际应用中,我们 ...
- 强化学习(十二) Dueling DQN
在强化学习(十一) Prioritized Replay DQN中,我们讨论了对DQN的经验回放池按权重采样来优化DQN算法的方法,本文讨论另一种优化方法,Dueling DQN.本章内容主要参考了I ...
随机推荐
- 蓝屏rtux64w10.sys
蓝屏rtux64w10.sys 环境: WIN10 + Realtek USB RTL8156B 2.5G网卡 表现: 局域网复制时,间隔性速度变为0,多次后,最终蓝屏. 解决方法: 更新驱动. 地 ...
- k8s 安装ingress nginx controller 并部署.net core ingress服务
k8s 安装ingress nginx controller 并部署.net core ingress服务 本地k8s集群概览 192.168.28.132 k8smaster 192.168.28. ...
- 1003 我要通过! PTA Basic Level
我的个人博客 azoux's blog 题目 我要通过! (20 分) "答案正确"是自动判题系统给出的最令人欢喜的回复.本题属于 PAT 的"答案正确"大派送 ...
- pytest-parallel 多线程执行用例,访问pymysql数据库,遇到的问题
遇到的问题 1.pymysql.err.ProgrammingError: execute() first 2.File "D:\xxx\python3.8\lib\site-package ...
- Spring MVC 获取三个域(request请求域,session 会话域,application 应用域)对象的方式
1. Spring MVC 获取三个域(request请求域,session 会话域,application 应用域)对象的方式 @ 目录 1. Spring MVC 获取三个域(request请求域 ...
- 【论文阅读】TRO 2021: Fail-Safe Motion Planning for Online Verification of Autonomous Vehicles Using Convex Optimization
参考与前言 Last edited time: August 3, 2022 10:04 AM Status: Reading Type: TRO Year: 2021 论文链接:https://ie ...
- 【Ubuntu 1】ubuntu的软件包及便携系列 记录
目录 命令行补充[备注记录] 不想每次---- source /devel/setup.bash sudo chomd 777 /dev/ttyUSB* 安装区 --- 强推!Synergy Chro ...
- Linux服务器从头配置
安装配置jdk 下载 jdk jdk-8u171-linux-x64.tar.gz 将该压缩包放到/usr/local/jdk目录下然后解压(jdk目录需要自己手动创建) tar zxvf jdk-8 ...
- MyBatis-Plus 整理
# 前言 代码生成器插件选择去这里:https://www.cnblogs.com/zixq/p/16726534.html 相关插件在那里面已经提到了 # 上手 MyBatis-Plus 是一个 M ...
- LabVIEW之项目文件结构透析
代码的管理非常重要,LabVIEW本身自带很多代码管理工具.下面来剖析一个相对标准的小项目: