强化学习baseline论文—— rainbow算法中给出实验结果的54个atari2600游戏名称列表
alien
amidar
assault
asterix
asteroids
atlantis bank_heist
battle_zone
beam_rider
berzerk
bowling
boxing
breakout centipede
chopper_command
crazy_climber defender
demon_attack
double_dunk enduro fishing_derby
freeway
frostbite gopher
gravitar hero ice_hockey kangaroo
krull
kung_fu_master montezuma_revenge
ms_pacman name_this_game phoenix
pitfall
pong
private_eye qbert road_runner
robotank seaquest
skiing
solaris
space_invaders
star_gunner
surround tennis
time_pilot
tutankham venture
video_pinball wizard_of_wor yars_revenge zaxxon
个人整理的 bin 文件地址:
https://gitee.com/devilmaycry812839668/atari_roms
原bin地址:
https://github.com/Kojoley/atari-py/tree/master/atari_py/atari_roms
测试本地环境下是否已经安装好这54个游戏的环境:
前提:
已经安装atari_py库,同时在atari_py库下的atari_roms文件夹下存放了所有的游戏bin文件。
测试代码:

import atari_py games="""
alien
amidar
assault
asterix
asteroids
atlantis bank_heist
battle_zone
beam_rider
berzerk
bowling
boxing
breakout centipede
chopper_command
crazy_climber defender
demon_attack
double_dunk enduro fishing_derby
freeway
frostbite gopher
gravitar hero ice_hockey kangaroo
krull
kung_fu_master montezuma_revenge
ms_pacman name_this_game phoenix
pitfall
pong
private_eye qbert road_runner
robotank seaquest
skiing
solaris
space_invaders
star_gunner
surround tennis
time_pilot
tutankham venture
video_pinball wizard_of_wor yars_revenge zaxxon
""" def fun(games):
ok = 0
no_ok = 0
for i in games.split():
if i in set(atari_py.list_games()):
ok += 1
else:
no_ok += 1
print(i, "not in environment !!!") print(ok, " games in local environment")
print(no_ok, " games not in local environment") fun(games)
结果:

=======================================================
atari_2600 游戏镜像权威下载地址:
http://www.atarimania.com/rom_collection_archive_atari_2600_roms.html
=======================================================
注意:( 更正 !!! )
这里的surround.bin 文件无法导入内存,该款游戏无法正常运行。另外pacman游戏也有这个问题。本文中的54个游戏其实只有53个是可以正常运行的。
强化学习baseline论文—— rainbow算法中给出实验结果的54个atari2600游戏名称列表的更多相关文章
- temporal credit assignment in reinforcement learning 【强化学习 经典论文】
Sutton 出版论文的主页: http://incompleteideas.net/publications.html Phd 论文: temporal credit assignment i ...
- 强化学习(Reinforcement Learning)中的Q-Learning、DQN,面试看这篇就够了!
1. 什么是强化学习 其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报. ...
- (转) 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文)
本文转自:http://mp.weixin.qq.com/s/aAHbybdbs_GtY8OyU6h5WA 专题 | 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文) 原创 201 ...
- ICML论文|阿尔法狗CTO讲座: AI如何用新型强化学习玩转围棋扑克游戏
今年8月,Demis Hassabis等人工智能技术先驱们将来到雷锋网“人工智能与机器人创新大会”.在此,我们为大家分享David Silver的论文<不完美信息游戏中的深度强化学习自我对战&g ...
- 【转载】 DeepMind发表Nature子刊新论文:连接多巴胺与元强化学习的新方法
原文地址: baijiahao.baidu.com/s?id=1600509777750939986&wfr=spider&for=pc 机器之心 18-05-15 14:26 - ...
- 强化学习中的无模型 基于值函数的 Q-Learning 和 Sarsa 学习
强化学习基础: 注: 在强化学习中 奖励函数和状态转移函数都是未知的,之所以有已知模型的强化学习解法是指使用采样估计的方式估计出奖励函数和状态转移函数,然后将强化学习问题转换为可以使用动态规划求解的 ...
- 【强化学习】DQN 算法改进
DQN 算法改进 (一)Dueling DQN Dueling DQN 是一种基于 DQN 的改进算法.主要突破点:利用模型结构将值函数表示成更加细致的形式,这使得模型能够拥有更好的表现.下面给出公式 ...
- 深度强化学习中稀疏奖励问题Sparse Reward
Sparse Reward 推荐资料 <深度强化学习中稀疏奖励问题研究综述>1 李宏毅深度强化学习Sparse Reward4 强化学习算法在被引入深度神经网络后,对大量样本的需求更加 ...
- Deep Learning专栏--强化学习之从 Policy Gradient 到 A3C(3)
在之前的强化学习文章里,我们讲到了经典的MDP模型来描述强化学习,其解法包括value iteration和policy iteration,这类经典解法基于已知的转移概率矩阵P,而在实际应用中,我们 ...
- 强化学习(十二) Dueling DQN
在强化学习(十一) Prioritized Replay DQN中,我们讨论了对DQN的经验回放池按权重采样来优化DQN算法的方法,本文讨论另一种优化方法,Dueling DQN.本章内容主要参考了I ...
随机推荐
- 2 分钟,搞懂 SLO 最佳实践
本文是<SRE,Google运维解密>读书笔记,连载第三篇.微信公众号修改了推文逻辑,尤其是 iOS,建议对本公众号 SRETalk 加星标,以免错过后续系列推文. 本文介绍 SLO,曾经 ...
- docker综合应用
1.容器资源限制 官网文档 https://docs.docker.com/config/containers/resource_constraints/ 2.docker内存限制 -m或者--mem ...
- zabbix如何监控服务器
1.zabbix架构图 zabbix核心概念 先记住如下zabbix中的核心几个概念 主机 ( HOST ) : 就是具体的一个监控对象,某一个被监控的实例,可以是一个数据库,也可以是一个操作系统. ...
- AlertManager解析:构建高效告警系统
本文深入探讨了AlertManager的技术细节和实际应用,从基本概念.核心组件.工作流程,到与Prometheus的集成和实战案例,旨在为专业人士提供一个全面的AlertManager技术和应用指南 ...
- OpenCompass 作业
Smiling & Weeping ---- 愿我们都做生活的高手 -- 昭阳&乐瑶
- 实验六-Salt本地pojie实验
[实验目的]了解Salt型密码的加密机制,学会使用本地密码pojie工具来pojieSalt型密码,了解pojie密码原理. [知识点]Salt,密码pojie [实验原理] 1.Salt概念 在密码 ...
- Fedora升级33->34
Fedora升级33->34 1. dnf --refresh upgrade 2. dnf install dnf-plugin-system-upgrade --best 3. ...
- 一款开源、免费、现代化风格的WPF UI控件库 - ModernWpf
前言 今天大姚给大家分享一款开源(MIT License).免费.现代化风格的WPF UI控件库:ModernWpf. 项目介绍 ModernWpf是一个开源项目,它为 WPF 提供了一组现代化的控件 ...
- Android案例分享,基于瑞芯微RK3568国产平台!
开发环境说明 Windows开发环境:Windows7 64bit.Windows10 64bit 虚拟机:VMware15.5.5 AndroidSDK编译环境:Ubuntu18.04.4 64bi ...
- [FLET] 01 可以拖动的方块
from typing import List import flet from flet import ( Container, Draggable, DragTarget, Page, Row, ...