强化学习baseline论文—— rainbow算法中给出实验结果的54个atari2600游戏名称列表

alien

amidar

assault

asterix

asteroids

atlantis 

bank_heist

battle_zone

beam_rider

berzerk

bowling

boxing

breakout  

centipede

chopper_command

crazy_climber 

defender

demon_attack

double_dunk 

enduro

fishing_derby

freeway

frostbite

gopher

gravitar

hero

ice_hockey

kangaroo

krull

kung_fu_master

montezuma_revenge

ms_pacman

name_this_game

phoenix

pitfall

pong

private_eye

qbert

road_runner

robotank

seaquest

skiing

solaris

space_invaders

star_gunner

surround

tennis

time_pilot

tutankham

venture

video_pinball

wizard_of_wor

yars_revenge

zaxxon

个人整理的 bin 文件地址：

https://gitee.com/devilmaycry812839668/atari_roms

原bin地址：

https://github.com/Kojoley/atari-py/tree/master/atari_py/atari_roms

测试本地环境下是否已经安装好这54个游戏的环境：

前提：

已经安装atari_py库，同时在atari_py库下的atari_roms文件夹下存放了所有的游戏bin文件。

测试代码：

import atari_py

games="""

alien

amidar

assault

asterix

asteroids

atlantis 

bank_heist

battle_zone

beam_rider

berzerk

bowling

boxing

breakout  

centipede

chopper_command

crazy_climber 

defender

demon_attack

double_dunk 

enduro

fishing_derby

freeway

frostbite

gopher

gravitar

hero

ice_hockey

kangaroo

krull

kung_fu_master

montezuma_revenge

ms_pacman

name_this_game

phoenix

pitfall

pong

private_eye

qbert

road_runner

robotank

seaquest

skiing

solaris

space_invaders

star_gunner

surround

tennis

time_pilot

tutankham

venture

video_pinball

wizard_of_wor

yars_revenge

zaxxon

"""

def fun(games):

    ok = 0

    no_ok = 0

    for i in games.split():

        if i in set(atari_py.list_games()):

            ok += 1

        else:

            no_ok += 1

            print(i, "not in environment !!!")

    print(ok, " games in local environment")

    print(no_ok, " games not in local environment")

fun(games)

结果：

=======================================================

atari_2600 游戏镜像权威下载地址：

http://www.atarimania.com/rom_collection_archive_atari_2600_roms.html

=======================================================

注意：（更正！！！）

这里的surround.bin 文件无法导入内存，该款游戏无法正常运行。另外pacman游戏也有这个问题。本文中的54个游戏其实只有53个是可以正常运行的。

强化学习baseline论文—— rainbow算法中给出实验结果的54个atari2600游戏名称列表的更多相关文章

temporal credit assignment in reinforcement learning 【强化学习经典论文】
Sutton 出版论文的主页: http://incompleteideas.net/publications.html Phd 论文: temporal credit assignment i ...
强化学习(Reinforcement Learning)中的Q-Learning、DQN，面试看这篇就够了！
1. 什么是强化学习其他许多机器学习算法中学习器都是学得怎样做,而强化学习(Reinforcement Learning, RL)是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报. ...
(转) 深度强化学习综述：从AlphaGo背后的力量到学习资源分享（附论文）
本文转自:http://mp.weixin.qq.com/s/aAHbybdbs_GtY8OyU6h5WA 专题 | 深度强化学习综述:从AlphaGo背后的力量到学习资源分享(附论文) 原创 201 ...
ICML论文｜阿尔法狗CTO讲座： AI如何用新型强化学习玩转围棋扑克游戏
今年8月,Demis Hassabis等人工智能技术先驱们将来到雷锋网“人工智能与机器人创新大会”.在此,我们为大家分享David Silver的论文<不完美信息游戏中的深度强化学习自我对战&g ...
【转载】 DeepMind发表Nature子刊新论文：连接多巴胺与元强化学习的新方法
原文地址: baijiahao.baidu.com/s?id=1600509777750939986&wfr=spider&for=pc 机器之心 18-05-15 14:26 - ...
强化学习中的无模型基于值函数的 Q-Learning 和 Sarsa 学习
强化学习基础: 注: 在强化学习中奖励函数和状态转移函数都是未知的,之所以有已知模型的强化学习解法是指使用采样估计的方式估计出奖励函数和状态转移函数,然后将强化学习问题转换为可以使用动态规划求解的 ...
【强化学习】DQN 算法改进
DQN 算法改进 (一)Dueling DQN Dueling DQN 是一种基于 DQN 的改进算法.主要突破点:利用模型结构将值函数表示成更加细致的形式,这使得模型能够拥有更好的表现.下面给出公式 ...
深度强化学习中稀疏奖励问题Sparse Reward
Sparse Reward 推荐资料 <深度强化学习中稀疏奖励问题研究综述>1 李宏毅深度强化学习Sparse Reward4 强化学习算法在被引入深度神经网络后,对大量样本的需求更加 ...
Deep Learning专栏--强化学习之从 Policy Gradient 到 A3C（3）
在之前的强化学习文章里,我们讲到了经典的MDP模型来描述强化学习,其解法包括value iteration和policy iteration,这类经典解法基于已知的转移概率矩阵P,而在实际应用中,我们 ...
强化学习(十二) Dueling DQN
在强化学习(十一) Prioritized Replay DQN中,我们讨论了对DQN的经验回放池按权重采样来优化DQN算法的方法,本文讨论另一种优化方法,Dueling DQN.本章内容主要参考了I ...

随机推荐

jenkins结合远程仓库
既然是持续集成,对代码进行构建,我们得获取代码仓库的内容,这里选择我们搭建的gitlab服务器 1.开发工程师的机器 1. 在window上生成ssh-key $ ssh-keygen.exe -t ...
聊聊GLM-4-9B开源模型的微调loss计算
概述 Github官方地址:GLM-4 网上已经有很多关于微调的文章,介绍各种方式下的使用,这里不会赘述.我个人比较关心的是微调时的loss计算逻辑,这点在很多的文章都不会有相关的描述,因为大多数人都 ...
IDEA环境编译Spring源码
一.下载源码 1.官网下载官网地址如下图 2.github git下载 github地址如下图 3.gitee git下载(国内推荐使用) gitee地址如图查看对应的gradle版本在下 ...
NetCore Benchmark 基准测试
基于NetCore的基准测试Demo(控制台程序) 创建控制台程序,输入工程名称 LinqConsole 通过NuGet引用BenchmarkDotNet至工程中编写测试代码类:Bench ...
【Playwright+Python】系列教程（一）环境搭建及脚本录制
前言看到这个文章,有的同学会说: 六哥,你为啥不早早就写完python系列的文章. 因为有徒弟需要吧,如果你也想学自学,那这篇文章,可以说是我们结缘一起学习的开始吧! 如果对你有用,建议收藏和转发! ...
linux下安装oracle 11g(静默安装)
关闭selinux 关闭防火墙检查安装依赖包 yum -y install binutils compat-libcap1 vsftpd gcc gcc-c++ glibc-devel glibc ...
spring事务传递特性-REQUIRES_NEW和NESTED
spring对于事务的实现的确是它的一大优点,节省了程序员不少时间. 关于事务,有许多可以聊的内容,例如实现方式.实现原理.传递特性等. 本文讨论传递特性中的REQUIRES_NEW,NESTED. ...
Android 各层架构
Android应用框架层和硬件抽象层以及底层之间的关系 1. JNI技术: (1).JNI技术简单的说就是在本地Java语言声明本地方法和加载动态链接库(.so文件) (2).动态链接库(.so文件) ...
Nuxt3 的生命周期和钩子函数（六）
title: Nuxt3 的生命周期和钩子函数(六) date: 2024/6/30 updated: 2024/6/30 author: cmdragon excerpt: 摘要:本文深入解析了Nu ...
实测分享，瑞芯微RK3588八核国产处理器性能测评！确实“遥遥领先”！
RK3588处理器优势 RK3588是瑞芯微最新一代旗舰工业处理器,它具有如下卓越优势: 超强运算能力:四核ARM Cortex-A76@2.4GHz + 四核ARM Cortex-A55@1.8GH ...

强化学习baseline论文—— rainbow算法中给出实验结果的54个atari2600游戏名称列表

强化学习baseline论文—— rainbow算法中给出实验结果的54个atari2600游戏名称列表的更多相关文章

随机推荐

热门专题