郑重声明:原文参见标题,如有侵权,请联系作者,将会撤销发布! arXiv:1710.02298v1 [cs.AI] 6 Oct 2017 (AAAI 2018) Abstract 深度强化学习社区对DQN算法进行了一些独立的改进.但是,尚不清楚这些扩展中的哪些是互补的,是否可以有效地组合.本文研究了DQN算法的六个扩展,并通过经验研究了它们的组合.我们的实验表明,该组合在数据效率和最终性能方面均提供了Atari 2600基准测试的最新性能.我们还提供了详细的消融研究结果,显示了每个组件对整体性能…