文献地址 链接:https://pan.baidu.com/s/1gHrpnOf1FXLp9u8OJ2-oCg 提取码:y2w6 作者 Shashank Kotyan, Danilo Vasconcellos Vargas and Venkanna U. 摘要 从本质上讲,驾驶是一个适合强化学习范式的马尔可夫决策过程.本文提出了一种不需要人工辅助就能学会驾驶汽车的新型算法.我们使用强化学习和进化策略的概念在二维仿真环境中训练我们的模型.通过在自动编码器中引入不同的图像,我们的模型的架构超越了世界…