尽管在过去的十年中已经在很大程度上研究了原始图像的加固学习(RL),但现有方法仍然受到许多限制。通常使用专家知识来处理高输入维度,以提取手工制作的功能或通过卷积网络编码的环境。两种解决方案都需要优化许多参数。相比之下,我们提出了一种通用方法,可以从很少有训练参数的原始图像中提取稀疏特征。我们直接在原始图像上使用径向基函数网络(RBFN)实现了这一点。我们评估了Vizdoom环境中Q学习任务中提出的视觉提取方法的性能。然后,我们将结果与两个深Q网络进行了比较,一个直接在图像上训练,另一个对由预验证的自动编码器提取的功能进行了训练。我们表明,所提出的方法提供了类似的或在某些情况下具有更少的可训练参数的更好的性能,而在概念上更简单。
translated by 谷歌翻译