近年来,自动微动性吸引了研究人员和从业者的注意。许多微型传输车辆的关键组成部分是DC电动机,DC电动机是连续且非线性的复杂动力系统。对于需要稳健性和稳定性的各种应用,需要在存在干扰和不确定性的情况下快速控制直流电动机。完成此任务的技术通常依赖于数学系统模型,该模型通常不足以预测非线性的时变和相互关联来源的影响。尽管某些无模型方法在任务方面取得了成功,但它们依赖于与系统的大规模交互,并接受了专门的硬件培训,以适合高度参数化的控制器。在这项工作中,我们学会通过样品有效的增强学习来引导直流电动机。使用现实世界中硬件交互收集的数据,我们还构建了一个模拟器,以实验各种参数和学习策略。找到最佳参数,我们在模拟的一分钟和53秒内学习了有效的控制策略,并在10分钟35秒内在物理系统上学习了一个有效的控制策略。
translated by 谷歌翻译