智能论文笔记

Infusing model predictive control into meta-reinforcement learning for mobile robots in dynamic environments

Jaeuk Shin , Astghik Hakobyan , Mingyu Park , Yeoneung Kim , Gihun Kim , Insoon Yang

分类：机器人

2021-09-15

移动机器人的成功操作要求它们迅速适应环境变化。为了为移动机器人开发自适应决策工具，我们提出了一种新颖的算法，该算法将元强化学习（META-RL）与模型预测控制（MPC）相结合。我们的方法采用额外的元元素算法作为基线，以使用MPC生成的过渡样本来训练策略，当机器人检测到某些事件可以通过MPC有效处理的某些事件，并明确使用机器人动力学。我们方法的关键思想是以随机和事件触发的方式在元学习策略和MPC控制器之间进行切换，以弥补由有限的预测范围引起的次优MPC动作。在元测试期间，将停用MPC模块，以显着减少运动控制中的计算时间。我们进一步提出了一种在线适应方案，该方案使机器人能够在单个轨迹中推断并适应新任务。通过使用（i）障碍物的合成运动和（ii）现实世界的行人运动数据，使用非线性汽车样的车辆模型来证明我们方法的性能。模拟结果表明，我们的方法在学习效率和导航质量方面优于其他算法。

translated by 谷歌翻译

传统的数据湖泊通过启用时间旅行，运行SQL查询，使用酸性交易摄入数据以及可视化PBABYTE尺度数据集在云存储中，为分析工作负载提供了关键的数据基础架构。它们使组织能够分解数据孤岛，解锁数据驱动的决策，提高运营效率并降低成本。但是，随着深度学习接管常见的分析工作流程，传统数据湖泊对诸如自然语言处理（NLP），音频处理，计算机视觉和涉及非尾巴数据集的应用程序的有用程度降低。本文介绍了Deep Lake，这是一个开源湖泊，用于在Activeloop开发的深度学习应用程序。 Deep Lake保持了一项关键区别的香草数据湖的好处：它以张量的形式存储复杂数据，例如图像，视频，注释以及表格数据，并将数据迅速流式传输到网络上（a ）张量查询语言，（b）浏览器可视化引擎或（c）不牺牲GPU利用率的深度学习框架。可以从Pytorch，Tensorflow，Jax，与许多MLOPS工具集成在一起的数据集。

translated by 谷歌翻译