在本文中,我们提出了一个框架,用于结合基于深度学习的道路检测,粒子滤波器和模型预测控制(MPC),只使用单目相机,IMU和车轮速度传感器。该框架使用结合LSTM的深度卷积神经网络来学习车辆前方轨道的本地成本图表示。 Aparticle过滤器使用此动态观察模型在原理图中进行定位,并使用MPC积极地使用此基于粒子过滤器的状态估计进行驱动。我们展示了广泛的真实世界测试结果,并证明了车辆在复杂的污垢轨道上的摩擦极限下的可靠运行。我们使用我们的1:5比例测试车,在长达105英尺(32米)的泥路上达到27英里/小时(12米/秒)以上的速度。
translated by 谷歌翻译
我们考虑用于表示车辆动力学的神经网络的在线适应问题。神经网络模型旨在由MPC控制法使用以自主地控制车辆。这个问题具有挑战性,因为输入和目标分布都是非平稳的,而在线适应的天真方法会导致灾难性的遗忘,从而导致控制器故障。我们提出了一种新颖的在线学习方法,它将伪排练方法与局部加权投影回归相结合。我们证明了在模拟中使用局部加权投影回归伪排练(LW-PR $ ^ 2 $)方法的有效性以及使用1/5比例自动驾驶车辆收集的大型真实世界数据集。
translated by 谷歌翻译
在本文中,我们提出了一种新颖的信息处理架构,即自动系统的前端到端视觉导航。所提出的信息处理体系结构用于支持基于感知注意的预测控制算法,该算法利用模型预测控制,卷积神经网络和不确定性量化方法。 keyidea依赖于使用模型预测控制来训练卷积神经网络以预测输入视觉信息中的感兴趣区域。然后将这些感兴趣的区域用作Macula-Network的输入,Macula-Network是一个3D卷积神经网络,经过训练可以产生控制动作,以及估计输入数据流中的认知和任意不确定性。所提出的架构在模拟示例和1:5比例尺的地面车辆上进行测试。实验结果表明,所提出的体系结构优于先前的方法,用于早期检测初始训练集之外的新对象/数据。所提出的架构是在安全关键域中使用端到端感知控制策略的第一步。
translated by 谷歌翻译
在本文中,我们利用非线性随机最优控制理论,应用数学和机器学习领域的最新进展,提出了一种新的决策不确定性方法。我们的工作基于非线性Feynman-Kac引理和后向非线性偏微分方程与前向 -​​ 后向随机微分方程之间的基本联系。利用这些联系和我们对前后随机微分方程的重要性抽样的前期工作的结果,我们开发了一个可扩展的控制框架,适用于机器人和自治的一般随机系统和决策问题公式。提出了两种随机控制架构,包括前馈和递归神经网络。在两个随机最优控制问题公式中研究了上述算法的性能和可扩展性,包括无约束L2和控制约束情况,以及三个仿真系统。最后,我们讨论了所提算法对机器人和自治系统的影响。
translated by 谷歌翻译
样本效率对于解决现实世界的强化学习问题至关重要,因为代理与环境之间的相互作用可能代价高昂。事实证明,专家建议的模仿学习是减少培训政策所需交互次数的有效策略。在线模拟学习是政策评估和政策优化的交叉,是一种特别有效的技术,具有可证明的性能保证。在这项工作中,我们寻求进一步加快在线模拟学习的收敛速度,从而使其更具样本效率。我们提出了两种基于模型的算法,其灵感来自跟随领导者(FTL)和预测:MoBIL-VI基于解决变分不等式,MoBIL-Prox基于随机一阶更新。这两种方法利用模型来预测未来的梯度,以加速政策学习。当在线学习模型oracle时,这些算法可以证明可以加速最佳已知的收敛速度。我们的算法可以看作是stochasticMirror-Prox的一般化(Juditsky et al。,2011),并且承认了一种简单的建设性FTL风格的性能分析。
translated by 谷歌翻译
我们建议使用贝叶斯网络,其提供平均值和不确定性估计作为输出,以在测试时输入与训练集显着不同的情况下增强学习控制策略的安全性。我们的算法结合了强化学习和结束模仿学习,同时学习控制策略以及学习模型的预测不确定性的阈值,无需调整。当超过不确定性阈值时,采取纠正措施,例如将控制返回到模型预测控制器或人类专家。我们使用深度卷积贝叶斯神经网络,使用车竿和自动驾驶模拟,在完全可观察和基于视觉的部分可观测系统上验证我们的方法。我们证明了我们的方法对变化系统动力学以及部分状态可观测性导致的不确定性具有鲁棒性。
translated by 谷歌翻译
声学数据提供从生物学和通信到海洋和地球科学等领域的科学和工程见解。我们调查了机器学习(ML)的进步和变革潜力,包括声学领域的深度学习。 ML是用于自动检测和利用模式印度的广泛的统计技术家族。相对于传统的声学和信号处理,ML是数据驱动的。给定足够的训练数据,ML可以发现特征之间的复杂关系。通过大量的训练数据,ML candiscover模型描述复杂的声学现象,如人类语音和混响。声学中的ML正在迅速发展,具有令人瞩目的成果和未来的重大前景。我们首先介绍ML,然后在五个声学研究领域强调MLdevelopments:语音处理中的源定位,海洋声学中的源定位,生物声学,地震探测和日常场景中的环境声音。
translated by 谷歌翻译
在过去几年中,我们一直在目睹网络上错误信息的兴起。人们在日常生活中成为假新闻的受害者,并在无意中帮助他们进一步传播。有许多举措试图减轻虚假新闻造成的损害,重点放在来自域名列表,在线社交网络或人工智能的信号上。在这项工作中,我们提出了Check-It,这是一个以智能方式将各种信号组合到管道中以进行假新闻识别的系统。 Check-It是一个Web浏览器插件,具有高效和及时的假新闻检测目标,尊重用户的隐私。实验结果表明,Check-It能够胜过最先进的方法。在数据集上,由9百万个标记为假和真实的文章组成,Check-It获得的分类准确度高达99%。
translated by 谷歌翻译
多模态运动(例如陆地,航空和水上运动)越来越受到机器人研究的兴趣,因为它改善了机器人的环境适应性,运动多功能性和操作灵活性。在地面多个运动机器人中,混合机器人的优势源于其多种(两种或更多种)运动模式,其中机器人可以根据遇到的地形条件进行选择。然而,在改善多个运动模式之间的运动模式转换的自主性方面存在许多挑战。这项工作提出了一种实现atrack-legged四足机器人步骤协商的自主运动模式转换的方法。通过提出的比较滚动和行走运动模式的能量性能的标准,实现了决策过程的自主性。为了实现能源评估目的,提出了两个攀登阶段以实现平稳的步骤谈判行为。模拟显示自主运动模式转换被实现用于具有不同高度的步骤的协商。所提出的方法足够通用,可以在对其运动能量性能进行一些预先研究之后用于其他混合机器人。
translated by 谷歌翻译
认识到作为诗歌或散文的一段文字对于大多数人来说通常都很容易;但是,只有专家可以确定哪个仪表是poembelongs。在本文中,我们建立了回归神经网络(RNN)模型,可以根据纯文本中的米来对诗歌进行分类。输入文本在字符级别进行编码,并直接输入到模型而不进行特征处理。这是机器理解和语言合成的一个进步,尤其是阿拉伯语。在16个阿拉伯语和4米英语的诗歌中,网络能够对诗歌进行错误的分类,总体准确率分别为96.38%和82.31%。用于进行这项研究的诗集数据量很大,超过150万节经文,并且来自不同的非技术资源,几乎阿拉伯和英国文学网站,以及不同的异构和非结构化格式。现在,这些数据集以干净,结构化和文档化的格式公开提供,供其他未来研究使用。据作者所知,这项研究是第一个通过机器学习方法对诗计进行分类,特别是在RNN无特征方法中。此外,该数据集是第一个公开可用的数据集,可用于未来的计算研究。
translated by 谷歌翻译