State-of-the-art forward facing monocular visual-inertial odometry algorithms are often brittle in practice, especially whilst dealing with initialisation and motion in directions that render the state unobservable. In such cases having a reliable complementary odometry algorithm enables robust and resilient flight. Using the common local planarity assumption, we present a fast, dense, and direct frame-to-frame visual-inertial odometry algorithm for downward facing cameras that minimises a joint cost function involving a homography based photometric cost and an IMU regularisation term. Via extensive evaluation in a variety of scenarios we demonstrate superior performance than existing state-of-the-art downward facing odometry algorithms for Micro Aerial Vehicles (MAVs).
translated by 谷歌翻译
Autonomous navigation for large Unmanned Aerial Vehicles (UAVs) is fairlystraight-forward, as expensive sensors and monitoring devices can be employed.In contrast, obstacle avoidance remains a challenging task for Micro AerialVehicles (MAVs) which operate at low altitude in cluttered environments. Unlikelarge vehicles, MAVs can only carry very light sensors, such as cameras, makingautonomous navigation through obstacles much more challenging. In this paper,we describe a system that navigates a small quadrotor helicopter autonomouslyat low altitude through natural forest environments. Using only a single cheapcamera to perceive the environment, we are able to maintain a constant velocityof up to 1.5m/s. Given a small set of human pilot demonstrations, we use recentstate-of-the-art imitation learning techniques to train a controller that canavoid trees by adapting the MAVs heading. We demonstrate the performance of oursystem in a more controlled environment indoors, and in real natural forestenvironments outdoors.
translated by 谷歌翻译
多模式语言模型试图将非语言特征结合到语言建模任务中。在这项工作中,我们扩展了标准的递归神经网络(RNN)语言模型,其中包含从视频中派生的特征。我们训练我们的模型的数据比先前工作中使用的数据集大两个数量级。我们对模型体系结构进行了全面的探索,以结合视觉和文本功能。我们在两个语料库(YouCookII和200bn-something-something-v2)上的实验表明,表现最佳的体系结构包括视觉和文本特征的中间融合,在困惑中产生超过25%的相对改善。我们报告的分析提供了我们的多模式语言模型改进标准RNN语言模型的原因。
translated by 谷歌翻译
当机器学习系统因对抗操纵而失败时,社会可以期待什么样的法律救济?通过基于对抗ML文献的场景,我们探讨了计算机犯罪,版权和侵权法的某些方面如何与扰动,中毒和模型转换,模型反转攻击相结合,以显示某些攻击比其他攻击更可能导致责任。最后,我们呼吁采取行动让MLresearchers投资于透明的攻击和防御基准;建筑师ML系统考虑到取证,最后,在公民自由的背景下更多地考虑对抗机器学习。该论文针对没有法律背景的ML研究人员。
translated by 谷歌翻译
差异隐私关注预测质量,同时测量对信息包含在数据中的个人的隐私影响。我们考虑与引起结构化稀疏性的规则制定者的差异私人风险最小化问题。已知这些正则化器是凸的,但它们通常是不可微分的。我们分析了标准的不同私有算法,例如输出扰动,Frank-Wolfe和目标扰动。输出扰动是一种差异私有算法,众所周知,它可以很好地降低强凸的风险。以前的工作已经导出了与维度无关的超额风险界限。在本文中,我们假设一类特定的凸但非光滑正则化器,它们导致广义线性模型的结构化稀疏性和损失函数。我们还考虑差异私有Frank-Wolfeal算法来优化风险最小化问题的双重性。我们得出这两种算法的过度风险界限。两个边界都取决于双范数的单位球的高斯宽度。我们还表明,风险最小化问题的客观扰动等同于双优化问题的输出扰动。这是在差异隐私的背景下分析风险最小化问题的双重优化问题的第一部作品。
translated by 谷歌翻译
从表面心电图(ECG)无创重建心脏跨膜电位(TMP)涉及一个不适定的逆问题。模型约束正则化对于结合关于时空TMP动力学的丰富的生理学知识是有力的。这些模型由高维物理参数控制,如果固定,则可以引入模型误差并降低TMP重建的准确性。然而,由于它们的高维度,在TMP重建期间同时适应这些参数是困难的。我们引入了一种新的模型约束推理框架,该框架用经过训练的深度生成模型取代传统的生理模型,以从低维生成因子生成TMP序列。使用具有长期短期记忆(LSTM)网络的变分自动编码器(VAE),我们训练VAE解码器以学习TMP的条件可能性,同时编码器学习生成因子的先前分布。这两个组件使我们能够开发出一种有效的算法来同时推断来自ECG数据的生成因子和TMP信号。综合和实际数据实验表明,与传统生理模型约束或没有生理学约束的方法相比,所提出的方法显着提高了TMP重建的准确性。
translated by 谷歌翻译
连通性维护在一群机器人中实现理想的全球行为方面发挥着关键作用。但是,由于缺乏计算资源,低通信带宽,机器人故障和链路不稳定,现实环境中的连接维护受到阻碍。在本文中,我们提出了一种新颖的分散式连接保留算法,该算法可以在其他行为之上进行部署,以强制实施连接约束。该算法需要达到一组目标,同时保持机器人之间的最小数量的冗余链路,目的是保证带宽和可靠性。然后机器人以指定数量的链接递增地构建和维护通信骨干。我们凭经验研究算法的性能,分析其收敛时间,以及注入骨干机器人的故障的鲁棒性。我们的结果证明了该算法能够保持所需的连接约束,并且能够在通信骨干中达到高达70%的个人机器人故障。
translated by 谷歌翻译
生成模型已经为零镜头学习问题实现了最先进的性能,但是每次遇到新的对象类别时它们都需要重新训练分类器。传统的语义嵌入方法虽然非常优雅,但通常与其生成对应方不相同。在这项工作中,我们提出了一个统一的框架,称为GenClass,它将生成器与分类器集成在一起,实现高效的零镜头学习,从而结合了生成方法的代表性力量和嵌入方法的优雅。统一框架的端到端培训不仅像生成方法那样消除了对新对象类别的额外分类器的要求,而且还有助于产生更具辨别力和有用的特征。对三个标准零射击对象分类数据集(即AWA)进行了广泛的评估,CUB和SUN显示了所提出的方法的有效性。该方法没有任何修改,也为零射击动作分类提供了最先进的性能,从而显示了其对其他领域的可归属性。
translated by 谷歌翻译
研究人员经常通过他们的应用程序编程接口(API)查询在线社交平台,以找到目标人群,例如人类患有疾病的人[\ cite {De-Choudhury2017}和jazzmusicians~ \ cite {heckathorn2001finding}。这些目标群体的实体满足通常使用oracle(人类或预先训练的分类器)识别的属性。当目标实体的属性不能通过API直接查询时,我们将属性称为“隐藏”,将人口称为隐藏群体。在社交网络上查找属于这些人群的人很难,因为他们是不可查询的,并且采样器必须从有限预算限制内的组合查询空间进行探索。通过利用可查询属性和感兴趣的人口之间的相关性以及通过对查询空间进行分层排序,我们提出了一个基于决策树的Thompson采样器(\ texttt {DT-TMP}),可以有效地发现要查询的正确属性组合。我们提出的采样器在在线实验中的表现优于最先进的采样器,例如推特上的54%。当离线实验中已知查询的匹配程度数时,\ texttt {DT-TMP}在基线采样器上的执行速度比0.9-1.5 $ \ times $好。在未来,我们希望通过制定更复杂的查询来探索寻找隐藏人口的选择。
translated by 谷歌翻译
虽然卷积神经网络(CNN)在各种分类/识别任务上取得了令人瞩目的成绩,但它们通常包含大量参数。这导致显着的存储器需求以及计算开销。因此,需要用于压缩基于CNN的模型的过滤器级修剪方法,这不仅减少了参数的总数,而且还减少了整体计算。我们提出了一个新的min-max框架,用于CNN的过滤级修剪。我们的框架,称为Play和Prune(PP),通过自适应修剪,共同修剪和微调CNN模型参数,同时保持模型的预测性能。我们的框架由两个模块组成:(1)自适应滤波器修剪(AFP)模块,它最大限度地减少了模型中滤波器的数量; (2)修剪率控制器(PRC)模块,其在修剪期间最大化精确度。此外,与以前的方法不同,我们的方法允许直接指定欲望差异而不是修剪级别。我们的压缩模​​型可以在运行时进行部署,无需任何特殊的库或硬件。我们的方法减少了VGG-16的参数数量,令人印象深刻的因子为17.5倍,FLOPS的数量减少了6.43倍,没有精度损失,显着优于其他最先进的滤波器修剪方法。
translated by 谷歌翻译