Autonomous navigation for large Unmanned Aerial Vehicles (UAVs) is fairlystraight-forward, as expensive sensors and monitoring devices can be employed.In contrast, obstacle avoidance remains a challenging task for Micro AerialVehicles (MAVs) which operate at low altitude in cluttered environments. Unlikelarge vehicles, MAVs can only carry very light sensors, such as cameras, makingautonomous navigation through obstacles much more challenging. In this paper,we describe a system that navigates a small quadrotor helicopter autonomouslyat low altitude through natural forest environments. Using only a single cheapcamera to perceive the environment, we are able to maintain a constant velocityof up to 1.5m/s. Given a small set of human pilot demonstrations, we use recentstate-of-the-art imitation learning techniques to train a controller that canavoid trees by adapting the MAVs heading. We demonstrate the performance of oursystem in a more controlled environment indoors, and in real natural forestenvironments outdoors.
translated by 谷歌翻译
多模式语言模型试图将非语言特征结合到语言建模任务中。在这项工作中,我们扩展了标准的递归神经网络(RNN)语言模型,其中包含从视频中派生的特征。我们训练我们的模型的数据比先前工作中使用的数据集大两个数量级。我们对模型体系结构进行了全面的探索,以结合视觉和文本功能。我们在两个语料库(YouCookII和200bn-something-something-v2)上的实验表明,表现最佳的体系结构包括视觉和文本特征的中间融合,在困惑中产生超过25%的相对改善。我们报告的分析提供了我们的多模式语言模型改进标准RNN语言模型的原因。
translated by 谷歌翻译
胶质瘤是最常见的原发性脑恶性肿瘤,具有不同程度的侵袭性,可变预后和各种异质性组织亚区域,即肿瘤周围水肿/侵入组织,坏死核心,活性和非增强核心。这种内在的异质性也被用于它们的放射性表型,因为它们的子区域通过在多参数磁共振成像(mpMRI)扫描中传播的不同强度分布来描绘,反映了不同的生物学特性。它们的异质形状,范围和位置是其中的一部分。使这些肿瘤难以切除的因素,在某些情况下无法手术。切除肿瘤的数量也是纵向扫描中考虑的一个因素,用于评估表观肿瘤以进行潜在的进展诊断。此外,有越来越多的证据表明,各种肿瘤亚区域的准确分割可以为定量图像分析提供预测患者整体的基础。生存。该研究评估了在国际脑肿瘤分割(BraTS)挑战的最后七个实例(即2012-2018)期间用于mpMRI扫描中的脑肿瘤图像分析的最先进的机器学习(ML)方法。具体而言,我们专注于i)评估术前mpMRI扫描中各种神经胶质瘤亚区的分割,ii)通过肿瘤亚区的纵向生长评估潜在的肿瘤进展,超出RECIST标准的使用,以及iii)预测整体术前mpMRI扫描对经历完全切除的患者的生存率。最后,我们研究了为每个任务确定最佳ML算法的挑战,考虑到除了在每个挑战实例上多样化之外,多机构mpMRI BraTS数据集也是一个不断发展/不断发展的数据集。
translated by 谷歌翻译
当机器学习系统因对抗操纵而失败时,社会可以期待什么样的法律救济?通过基于对抗ML文献的场景,我们探讨了计算机犯罪,版权和侵权法的某些方面如何与扰动,中毒和模型转换,模型反转攻击相结合,以显示某些攻击比其他攻击更可能导致责任。最后,我们呼吁采取行动让MLresearchers投资于透明的攻击和防御基准;建筑师ML系统考虑到取证,最后,在公民自由的背景下更多地考虑对抗机器学习。该论文针对没有法律背景的ML研究人员。
translated by 谷歌翻译
本文描述了我们的表面实现共享任务2018(SRST'18)的浅轨道提交系统。任务是将真正的UDstructures转换成正确的句子形式,从这些UDstructures中删除了词序信息,并将tokenshad语法化。我们将问题陈述分为两个部分,即单词重新反射和正确的词序预测。对于第一个子问题,我们使用基于长短期记忆的编码器 - 解码器方法。对于第二个子问题,我们提出了一种基于LanguageModel(LM)的方法。我们在LMBased方法中应用两种不同的子方法,这两种方法的组合结果被认为是系统的最终输出。
translated by 谷歌翻译
在本文中,我们提出了一种针对低功率汽车级SoC优化的多任务卷积神经网络(CNN)架构。我们介绍了基于统一架构的网络,其中编码器在两个任务之间共享,即检测和分段。提议的网络运行速度为25FPS,分辨率为1280x800。我们简要讨论了用于优化网络架构的方法,例如直接使用原生YUV图像,优化图层和特征图以及应用量化。我们还在设计中关注内存带宽,因为卷积是数据密集型的,大多数SOC都是带宽瓶颈。然后,我们展示了我们提出的专用CNN加速器网络的效率,该加速器为从硬件执行和相应的运行时间获得的检测和分段任务提供关键性能指标(KPI)。
translated by 谷歌翻译
我们提出了一种新的碰撞感知任务分配(CATA)问题公式和一种分散的基于拍卖的算法来解决最优边界问题。使用碰撞锥,我们预测潜在的碰撞并将二元决策变量引入局部奖励函数以进行任务计划。我们通过实现停止机器人场景的后退碰撞来进一步改进CATA,即当机器人被限制在机架位置并且成为其他移动机器人的静态障碍物时。基于Theauction的算法鼓励机器人针对碰撞考虑事项竞标任务。我们使用模拟和实验结果验证了改进的任务分配解决方案,这显示了重叠路径和死锁的显着减少。
translated by 谷歌翻译
典型的对话包括参与者之间的多次转弯,其中他们在不同主题之间来回转换。在每个用户转弯时,对话状态跟踪(DST)旨在通过处理当前的容差来估计用户的目标。然而,在许多回合中,用户隐含地提到了先前的目标,因此需要使用相关的对话历史。尽管如此,区分相关历史是具有挑战性的,并且使用对话新近度的流行方法是低效的。因此,我们提出了一种新的DST框架,通过参考特定时隙值变化的过去话语来识别相关的历史背景,并将其与加权系统话语一起用于识别相关的上下文。具体来说,我们使用当前用户话语和最近的系统话语来确定系统话语的相关性。实证分析表明,与以前最先进的GLAD模型相比,我们分别在WoZ 2.0和MultiWoZ 2.0餐厅域数据集上提高了2.75%和2.36%的联合目标准确度。
translated by 谷歌翻译
尽管在使用卷积神经网络的图像分割领域已经进行了许多改进,但是这些改进中的大多数依赖于具有较大数据集,模型架构修改,新颖损失函数和更好的优化器的训练。在本文中,我们提出了一种新的分段性能提升范例,它依赖于最优地修改网络输入而不是网络本身。特别地,我们利用训练的分割网络的梯度来考虑输入,将其转移到分割准确度提高的空间。我们在三个公开的医学图像分割数据集上测试了所提出的方法:ISIC 2017皮肤损伤分割数据集,深圳胸部X射线数据集和CVC-ColonDB数据集,我们的方法实现了5.8%,0.5%和4.8%的改进在平均Dice分数中。
translated by 谷歌翻译
我们考虑为具有交互动态和稀疏可用通信的移动机器人的大型网络寻找分布式控制器的问题。我们的方法是通过在训练时使用全局信息模仿集中控制器的策略来学习本地控制器,这些控制器在测试时仅需要本地信息和本地通信。通过将聚合图神经网络扩展到时变信号和时变网络支持,我们学习了一个通用的本地控制器,它可以通过仅使用本地通信交换来从远程队友那里获取信息。我们将这种方法应用于分散线性二次调节器问题,并观察通信速率和较小网络程度如何增加多跳信息的价值。学习分散式植绒控制器的独立实验证明了随着机器人移动而改变的通信图表的性能。
translated by 谷歌翻译