深度异常检测已被证明是几个领域的有效和强大的方法。自我监督学习的引入极大地帮助了许多方法,包括异常检测,其中使用简单的几何变换识别任务。然而,由于它们缺乏更精细的特征,因此这些方法在细粒度问题上表现不佳,并且通常高度依赖于异常类型。在本文中,我们探讨了使用借口任务的自我监督异常检测的每个步骤。首先,我们介绍了专注于不同视觉线索的新型鉴别和生成任务。一部分拼图拼图任务侧重于结构提示,而在每个件上使用色调旋转识别进行比色法,并且执行部分重新染色任务。为了使重新着色任务更关注对象而不是在后台上关注,我们建议包括图像边界的上下文颜色信息。然后,我们介绍了一个新的分配检测功能,并与其他分配检测方法相比,突出了其更好的稳定性。随之而来,我们还试验不同的分数融合功能。最后,我们在具有经典对象识别的对象异常组成的综合异常检测协议上评估我们的方法,用细粒度分类和面部反欺骗数据集的局部分类和局部异常的样式异常。我们的模型可以更准确地学习使用这些自我监督任务的高度辨别功能。它优于最先进的最先进的相对误差改善对象异常,40%的面对反欺骗问题。
translated by 谷歌翻译
我们提出了一种新的基于深入学习的方法,用于估计从空中平台捕获的3D点云估算植被层的占用。我们的模型预测了三个植被阶层的光栅占用地图:下层,中等和更高的地层。我们的培训方案允许我们的网络仅使用圆柱形图中聚合的值,这更容易产生比像素 - 明智的或点明智的注释。我们的方法在精度方面占据了手工制作和深度学习的基线,同时提供视觉和可解释的预测。我们沿着199农业地块的数据集提供了我们的方法的开源实现,以培训和评估占用回归算法。
translated by 谷歌翻译
光学和雷达卫星时间序列是协同的:光学图像包含丰富的光谱信息,而C波段雷达捕获有用的几何信息,并且对云盖免疫。由于近期基于时间关注的方法的成功跨多种裁剪映射任务,我们建议调查这些模型如何适应多种方式运行。我们实施和评估多种融合方案,包括新颖的方法和对培训程序的简单调整,显着提高性能和效率几乎没有增加复杂性。我们表明大多数融合方案具有优势和缺点,使其与特定设置相关。然后,我们跨多个任务评估多模式的好处:宗地分类,基于像素的分割和Panoptic Parcel分段。我们表明,通过利用光学和雷达时间序列,基于多模式的时间关注的模型可以在性能和弹性方面偶尔将单片式模型到云覆盖。为了进行这些实验,我们使用空间对齐的雷达图像时间序列增强肉饼数据集。生成的数据集,Pastis-R,构成了具有语义和实例注释的第一个大规模,多模式和开放式卫星时间序列数据集。
translated by 谷歌翻译
基于手势的界面通常用于实现更自然和直观的机器人遥气操作。然而,有时候,手势控制需要对用户造成显着疲劳的姿势或运动。在先前的用户学习中,我们证明了NA \“IVE用户可以在其武器展开时控制具有躯干运动的固定翼无人机。然而,这种姿势诱导了重要的手臂疲劳。在这项工作中,我们展示了一款被动臂支撑这补偿了手臂重量,平均扭矩误差小于0.005n / kg,超过0.005n / kg的受试者使用的运动范围的97%以上,因此平均降低肩部的肌肉疲劳。此外,这臂支持旨在将5百分位数的身体尺寸的用户融入第99百分位的男性。使用机械模型描述了臂支架的性能分析,并且其实现是用机械表征和用户学习验证的测量飞行性能,肩部肌肉活动和用户验收。
translated by 谷歌翻译
虽然年度作物旋转在农业优化起到至关重要的作用,但它们主要忽略了自动作物类型的映射。在本文中,我们利用了增加的注释卫星数据的数量,提出了一个同时的第一个深度学习方法建模包裹分类的年间和中内农业动态。除了简单的培训调整之外,我们的模型提供了超过6.3 miou指针的改善,这些作物分类最先进。此外,我们释放了具有超过300,000个注释的包裹的第一个大型多年农业数据集。
translated by 谷歌翻译
前所未有的访问多时间卫星图像,为各种地球观察任务开辟了新的视角。其中,农业包裹的像素精确的Panoptic分割具有重大的经济和环境影响。虽然研究人员对单张图像进行了探索了这个问题,但我们争辩说,随着图像的时间序列更好地寻址作物候选的复杂时间模式。在本文中,我们介绍了卫星图像时间序列(坐着)的Panoptic分割的第一端到端,单级方法(坐姿)。该模块可以与我们的新型图像序列编码网络相结合,依赖于时间自我关注,以提取丰富和自适应的多尺度时空特征。我们还介绍了Pastis,第一个开放式访问坐在Panoptic注释的数据集。我们展示了对多个竞争架构的语义细分的编码器的优越性,并建立了坐在的第一封Panoptic细分状态。我们的实施和痛苦是公开的。
translated by 谷歌翻译
为了帮助代理在其构建块方面的场景的原因,我们希望提取任何给定场景的组成结构(特别是包括场景的对象的配置和特征)。当需要推断出现在代理的位置/观点的同时需要推断场景结构时,这个问题特别困难,因为两个变量共同引起代理人的观察。我们提出了一个无监督的变分方法来解决这个问题。利用不同场景存在的共享结构,我们的模型学会从RGB视频输入推断出两组潜在表示:一组“对象”潜伏,对应于场景的时间不变,对象级内容,如以及一组“帧”潜伏,对应于全局时变元素,例如视点。这种潜水所的分解允许我们的模型Simone,以单独的方式表示对象属性,其不依赖于视点。此外,它允许我们解解对象动态,并将其轨迹总结为时间抽象的,查看 - 不变,每个对象属性。我们在三个程序生成的视频数据集中展示了这些功能,以及在查看合成和实例分段方面的模型的性能。
translated by 谷歌翻译
在许多分类任务中,可以将一组目标类组织成层次结构。该结构引起类之间的语义距离,并且可以在成本矩阵的形式下汇总,其定义了类集上的有限度量。在本文中,我们建议通过将该度量集成在原型网络的监控中来模拟分层类结构。我们的方法依赖于共同学习特征提取网络和一组类原型,其相对布置在嵌入空间中的相对布置遵循分层度量。我们表明,与传统方法和其他基于原型的策略相比,该方法允许在成本矩阵加权的误差率的一致性提高。此外,当诱导的指标包含对数据结构的洞察力时,我们的方法也提高了整体精度。四种不同公共数据集的实验 - 从农业时间序列分类到深度映像语义分割 - 验证我们的方法。
translated by 谷歌翻译