已经证明,学习辅助任务可以改善主要任务的概括。然而,这是以手动标记附加任务为代价的,这些任务可能对主要任务有用,也可能没有用。我们提出了一种新方法,可以自动学习辅助任务的标签,这样就可以改进任何监督学习任务,而无需访问其他数据。该方法是训练两个神经网络:用于预测辅助标签的标签生成网络,以及用于训练辅助任务的主要任务的多任务网络。标签生成网络的损失包含了多任务网络的性能,因此两个网络之间的这种交互可以被视为元学习的一种形式。我们表明,我们提出的方法Meta AuXiliary Learning(MAXL)在7个图像数据集上的表现优于单一任务,而不需要额外的辅助标签。我们还展示了MAXLout执行其他几个基线来生成辅助标签,并且与人工定义的辅助标签相比,它们具有竞争力。我们方法的这种监督性质导致了一种朝着自动化概括的有希望的新方向。源代码可从\ url {https://github.com/lorenmt/maxl}获得。
translated by 谷歌翻译
与人类非常相似,机器人应该能够利用知识来学习任务,以便在新的和非熟悉的环境中快速学习新任务。尽管如此,大多数机器人学习方法都专注于从头开始学习单个任务,并且有限的概念,并且无法利用知识更有效地学习其他任务。一种可能的解决方案是元学习,但许多相关的方法在扩展到大量任务和学习更多任务的能力方面受到限制,而不会忘记以前学过的任务。考虑到这一点,我们引入了任务嵌入式控制网络,来自度量学习的雇员,以创建可由机器人用于从一个或多个演示中学习新任务的任务嵌入。在视觉引导操作领域,我们提出了模拟结果,当我们仅使用每次演示的视觉信息时,我们超越了最先进方法的性能。此外,我们证明我们的方法可以与域随机化结合使用,以训练我们在模拟中的少数学习能力,然后在现实世界中进行部署而无需任何额外的培训。部署后,机器人可以通过单个真实世界的演示学习新任务。
translated by 谷歌翻译
平方和目标函数在计算机视觉算法中非常流行。然而,这些目标函数并不总是易于优化。解算器所做的基本假设往往得不到满足,而且许多问题本质上都是不适合的。在本文中,我们提出LS-Net,一种神经非线性最小二乘优化算法,即使在逆境中也能学习有效地优化这些代价函数。在非传统方法中,所提出的求解器不需要手工制作的调节器或先验,因为这些是从数据中隐含地学习的。我们将方法应用于运动立体声问题即。从单眼序列的成对图像联合估计运动和场景几何。我们表明,我们学过的优化器能够有效地解决这一具有挑战性的优化问题。
translated by 谷歌翻译
我们提出了一种在线对象级SLAM系统,该系统可以构建任意重建对象的持久且准确的3D图形图。当RGB-D相机浏览杂乱的室内场景时,Mask-RCNN实例分割用于初始化紧凑的每对象截断的符号距离函数(TSDF)重建,其具有与对象大小相关的分辨率和新的3D前景掩模。重建的对象存储在可优化的6DoF姿势图中,这是我们唯一的持久地图表示。物体通过深度融合进行增量细化,并用于跟踪,重定位和环闭合检测。循环闭包导致对象实例的相对姿态估计中的调整,但是没有对象内变形。每个对象还携带随时间改进的语义信息和存在概率以考虑虚假实例预测。我们在一个手持的RGB-D序列中展示我们的方法,这个序列来自杂乱的办公室,有大量不同的对象实例,突出显示系统如何关闭循环并在重复循环中充分利用现有对象。我们定量评估我们的轨迹误差。系统针对RGB-D SLAM基准测试中的abaseline方法,定性比较YCB视频数据集上发现对象的重建质量。性能评估显示我们的方法具有高内存效率,并且在4-8Hz(不包括重定位)的情况下运行,尽管没有在软件上进行优化水平。
translated by 谷歌翻译
以低功率实时地对3D环境进行视觉理解是一项巨大的计算挑战。通常被称为SLAM(同步本地化和映射),它是跨越国内和工业机器人,自动驾驶车辆,虚拟和增强现实的应用程序的核心。本文描述了通过支持应用程序专家选择和配置适当的算法以及适当的硬件和编译途径来组装实现SLAM交付所需的算法,体系结构,工具和系统软件的主要研究成果,以满足其性能,准确性和能耗目标。我们提出的主要贡献是(1)用于SLAM算法的系统定量评估的工具和方法,(2)针对多个目标的算法和实现设计空间的自动化,机器学习引导的探索,(3)端到端仿真工具能够针对各种SLAM算法方法的特定算法要求优化异构,加速架构,以及(4)在托管的JIT编译的自适应运行时环境中提供适当的加速自适应SLAM解决方案的工具。
translated by 谷歌翻译
我们已经看到了刚性对象操作方面的最新进展,但是与可变形对象的交互明显滞后。由于可变形对象的大型配置空间,使用传统模型方法的解决方案需要大量的工程工作。也许那时,绕过显式建模的需要,而不是以端到端的方式学习控制,这是一种更好的方法吗?尽管人们对使用端到端机器人学习方法越来越感兴趣,但只有少量工作专注于它们对可变形对象操纵的适用性。此外,由于学习这些端到端解决方案所需的大量数据,因此趋势是学习模拟中的控制策略,然后转移到现实世界。到目前为止,还没有研究过是否可以学习和转移可变形对象策略。我们认为,如果要进一步采用ifsim-to-real方法,那么应该可以容忍与各种各样的对象进行交互,而不仅仅是刚性对象。在这项工作中,我们使用了状态的组合。 - 深度加强学习算法,以解决操纵可变形物体(特别是布料)的问题。我们评估我们对三项任务的处理方法 - 将脚趾折叠成一个标记,对角折叠面巾,然后在衣架上覆盖一块布。我们的代理人经过全面的网络随机化仿真培训,然后在现实世界中成功部署,无需任何真正的可变形对象。
translated by 谷歌翻译
在参数空间中探索的黑盒优化器经常被证明可以表现出更加复杂的动作空间探索方法,这些方法专门针对强化学习问题而开发。我们仔细研究这些黑盒方法,以确定它们比动作空间探索方法和它们优越的方法更糟糕的情况。通过简单的理论分析,证明了参数空间探索的复杂性取决于参数空间的维数,而动作空间探索的复杂性则取决于动作空间的维数和地平线长度。通过比较几个模型问题的简单探索方法,包括连续控制中的语境强盗,线性回归和强化学习,也可以凭经验证明这一点。
translated by 谷歌翻译
高保真度计算模拟的使用有望实现高通量假设检验和癌症疗法的优化。然而,增加现实主义是以增加计算需求为代价的。本文探讨了使用替代辅助进化算法来优化多细胞模拟器PhysiCell对治疗性化合物肿瘤细胞的靶向递送。研究了高斯过程模型和多层感知器神经网络特征模型的使用。我们发现进化算法能够在基于试剂的模拟中有效地探索生物物理性质的参数空间,从而在经过一段时间的模拟处理后最小化所得的癌细胞数量。发现两种模型辅助算法都优于标准的进化算法,证明了它们能够在最小的评估预算内执行更有效的搜索。
translated by 谷歌翻译
目的:将深度卷积神经网络(CNN)应用于心肌动脉旋转标记(ASL)灌注成像中的左心室分割任务。开发基于特定假阳性与假阴性权衡的测量不确定性和适应性分类的方法。方法:我们使用改进的UNET架构和Monte Carlo(MC)压降。该模型对来自22名受试者的数据进行训练,并对来自6名心脏移植受者的数据进行测试。手动分割和定量心血流量(MBF)图可用于比较。我们考虑两个分割不确定性的全局核心,“骰子不确定性”和“MC不确定性”,它们分别使用和不使用手动分割计算。使用超参数$ \ beta $的Tversky损失函数来使模型适应特定的假阳性与假阴性权衡。结果:改进的UNET模型在测试集上实现了均值(std)= 0.91(0.04)$的Dice系数。使用自动分割测量的MBF与使用手动分割测量的自动分割相关($ R ^ 2 = 0.96 $)。骰子不确定性和MC不确定性非常一致($ R ^ 2 = 0.64 $)。随着$ \ beta $的增加,误报率系统性下降,假负率率系统性上升。结论:我们证明了使用CNN在心肌ASL数据中自动分离左心室的可行性。由于低血压和不一致的血液 - 心肌对比噪声比,这是特别具有挑战性的应用。我们还展示了衡量不确定性并适应假阳性率和假阴性率之间所需权衡的新方法。
translated by 谷歌翻译
语义分割需要大量像素方式的注释,以容许准确的模型。在本文中,我们提出了一种基于视频预测的方法,通过综合新的训练样本来扩展训练集,以提高语义分割网络的准确性。我们利用视频预测模型预测未来帧的能力,以便预测未来的标签。还提出了联合传播策略以减少合成样品中的错误比对。我们证明了由合成样本增加的数据集上的训练分割模型导致准确性的显着改善。此外,我们引入了一种新颖的边界标签松弛技术,该技术使得对沿着对象边界的注释噪声和传播伪像具有鲁棒性。我们提出的方法在Cityscapes上实现了83.5%的最新技术,在CamVid上实现了82.9%。没有模型合奏的单一模型在KITTI语义分割测试集上达到了72.8%mIoU,超过了ROBchallenge 2018的获奖作品。我们的代码和视频可以在以下网址找到://nv-adlr.github.io/publication/2018 -分割。
translated by 谷歌翻译