许多对科学计算和机器学习感兴趣的概率模型具有昂贵的黑盒可能性,这些可能性阻止了贝叶斯推理的标准技术的应用,例如MCMC,其需要接近梯度或大量可能性评估。我们在这里介绍一种新颖的样本有效推理框架,VariationalBayesian Monte Carlo(VBMC)。 VBMC将变分推理与基于高斯过程的有源采样贝叶斯积分结合起来,使用latterto有效逼近变分目标中的难以求的积分。我们的方法产生了后验分布的非参数近似和模型证据的近似下界,对模型选择很有用。我们在几种合成可能性和神经元模型上展示VBMC,其中包含来自真实神经元的数据。在所有测试的问题和维度(高达$ D = 10 $)中,VBMC始终如一地通过有限的可能性评估预算重建后验证和模型证据,而不像其他仅在非常低维度下工作的方法。我们的框架作为一种新颖的工具,具有昂贵的黑盒可能性,可用于后期模型推理。
translated by 谷歌翻译
由于特殊的挑战,仅仅基于外观识别包装杂货产品仍然是现代计算机视觉系统的一个开放问题。首先,要识别的不同物品的数量是巨大的(即,数千个)并且随着时间的推移而迅速变化。此外,在应该在测试时识别的图像之间存在显着的域移位,在廉价相机的商店中拍摄,以及可用于训练的图像,通常每个产品只有一个或几个工作室品质的图像。我们提出了包括GAN的端到端架构,以解决在时间上的域移位以及在由GAN生成的样本上训练的深度CNN容忍产品图像的嵌入,其强制产品类别之间的层次结构。在测试时,我们通过K-NN搜索进行识别,每个产品只包含一个参考图像的数据库。训练数据集中存在的产品识别以及培训时看不到的不同产品的实验表明,我们的方法与州相比较有利杂货店识别任务的最先进的方法和相似的一般推广。
translated by 谷歌翻译
杠杆分数采样提供了一种吸引人的方法来执行大型矩阵的近似计算。实际上,它允许以适应当前问题的复杂性推导出信仰复杂性。然而,执行杠杆分数抽样本身就是一项挑战,需要进一步的近似。在本文中,我们研究了由内核定义的正定矩阵的杠杆分数采样问题。我们的贡献是双重的。首先,我们提供了一种新的杠杆分数抽样算法,其次,我们通过导出核岭回归的新算子来利用所提出的统计学习方法。我们的主要技术贡献是显示所提出的算法目前对于这些问题是最有效和准确的。
translated by 谷歌翻译
相机姿态估计是计算机视觉中的重要问题。常用技术或者将当前图像与具有已知姿势的关键帧匹配,直接回归姿势,或者在图像中的关键点和场景中的点之间建立对应关系以估计姿势。近年来,回归森林已成为建立此类对应的流行替代方案。它们可以获得准确的结果,但传统上需要在目标场景下离线训练,防止在新环境中重新定位。最近,我们展示了如何通过在预先训练的森林中适应新的场景来规避这种限制。经过改造的森林实现了与离线森林相当的地方化性能,并且我们的方法能够近乎实时地估计相机姿态。在本文中,我们展示了这项工作的扩展,在完全实时运行的同时实现了更好的重定位性能。为了实现这一目标,我们对原始方法进行了一些改变:(i)我们不必毫无疑问地接受相机姿势假设,而是使用几何方法来确定最后几个假设并选择最有希望的假设; (ii)我们将我们的重定位器的几个实例连接在一起,允许我们首先尝试更快但不太准确的重定位,只在必要时回落到更慢,更准确的重定位; (iii)我们调整级联参数以实现有效的整体性能。这些变化使我们能够显着提高我们最先进的方法能够在众所周知的7场景和斯坦福4场景基准上实现的性能。作为额外的贡献,我们提出了一种可视化森林内部行为的方法,并展示了如何完全规避在一般场景中预先训练森林的需要。
translated by 谷歌翻译
磁共振成像(MRI)是人体组织成分分析的非侵入性选择,因为它具有出色的软组织对比度和电离辐射。然而,身体成分的量化要求从MRimages精确分割脂肪,肌肉和其他组织,由于强度重叠,这仍然是一个具有挑战性的目标。在这项研究中,我们提出了一个全自动,数据驱动的图像分割平台,解决了MRimages分割中的多个困难,例如变化的不均匀性,非标准性和噪声,同时产生不同组织的高质量定义。与文献中的mostapproaches相反,我们通过结合三种不同的MRI对比和一种新的分割工具来执行分割操作,该分割工具考虑了数据中的可变量。所提出的系统基于模糊连接(FC)图像分割系列内的新颖的亲和定义,防止了对用户干预和这些分段算法的重新参数化的需要。为了使整个系统完全自动化,我们采用亲和传播聚类算法来粗略地识别组织区域和图像背景。我们对提出的算法的各个步骤进行了全面的评估,并与文献中关于肌肉/脂肪分离主要应用的几种方法进行了比较。此外,进行全身组织成分和脑组织描绘,以显示所提出的系统的泛化能力。这种新的自动化平台优于其他最先进的分割方法,包括不准确性和效率。
translated by 谷歌翻译
现代深度学习方法可实现的性能与培训时使用的数据量直接相关。不幸的是,注释过程是非常繁琐且昂贵的,特别是对于像语义分段这样的像素化任务。最近的工作已经提出依靠合成生成的图像来简化训练集的创建。然而,在这种类型的数据上训练的模型通常在真实图像上表现不佳,这是众所周知的域移位问题。我们通过学习adomain-to-domain图像转换GAN来缩小真实和合成图像之间的差距来解决这个问题。特别是对于我们的方法,我们在生成过程中引入了语义约束,以避免伪像并指导合成。为了提高我们提案的有效性,我们展示了如何通过我们的方法改编的合成GTA数据集中的图像训练的语义分割CNN相对于合成图像上训练的相同模型可以提高16%以上的性能。
translated by 谷歌翻译
深度卷积神经网络端到端训练是直接从立体声台回归密集视差图的无可争议的最先进的方法。然而,当暴露的场景与训练阶段中看到的明显不同时(例如,真实与合成图像,室内与室外等),这些方法遭受显着的准确度下降。由于不可能收集足够的样本以在任何目标域中实现有效的训练/调整,我们建议对深立体网络进行无监督和连续的在线适应,以便独立于感测环境保持其准确性。然而,这样的策略对于计算资源非常苛刻,因此不能实现实时性能。因此,我们通过引入一种新的轻量级但有效的深度立体结构模块化ADaptiveNetwork(MADNet)并通过开发模块化ADaptation(MAD)来解决这一副作用,该算法仅独立地包含我们模型的子部分。通过与MAD一起部署MADNet,我们提出了第一个实时自适应深度立体声系统。
translated by 谷歌翻译
多目标优化是计算机系统设计空间探索中的一个关键问题,因为现实世界的应用程序通常依赖于几个目标之间的权衡。衍生物通常不可用或计算不实用,并且实验的可行性不能总是提前确定。当可行区域相对较小时,这些问题特别困难,甚至可能难以找到可行的实验,更不用说最佳实验了。我们引入了一种新的方法和相应的软件框架HyperMapper 2.0,它处理多目标优化,不可行性约束和分类/序数变量。这种新方法还支持在可用时在搜索中注入用户先验知识。所有这些特征是计算机系统中的常见要求,但很少在现有的设计空间探索系统中暴露出来。所提出的方法遵循白盒模型,该模型易于理解和解释(与例如神经网络不同)并且可以由用户使用以更好地理解自动搜索的结果。我们在最近引入的空间编程语言中应用和评估新方法到硬件加速器的自动静态调整,在目标现场可编程门阵列芯片的设计拟合的约束下最小化设计运行时和计算逻辑。我们的研究结果表明,与最先进的基线相比,HyperMapper 2.0提供了更好的Pareto前端,具有更好或更具竞争力的超体积指示器,并且大多数基准测试的采样预算都提高了8倍。
translated by 谷歌翻译
虽然机器人操纵刚性物体非常简单,但应对可变形物体是一个悬而未决的问题。更具体地说,诸如捆绑aknot,连接器连接或甚至手术缝合的任务涉及可变形线性对象(DLO)的领域。特别是DLO的检测是非常重要的问题,尤其是在杂波和遮挡(以及断言闭塞)下。 DLO的姿态估计导致其与设计模型相关的参数的识别,例如,基准样条。因此,DLO的独立分段可能不足以执行完整的操作任务。这就是为什么我们提出一种新颖的框架,能够同时执行多变形线性对象的语义分割和b样条建模,而不需要严格的环境要求(即背景)。核心算法基于区域优先图上的偏向随机行走,该图建立在源图像的超像素分割上。该算法由卷积神经网络初始化,该网络检测DLO的端盖。还提供了所提出方法的开源实现,以便容易地再现整个检测管道以及新颖的电缆数据集,以便鼓励进一步的实验。
translated by 谷歌翻译
单个图像的深度估计代表了计算机视觉中非常激动人心的挑战。虽然其他基于图像的深度感测技术利用不同视点之间的几何形状(例如,立体声或来自运动的结构),但是在单个图像内缺少这些提示使得不适合单眼深度估计任务。对于推理,用于单眼深度估计的现有编码器 - 解码器架构依赖于在训练时学习的有效特征表示。对于这些模型的无监督训练,通过由立体装备或移动摄像机获取的视图计算的适当图像变形损失有效地利用几何。在本文中,我们向前迈出了一步,表明从图像学习语义信息能够有效地改善单眼视觉识别。同样。特别是,通过利用语义标记的图像与几何形状通过图像变形损失获得的无监督信号,我们提出了一种针对联合语义分割和深度估计的深度学习方法。我们的整体学习框架是半监督的,因为我们只在语义域中部署groundtruth数据。在训练时,我们的网络学习了两个任务的共同特征表示,并提出了一种新的交叉任务损失函数。实验结果表明,联合处理深度预测和语义分割如何能够提高深度估计精度。特别是,在KITTI数据集上,我们的网络输出执行了单眼深度估计的最先进方法。
translated by 谷歌翻译