解决逆问题仍然是计算机视觉中的核心挑战。现有技术要么使用有关损坏的先验知识明确地构建逆映射,要么使用大量示例直接学习逆。然而,在实践中,腐败的性质可能是未知的,因此规范推理合理解决方案的问题具有挑战性。另一方面,收集任务特定的训练数据对于已知的损坏是繁琐的,对于未知的腐败是不可能的。我们提出了MimicGAN,一种无监督的技术,以生成对抗网络(GAN)的形式解决基于图像先验的一般反转问题。使用GAN之前,我们证明人们可以通过代理网络可靠地恢复解决方案确定的反问题,该代理网络在测试时学会了腐败。我们的系统在不需要监督培训的情况下连续估计出腐败和清洁图像,同时在盲图恢复方面表现优于现有基线。我们还证明了MimicGAN改进了最近基于GAN的对抗adversarialattacks的防御,并且代表了当今最强大的测试时间防御之一。
translated by 谷歌翻译
计算机断层扫描(CT)重建是从安全性到医疗保健等各种应用的基本组成部分。经典技术需要从对象的完整180 $ ^ \ circ $视图中测量投影,称为正弦图。当视角小于180°时,这在有限的角度范围内是不切实际的,这可能由于不同因素而发生,包括扫描时间的限制,扫描仪旋转的有限灵活性等。因此得到的正弦图导致现有技术产生高度神器重建的重建。在本文中,我们建议通过隐式正弦图完成来解决这个问题,这个问题包含一个包含普通签入式扫描扫描的具有挑战性的现实世界数据集。我们提出了一个由一维和二维卷积神经网络组成的系统,该系统在有限角度的正弦图上运行,直接产生重建的最佳估计。接下来,我们在这个重构上使用x射线变换来获得一个“完整的”正弦图,好像它来自一个完整的180 $ ^ \ circ $测量。我们将其提供给标准分析和迭代重构技术以获得最终重建。我们展示了经过深思熟虑的实验,这种组合策略优于许多竞争基线。我们还提出了对建筑的信任度,使从业者能够衡量我们网络的预测可靠性。我们表明,这一指标是PSNR衡量的一个强有力的质量指标,同时在测试时不需要基本事实。最后,通过分割实验,我们证明了我们的重建有效地保留了对象的三维结构。
translated by 谷歌翻译
Interpretability has emerged as a crucial aspect of machine learning, aimed at providing insights into the working of complex neural networks. However , existing solutions vary vastly based on the nature of the interpretability task, with each use case requiring substantial time and effort. This paper introduces MARGIN, a simple yet general approach to address a large set of interpretability tasks ranging from identifying prototypes to explaining image predictions. MARGIN exploits ideas rooted in graph signal analysis to determine influential nodes in a graph, which are defined as those nodes that maximally describe a function defined on the graph. By carefully defining task-specific graphs and functions, we demonstrate that MARGIN outperforms existing approaches in a number of disparate interpretability challenges.
translated by 谷歌翻译
为了便于分析人类行为,交互和情感,我们从单个单眼图像计算人体姿势,手姿势和面部表情的3D模型。为了达到这个目的,我们使用了数以千计的3D扫描来追踪新的,统一的人体3D模型,SMPL-X,它扩展了SMPL非常清晰的双手和富有表现力的脸。如果没有配对图像和3D基础事实,学习直接从图像中回归SMPL-X的参数是一项挑战。因此,我们遵循SMPLify的方法,估计2D特征,然后优化模型参数以适应特征。我们以几个显着的方式改进SMPLify:(1)我们检测对应于面部,手部和脚部的2D特征并且完全适合SMPL-X型号; (2)我们在使用大型MoCapdataset之前训练一个新的神经网络姿势; (3)我们定义了一个既快速又准确的新的互穿惩罚; (4)我们自动检测性别和适当的身体模型(男性,女性或中性); (5)我们的PyTorch实现比Chumpy实现了超过8倍的加速。我们使用新方法SMPLify-X来适应野外的SMPL-X烟草控制图像和图像。我们评估了一个新的数据集上的3D精度,该数据集包含100个具有伪地面真实性的图像。这是一种来自单眼RGB数据的steptowards自动表达人类捕获。模型,代码和数据可用于研究目的://smpl-x.is.tue.mpg.de。
translated by 谷歌翻译
漂移分析旨在将进化算法(或更一般地,随机过程)的预期进展转化为其运行时间(命中时间)的概率保证。到目前为止,漂移参数已经成功地用于严格的进化算法分析,但是,只有在接近目标时进展恒定或变弱的情况。通过诸如适合个体接管人口的快速性等问题的激励,我们分析了表现出预期乘法增长的随机过程。我们证明了一个漂移定理将这个预期的进展转化为命中时间。这个漂移定理给出了Lehre(2011)首次提出的基于水平定理的简单而有见地的证明。我们这个定理的版本第一次具有对增长参数$ \ delta $的最佳线性依赖性(前一个最好的是二次方)。这为许多应用程序提供了立即更强的运行时保证。
translated by 谷歌翻译
由于稀疏的上下文信息,学习稀有单词的高质量嵌入是一个难题。 Mimicking(Pinter et al。,2017)已经被提出作为一种解决方案:给定通过标准算法学习的嵌入,首先训练模型以从其表面再现频繁单词的嵌入,然后用于计算稀有单词的嵌入。在本文中,我们介绍了模仿模仿:模仿模型不仅可以访问单词的表面形式,还可以访问所有可用的上下文,并学习如何处理用于计算嵌入的最丰富的信息和可靠的上下文。在对四项任务进行评估时,我们表明,对于稀有和中频词语,精心模仿的表现优于以前的工作。因此,与以前的工作相比,细心的模仿可以改善词汇表中更大部分的嵌入,包括中频范围。
translated by 谷歌翻译
与其像素具有共同曝光时间的传统相机相比,基于事件的相机是新颖的生物启发传感器,其像素独立地工作并且异步地输出具有微秒分辨率的强度变化(称为“事件”)。由于事件是由物体的明显运动引起的,因此基于事件的摄像机基于场景动力学采集视觉信息,因此比传统摄像机更自然地适应采集运动,尤其是在传统摄像机遭受运动模糊的高速时。然而,区分由不同移动物体和相机的自我运动引起的事件是一项具有挑战性的任务。我们提出了第一种按事件分割方法,用于将场景分割成独立移动的对象。我们的方法通过目标函数的最大化来联合估计事件 - 对象关联(即,分割)和对象的运动参数(或者背景),该目标函数建立在基于事件的运动补偿的最近结果上。我们在公共数据集上对我们的方法进行了彻底的评估,比最先进的技术高出10%。我们还展示了事件相机分割算法的第一个定量评估,在4个像素相对位移时产生大约90%的准确度。
translated by 谷歌翻译
深度学习的一大挑战是需要获得大量标记的训练数据集。虽然可以使用合成数据集来克服该挑战,但重要的是这些数据集关闭实际差距,即,在合成图像数据上训练的模型能够概括到真实图像。然而,在实际应用场景中可以考虑现实差距,对包含反射材料的合成图像进行培训需要进一步研究。由于具有反射材料的物体的出现受到周围环境的支配,因此在训练数据生成期间需要考虑这种相互作用。因此,在本文中,我们研究了在用于训练物体探测器的合成图像生成的背景下反射材料的效果。我们研究了用于图像合成的渲染方法的影响,域随机化的影响,以及使用的训练数据量。为了能够将我们的结果与最先进的技术相比较,我们专注于室内场景,因为它们已被广泛研究。在这种情况下,浴室家具是具有反射材料的物体的自然选择,我们在此报告我们对真实和合成测试数据的发现。
translated by 谷歌翻译
单指标模型是一种功能强大而又简单的模型,广泛应用于统计学,机器学习和其他科学领域。它将回归函数建模为$ g(<a,x>)$,其中a是未知索引向量,x是特征。本文讨论了该框架的非线性推广,以允许使用多个索引向量的回归量,适应响应中的局部变化。为此,我们利用条件分布过功能驱动的分区,并使用线性回归来本地估计索引向量。然后,我们通过应用kNN类型估计器来回归,该估计器使用测地线度量的本地化。我们提出了估计局部指数向量和样本外预测的理论保证,并证明了我们的方法在合成和真实世界数据集上的实验性能,并将其与最先进的方法进行了比较。
translated by 谷歌翻译
我们发现自己被迅速增加的自治和半自治系统所包围。这一发展产生了两大挑战:机器伦理和机器可解释性。机器伦理一方面关注系统的行为约束,因此道德上可接受的,受限制的行为会产生;另一方面,机器可解释性使系统能够解释他们的行为并争论他们的决定,以便人类用户可以理解并合理地信任他们。在本文中,我们试图激发并努力建立一个结合机器伦理和机器可解释性的框架。从一个玩具示例开始,我们检测这种框架的各种需求,并论证为什么它们应该以及它们如何被纳入自治系统。我们的主要思想是应用正式论证理论的框架,用于决策制定不道德的约束,以及用于产生有用的解释的任务,只有有限的世界知识。我们的讨论结果可以被描述为道德动机,原则治理框架的第一版,结合了机器伦理和机器解释性
translated by 谷歌翻译