我们提出了一种用于训练大规模隐性生成模型的矩量法(MoM)算法。此设置中的矩估计遇到两个问题:通常很难定义所需的数百万个时刻容忍模型参数,并且在指定时刻时很难确定哪些属性是有用的。为了解决第一个问题,我们引入了amoment网络,并将时刻定义为网络的隐藏单位和网络输出的梯度与其参数的关系。为了解决第二个问题,我们使用渐近理论来突出需求模型 - 即它们应该最小化估计模型参数的渐近方差 - 并引入一个目标来学习更好的时刻。通过这种学习时刻(MoLM)方法创建的目标序列可以提供高质量的神经图像采样器。在CIFAR-10上,我们证明了受过MOMM训练的发生器比使用梯度加法正则化和频谱标准化的对抗性目标训练的那些人获得了显着更高的初始分数和更低的开始起始距离。这些发生器还可以实现几乎完美的多尺度结构相似性Scoreson CelebA,并可以创建128x128图像的高质量样本。
translated by 谷歌翻译
我们证明了变分自动编码器始终无法在潜在和可见空间中学习边缘分布。我们问这是否是匹配条件分布的结果,或者是显式模型和后验分布的限制。我们通过在变分推理中使用GenerativeAdversarial Networks来探索由边际分布匹配和隐式分布提供的替代方案。我们对几种VAE-GAN杂种进行了大规模的评估,并探索了类概率估计对学习分布的影响。我们得出结论,目前VAE-GAN杂交种的适用性有限:与VAE相比,它们难以扩展,评估和用于推理;并且他们没有改善GAN的发电质量。
translated by 谷歌翻译
Models that can simulate how environments change in response to actions canbe used by agents to plan and act efficiently. We improve on previousenvironment simulators from high-dimensional pixel observations by introducingrecurrent neural networks that are able to make temporally and spatiallycoherent predictions for hundreds of time-steps into the future. We present anin-depth analysis of the factors affecting performance, providing the mostextensive attempt to advance the understanding of the properties of thesemodels. We address the issue of computationally inefficiency with a model thatdoes not need to generate a high-dimensional image at each time-step. We showthat our approach can be used to improve exploration and is adaptable to manydiverse environments, namely 10 Atari games, a 3D car racing environment, andcomplex 3D mazes.
translated by 谷歌翻译
计算机视觉的一个关键目标是从二维世界观测中恢复潜在的三维结构。在本文中,我们学习了强大的三维结构深度生成模型,并通过概率推理从三维和二维图像中恢复这些结构。我们在几个数据集(包括ShapeNet [2])上展示了高质量的样本和报告日志可能性,并建立了文献中的第一个基准。我们还展示了如何从2D图像端到端地训练这些模型及其参考网络。这首次证明了学习以纯粹无监督的方式推断世界的3D表示的可行性。
translated by 谷歌翻译
The mutual information is a core statistical quantity that has applicationsin all areas of machine learning, whether this is in training of density modelsover multiple data modalities, in maximising the efficiency of noisytransmission channels, or when learning behaviour policies for exploration byartificial agents. Most learning algorithms that involve optimisation of themutual information rely on the Blahut-Arimoto algorithm --- an enumerativealgorithm with exponential complexity that is not suitable for modern machinelearning applications. This paper provides a new approach for scalableoptimisation of the mutual information by merging techniques from variationalinference and deep learning. We develop our approach by focusing on the problemof intrinsically-motivated learning, where the mutual information forms thedefinition of a well-known internal drive known as empowerment. Using avariational lower bound on the mutual information, combined with convolutionalnetworks for handling visual input streams, we develop a stochasticoptimisation algorithm that allows for scalable information maximisation andempowerment-based reasoning directly from pixels to actions.
translated by 谷歌翻译
近似后验分布的选择是变分推理的核心问题之一。变分推理的大多数应用使用了很多后验近似族,以便进行有效的推理,重点关注平均场或其他简单的结构化近似。这种限制对使用变分方法进行推断的质量有显着影响。我们引入了一种新方法,用于指定灵活,任意复杂和可扩展的近似后验分布。 Ourapproximations是通过归一化流程构建的分布,其中通过应用一系列可逆变换将简单的初始密度转换为更复杂的密度,直到达到期望的复杂度水平。我们使用这种将流量归一化的观点来开发有限和无穷小流动的类别,并提供用于构造丰富的后验近似的方法的统一视图。我们证明了具有更好地匹配真实后验的后验的理论优势,结合摊销变分方法的可扩展性,提供了变量参考的性能和适用性的明显改进。
translated by 谷歌翻译
我们将来自深度神经网络和近似贝叶斯推理的思想结合起来,得出一个广义的深度定向生成模型,赋予了可扩展推理和学习的新算法。我们的算法引入了识别模型来表示近似后验分布,并且它作为数据的随机编码器。我们开发了随机反向传播 - 通过随机变量进行反向传播的规则 - 并使用它来开发一种算法,允许联合优化生成和识别模型的参数。我们演示了几个真实世界的数据集,模型生成了真实的样本,提供了对缺失数据的准确估算,是高维数据可视化的有用工具。
translated by 谷歌翻译
我们提出了一种完全超级化的方法,用于学习分割由邻接图构成的数据。我们介绍了由地面实况分割构成的图形结构对比损失,aloss函数。它促进了在所需段内均匀的学习嵌入,并且在它们的接口处具有高对比度。因此,计算这种嵌入的分段常数近似产生了接近目标分割的图分区。这种损失完全可以反向传播,这使我们可以通过深度学习算法来学习嵌入式嵌入。我们在a3D点云过度分割任务上评估我们的方法,通过大范围边界定义新的最新技术。这些结果基于Landrieu和Burssaha 2019的出版工作。
translated by 谷歌翻译
测量来自观察样本的高维,连续,随机变量之间的互信息(MI)具有广泛的理论和实践应用。虽然传统的MI方法,如(Kraskov et al.2004),能够在低维信号之间捕获MI,但它们的维度不断增加,并且不具有可扩展性。现有的神经方法,如MINE(Belghazi等人,2018),搜索最大化互信息估计的变分下界的d维神经网络;然而,这需要O(d log d)观察样本以防止神经网络过度拟合。对于实际应用中的实际互信息估计,数据并不总是有剩余的,特别是在数据采集过于昂贵的情况下,例如infMRI分析。我们引入了可扩展的,数据有效的互信息估计器。通过将基于学习的MI下界视图与元学习相结合,DEMINE实现了高置信度估计,而与网络规模无关,并且在实际数据集大小上具有提高的准确性。我们证明了DEMINE在合成基准测试中的有效性以及fMRIinter-主题相关性分析的实际应用。
translated by 谷歌翻译
我们的目标是更好地理解图神经网络中节点的注意力,并识别影响其有效性的因素。通过图形同构网络工作的见解(Xu et al。,2019),我们设计了简单的图形调查任务,使我们能够在受控环境中研究注意力。我们发现在典型条件下,注意力的影响可以忽略不计,但是有害的,但是在某些条件下,它在我们的一些分类任务中提供超过40%的特殊增益。但是,我们还没有在实践中满足这些条件。
translated by 谷歌翻译