在使用连续控制的运动范式中深度强化学习的最新进展已经引起了游戏制作者对使用主动布娃娃的数字演员的潜力的兴趣。目前,开发这些想法的可用选项要么是研究人员有限的代码库,要么是专有的封闭系统。我们使用Unity ML-Agents工具包提供Marathon Environments,这是一套在Unity游戏引擎上实现的开源,连续控制基准测试。我们通过这些基准证明了连续控制研究可以转移到商业游戏引擎。此外,我们通过重现高级连续控制研究展示了这些环境的稳健性,例如从运动捕捉数据学习走路,跑步和回退;学习驾驭复杂的地形;并通过实现视频游戏输入控制系统。我们通过使用OpenAI.Baselines中的替代算法进行培训,展示了更强大的功能。最后,weshare策略可以显着缩短培训时间。
translated by 谷歌翻译
强化学习(RL)问题通常具有欺骗性的局部最优,而纯粹为奖励信号优化的学习方法往往无法克服它们的学习策略。已经提出深度神经进化和新奇搜索作为直接从像素学习RL策略的基于梯度的方法的有效替代。在本文中,我们通过字符串编辑度距来介绍和评估新颖性搜索对代理行为序列的使用,作为促进创新的手段。我们还介绍了一种方法,即在RL社区的最新发展中激发了一种新的检测和人口重新取样方法,该方法使用与新颖性搜索相同的机制来促进和制定创新政策。我们的方法使用简单但有效的遗传算法(GA)扩展了最先进的深度神经进化方法,该算法旨在有效地学习深度RL策略网络权重。使用Atari 2600基准测试的四个游戏进行了实验。结果提供了进一步证据表明GA与基于梯度的算法竞争深度RL。结果还表明,对动作序列的新颖性搜索是选择压力的有效来源,可以将其整合到用于深度RL的现有旋转算法中。
translated by 谷歌翻译
我们提出了标签梯度对齐,这是一种用于半监督学习的新算法,它为未标记的数据和训练标签上的列车分配标签。我们通过将点(x,y)映射到(x,y)处的模型的梯度来在输入空间上定义语义上有意义的距离度量。然后我们制定一个优化问题,其目标是最小化该空间中标记数据和未标记数据之间的距离,并通过推算标签上的梯度下降来解决它。我们使用Oliver等人提出的标准化架构来评估标签梯度对齐。 (2018)并且在半监督的CIFAR-10分类中证明了最先进的准确性。
translated by 谷歌翻译
胶质瘤是最常见的原发性脑恶性肿瘤,具有不同程度的侵袭性,可变预后和各种异质性组织亚区域,即肿瘤周围水肿/侵入组织,坏死核心,活性和非增强核心。这种内在的异质性也被用于它们的放射性表型,因为它们的子区域通过在多参数磁共振成像(mpMRI)扫描中传播的不同强度分布来描绘,反映了不同的生物学特性。它们的异质形状,范围和位置是其中的一部分。使这些肿瘤难以切除的因素,在某些情况下无法手术。切除肿瘤的数量也是纵向扫描中考虑的一个因素,用于评估表观肿瘤以进行潜在的进展诊断。此外,有越来越多的证据表明,各种肿瘤亚区域的准确分割可以为定量图像分析提供预测患者整体的基础。生存。该研究评估了在国际脑肿瘤分割(BraTS)挑战的最后七个实例(即2012-2018)期间用于mpMRI扫描中的脑肿瘤图像分析的最先进的机器学习(ML)方法。具体而言,我们专注于i)评估术前mpMRI扫描中各种神经胶质瘤亚区的分割,ii)通过肿瘤亚区的纵向生长评估潜在的肿瘤进展,超出RECIST标准的使用,以及iii)预测整体术前mpMRI扫描对经历完全切除的患者的生存率。最后,我们研究了为每个任务确定最佳ML算法的挑战,考虑到除了在每个挑战实例上多样化之外,多机构mpMRI BraTS数据集也是一个不断发展/不断发展的数据集。
translated by 谷歌翻译
命题典型性逻辑(PTL)是最近提出的逻辑,通过使用典型算子来丰富经典命题逻辑,捕获给定句子所持有的最典型(别名正常或常规)情况。 PTL的语义是按照着名的KLM优先推理方法研究的排序模型,因此KLM风格的后果关系可以嵌入到PTL中。尽管典型操作者采用的语义引入了单调特征,但明显的Tarskian对PTL蕴涵的定义仍然是单调的,因此在许多情况下都不合适。我们的第一个重要结果是一个不可能性定理,它表明,一组最初看起来都适合于典型性的蕴涵概念的提议不能同时得到满足。更仔细的检查表明,这一结果最好被解释为主张开发不止一种PTL蕴涵的论据。本着这种解释的精神,我们研究了PTL的三种不同(语义)蕴涵版本,每一种都基于Lehmann和Magidor对KLM风格条件引入的理性闭包的定义,并构建了不同的最小概念。
translated by 谷歌翻译
我们引入了样式增强,一种基于随机样式传递的新形式的数据增强,用于提高卷积神经网络(CNN)在分类和基于回归的任务上的鲁棒性。在训练过程中,我们的风格增强使纹理,对比度和颜色随机化,同时保留形状和语义内容。这是通过调整任意样式传输网络来执行样式随机化,通过从多元正态分布中采样输入样式嵌入而不是从样式图像中推断它们来实现的。除了标准分类实验,我们还研究了样式扩充(以及通常的数据增强)对域转移任务的影响。我们发现数据增强显着提高了对域移位的鲁棒性,并且可以用作域自适应的简单,域不可知替代方案。将样式增强与七种传统增强技术相结合进行比较,我们发现它可以很容易地与它们结合以提高网络性能。我们通过域转移实验分类和单眼深度估计验证了我们的技术的有效性,说明了泛化中的一致性。
translated by 谷歌翻译
本文提出使用端到端卷积神经网络通过体积回归直接重建人体的三维几何。所提出的方法不需要拟合形状模型,并且可以在各种输入类型中工作。 ,无论是地标,图像或分割面具。另外,仍然重建不可见部分(自遮挡或其他部分),而深度图回归不是这种情况。我们提出的结果表明,我们的方法可以在给定适当的训练数据集的情况下处理姿势变化和详细重建。
translated by 谷歌翻译
Darwiche和Pearl的开创性1997年文章概述了迭代信念修正逻辑的一些基本原则。这些原则,即DPpostulates,已经以多种替代方式得到补充。大多数提出的建议都产生了一种“还原论”,即通过世界秩序来识别信仰状态。然而,这一立场最近被批评为不可接受的强势。其他提议,例如“可支配的运营商”的特殊原则(P),又称“独立”,仍然值得称赞。在本文中,假设DP假设和(P)具有许多新的条件。虽然DP假设约束先验条件和后验条件信念集之间的关系,但我们的新原则显着地控制了从两个后验条件信念集之间的关系。不同规定的共同先验。我们证明了包含词典和限制修正的结果族的运算符可以表示为与“适当序数区间”(POI)赋值相关的相关信念,这种结构比简单的世界排序更精细。通过注意这些运算符满足大量AGM时代假设(包括超扩展)的迭代版本,这些对于一般的可接受运营商来说是不合理的。
translated by 谷歌翻译
计算统计和机器学习中的一项重要任务是使后验分布$ p(x)$近似,并在一组代表点$ \ {x_i \} _ {i = 1} ^ n $上支持经验测量。本文主要关注点的选择本质上是确定性的方法,当$ n $很小时,重点是实现准确的近似。为此,我们要提出“斯坦因点”。我们的想法是利用贪婪或条件梯度方法迭代地最小化经验度量与$ p(x)$之间的内核Stein差异。我们的实证结果表明,SteinPoints能够在适度的计算成本下准确逼近后验。此外,提供理论结果以建立该方法的收敛性。
translated by 谷歌翻译
3D face reconstruction is a fundamental Computer Vision problem ofextraordinary difficulty. Current systems often assume the availability ofmultiple facial images (sometimes from the same subject) as input, and mustaddress a number of methodological challenges such as establishing densecorrespondences across large facial poses, expressions, and non-uniformillumination. In general these methods require complex and inefficientpipelines for model building and fitting. In this work, we propose to addressmany of these limitations by training a Convolutional Neural Network (CNN) onan appropriate dataset consisting of 2D images and 3D facial models or scans.Our CNN works with just a single 2D facial image, does not require accuratealignment nor establishes dense correspondence between images, works forarbitrary facial poses and expressions, and can be used to reconstruct thewhole 3D facial geometry (including the non-visible parts of the face)bypassing the construction (during training) and fitting (during testing) of a3D Morphable Model. We achieve this via a simple CNN architecture that performsdirect regression of a volumetric representation of the 3D facial geometry froma single 2D image. We also demonstrate how the related task of facial landmarklocalization can be incorporated into the proposed framework and help improvereconstruction quality, especially for the cases of large poses and facialexpressions. Testing code will be made available online, along with pre-trainedmodels http://aaronsplace.co.uk/papers/jackson2017recon
translated by 谷歌翻译