我们提出了两种基于新的可学习三角测量方法的多视图3D人体姿态估计的新颖解决方案,该方法结合了来自多个2D视图的3D信息。第一(基线)解是基本的可微分的代数三角测量,其中增加了从输入图像估计的置信度。第二种解决方案基于来自中间2D骨干特征图的体积聚集的新方法。然后通过3D卷积来精确聚集的体积,其产生最终的3D关节热图并且允许先前对人体姿势建模。至关重要的是,这两种方法都是端到端可区分的,这使我们能够直接优化目标指标。我们展示了跨数据集的解决方案的可转移性,并显着改善了Human3.6M数据集上的多视图技术水平。 Videodemonstration,注释和其他材料将发布在我们的项目页面(https://saic-violet.github.io/learnable-triangulation)。
translated by 谷歌翻译
强化学习中的选项框架模拟了技能或时间延长的动作序列的概念。发现可重复使用的技能通常需要构建选项,导航到瓶颈状态。这项工作采用了一种互补的方法,我们试图找到导航到具有里程碑意义的国家的选择。这些状态是连接良好的区域的原型代表,因此可以相对容易地访问相关区域。在这项工作中,我们提出了Successor Options,它使用Successor Representations来构建状态空间模型。使用新颖的伪奖励来学习这些选项策略,并且可以轻松地将模型转换为高维空间。此外,我们还提出了一个在构造成功表示和构建选项之间迭代的增量后继选项模型,当robustSuccessor表示不能仅仅从原始操作构建时,这很有用。我们展示了我们的方法对网格世界的集合以及Fetch的高维机器人控制环境的功效。
translated by 谷歌翻译
自动化规划是人工智能从一开始就是主要的研究领域之一。自动化规划研究旨在开发能够自动解决复杂问题的一般推荐者(即规划者)。从广义上讲,规划者依靠一个通用模型来描述世界的可能状态以及为改变世界地位而可以采取的行动。给定模型和初始已知状态,规划器的目标是合成实现特定目标状态所需的一组动作。经典的计划方法大致对应于上面给出的描述。基于时间轴的方法是一种特定的规划范例,能够在统一的求解过程中整合因果和时间推理。尽管缺少对相关规划概念的共同解释,但这种方法已成功应用于许多现实场景中。实际上,应用这种技术的现有框架之间存在显着差异。每个框架都依赖于自己对基于时间轴的规划的解释,因此比较这些系统并不容易。因此,这项工作的目的是通过解决从相关规划概念的语义到建模和求解技术的几个方面来研究基于时间线的规划方法。具体而言,该博士工作的主要贡献包括:(i)对基于时间线的方法进行非正式表征的提议,该方法能够处理时间不确定性; (ii)分层建模和解决方案的提议; (iii)制定一个用于规划与时间表的执行的通用框架; (iv)在现实世界的制造场景中验证这种方法的{\ dag}。
translated by 谷歌翻译
策略梯度方法是强大的强化学习算法,并且已被证明可以解决许多复杂的任务。然而,这些方法也是数据无效的,受到高方差梯度估计的影响,并且经常陷入局部最优。这项工作通过将最近改进的非政策数据的重用和参数空间的探索与确定性行为政策相结合来解决这些弱点。由此产生的目标适用于标准的神经网络优化策略,如随机梯度下降或随机梯度哈密顿蒙特卡罗。通过重要性抽样对以前的推出进行大量提高数据效率,而随机优化方案有助于逃避局部最优。我们评估了一系列连续控制基准测试任务的建议方法。结果表明,该算法能够使用比标准策略梯度方法更少的系统交互成功可靠地学习解决方案。
translated by 谷歌翻译
我们根据修辞结构理论(RST)提出了一种有效的句子级语篇分析的神经框架。我们的框架包括一个话语分段器,用于识别文本中的基本话语单元(EDU),以及一个以低调的方式构建话语树的话语分析器。分段器和解析器都基于PointerNetworks并在线性时间内运行。我们的分段器得出$ F_1 $得分为95.4,我们的解析器在累计标签(关系)指标上获得了$ F_1 $ 81.7分,超过以前的方法,并且在两项任务上都达成了人类协议(98.3和83.0 $) F_1 $)。
translated by 谷歌翻译
在过去的十年中,受到大脑启发的人工智能(AI)模型在执行真实世界的感知任务(如对象分类和语音识别)方面取得了前所未有的进步。最近,自然智能的研究人员已经开始使用这些AI模型来探索大脑如何执行这些任务。这些发展表明,未来的进展将受益于学科之间不断增加的互动。在这里,我们将AlgonautsProject介绍为一个结构化和定量的沟通渠道,用于自然和人工智能研究人员之间的跨学科交互。该项目的核心是一个开放的挑战,其定量基准,其目标是通过计算模型来计算大脑数据。该项目有可能提供更好的自然智能模型,并收集推进人工智能的研究结果。 2019年的Algonauts项目专注于对人类观察物体图像时预测人类大脑活动的计算模型进行基准测试。 2019年版的Algonauts项目可在线获取:http://algonauts.csail.mit.edu/。
translated by 谷歌翻译
在本文中,我们展示了逻辑系统中的几个相似之处,它们同时涉及演绎和定量推理。我们声称将这些系统执行的任务称为定量逻辑推理是合适的。在整个类中都存在类似的属性,因为其成员中存在一组适用于满足性决策问题研究的线性代数技术。在本演示中,我们将定义逻辑推理视为由命题ProbabilisticLogic执行的任务;一阶逻辑,在包含一元和有限二元谓词的片段上计数量词;和命题Lukasiewicz无限值的概率逻辑
translated by 谷歌翻译
世界上的事件可能是由其他未观察到的事件引起的。我们在连续的时间内考虑事件的顺序。给定完整序列的概率模型,我们建议粒子平滑 - 一种顺序重入采样的形式 - 以不完整的序列来计算丢失的事件。我们基于一种双向连续时间LSTM开发了一系列提案分布:双向性使得提案能够对未来的观测情况进行调整,而不仅仅局限于粒子滤波中的过去。我们的方法可以对可能的完整序列(粒子)的集合进行采样,从中我们形成单个共识预测,在我们选择的损失度量下具有低贝叶斯风险。我们使用不同的遗漏机制在多个合成和真实域中进行实验,并使用神经Hawkes过程对每个域中的完整序列进行建模(Mei&Eisner 2017)。在保持不完整的序列上,我们的方法可以有效地推断出地面实况不存在的事件,粒子平滑在粒子滤波方面不断改进。
translated by 谷歌翻译
在本文中,我们提出了TauRieL和目标旅行商问题(TSP),因为它在理论和应用科学中具有广泛的适用性。 TauRieLutilizes一个由演员评论家启发的架构,它采用普通的feedforwardnets来获取策略更新向量$ v $。然后,我们使用$ v $来改进生成策略的状态转换矩阵。此外,状态转换矩阵允许求解器从预先计算的解决方案(例如最近邻居)初始化。在在线学习环境中,TauRieL统一了训练和搜索,它可以在几秒钟内产生近乎最佳的结果。在演员评论体系结构中对神经网络的输入是原始的2-Dinputs,这个决定背后的设计理念是保持神经网络比具有宽嵌入的体系结构小,其中省略了嵌入的任何分布式表示。因此,与最先进的离线技术相比,TauRieL生成的TSP解决方案比TSP实例快两个数量级。 6.1 \%在最坏的情况下。
translated by 谷歌翻译
将一大块文本分割成单词通常是处理中文文本的第一步,但其必要性很少被探索过。在本文中,我们提出了中国分词(CWS)是否是基于深度学习的中国自然语言处理所必需的基本问题。基于神经词汇的Webenchmark模型依赖于基于神经char的模型的分词,这些模型不涉及四端到端NLP基准测试任务中的分词:语言建模,机器翻译,句子匹配/释义和文本分类。通过这两种模型之间的直接比较,我们发现基于char的模型始终优于基于单词的模型。基于这些观察,我们进行了全面的实验,以研究为什么基于单词的模型在这些基于深度学习的NLP任务中表现不佳。我们表明,因为基于单词的模型更容易受到数据稀疏性和词汇表外(OOV)词的影响,因此更容易过度拟合。我们希望本文能够鼓励社区研究人员重新思考基于深度学习的中国自然语言处理中分词的必要性。 \脚注{Yuxian Meng和Xiaoya Li对本报的贡献相同。}
translated by 谷歌翻译