问答(QA)作为一个研究领域,主要关注知识库(KB)或自由文本作为知识来源。这两个来源在历史上形成了通过资源提出的各种问题,以及为解决这些问题而开发的方法。在这项工作中,我们看到QA的实际用例,而不是用户指导的知识,它将结构化QA的元素与知识库,非结构化QA与叙述相结合,将多关系QA的任务引入个人叙述。作为实现这一目标的第一步,我们做出了三个关键贡献:(i)我们生成并发布TextWorldsQA,一组五个不同的数据集,whereeach数据集包含动态叙述,描述模拟世界中的实体和关系,与可变组成问题配对知识,(ii)我们在这项任务中对几个最先进的QA模型及其变体进行了全面的评估和分析,以及(iii)发布了一个轻量级的基于Python的框架,我们称之为TextWorlds,可以轻松生成任意的额外世界和叙事,目标是允许社区创建和分享越来越多的不同世界作为此任务的测试平台。
translated by 谷歌翻译
强化学习方法具有众所周知的偏差 - 方差权衡因子步进算法,以实现最佳控制。不幸的是,这在当前的研究中很少得到解决。这种权衡原则与算法的选择无关,例如n步SARSA,n步预期SARSA或步骤树备份。小的n导致大的偏差,而大的n导致大的方差。文献没有为这个价值的最佳选择提供直接的方法。虽然目前所有n步算法在状态空间上使用n的固定值,但我们通过允许其状态具有其特定的n来扩展n步更新的框架。我们在人工辅助强化学习的背景下提出了解决这个问题的方法。我们的方法基于以下观察:如果人们接受关于agiven状态的关键性以及因此需要投入到该状态学习中所需的注意力的数量,那么人类可以更有效地学习。这一观察结果与MDP的每个状态都具有一定的临界度量的观点相关,该度量表示该状态中的动作的选择对回归的影响程度。在我们的算法中,RL代理利用关键性度量,这是由humantrainer提供的函数,以便在本地选择用于更新Q函数的最佳步数n。
translated by 谷歌翻译
我们提出了一种基于事件的摄像机角点检测的学习方法,即使在快速和突然的运动下也能保持稳定。基于事件的摄像机具有高时间分辨率,功率效率和高动态范围。然而,与标准强度图像相比,基于事件的数据的属性非常不同,并且为这些图像设计的角点检测方法的简单扩展在基于事件的数据上表现不佳。我们首先介绍一种计算时间曲面的有效方法,该时间曲面对于对象的速度是不变的。然后我们展示我们可以训练一个随机森林来识别从我们的时间表面移动的角落产生的事件。随机森林也非常高效,因此是处理基于事件的摄像机的高捕获频率的一个很好的选择 - 我们的实施过程高达1.6Mev / son一个CPU。由于我们的时间表面公式和这种学习方法,我们的方法对于角落方向的突然变化比以前的方法更加稳健。我们的方法也自然地为角设置了置信度分数,这对于后处理是有用的。此外,我们还介绍了一种高分辨率数据集,适用于基于预防的摄像机角点检测方法的定量评估和比较。我们称之为SILC,针对Speed Invariant LearnedCorners,并将其与最先进的实验进行比较,展示了更好的性能。
translated by 谷歌翻译
我们在任意有限域$ X \ subset \ mathbb {R} ^ d $上提供半空间的私有学习器,样本复杂度为$ mathrm {poly}(d,2 ^ {\ log ^ * | X |})$。这个学习者的构建块是一个差异私有算法,用于定位$ m> \ mathrm {poly}(d,2 ^ {\ log ^ * | X |})$ points的近似中心点 - 中值的高维概括功能。我们的构建建立了这两个问题之间的关系,这个问题与中位数和学习一维健康阈值之间的关系有关[Bun et al。\ FOCS'15]。这种关系表明私有定位中心点的问题可能在差分私有算法的设计中具有进一步的应用。我们还提供了样本复杂性的下限,以便私密地找到凸包中的点。对于近似差异隐私,我们显示$ m = \ Omega(d + \ log ^ * | X |)$的下限,而对于纯差分隐私$ m = \ Omega(d \ log | X |)$。
translated by 谷歌翻译
智能代理如何以数据有效的方式解决各种任务?解开的表征学习方法假定这样的代理人将从将世界的基础结构分离(解开)到其表示的不相交部分中受益。然而,没有普遍认同的解开的定义,尤其是因为不清楚如何用已知的基本真理生成过程将世界结构概念​​形式化为toatatasets。在这里,我们提出通过关注世界的转换属性,可以找到用于表征解缠结表示的原则解决方案。特别是,wesuggest认为那些只改变了下层世界状态的某些属性,同时让所有其他属性保持不变的转换,对任何类型的数据都是可利用的结构。类似的观点已经成功地应用于物理学中,对称变换的研究彻底改变了对世界结构的理解。通过使用群论和表征理论的形式将对称变换连接到矢量表示,我们得到了解缠表示的第一个正式定义。我们的新定义与许多当前关于解开的直觉一致,同时也为以前的一些争论点提供了原则性的解决方案。虽然这项工作侧重于正式定义解开 - 而不是解决学习问题 - 但我们认为,研究数据转换的观点转变可以促进更好的表征学习算法的发展。
translated by 谷歌翻译
尽管他们在许多任务中表现出色,但深层神经网络却在关系推理中挣扎。最近通过引入考虑对象之间关系的插件关系模块来解决这个问题。不幸的是,这是组合昂贵的。在这个扩展的摘要中,我们展示了一个结合了扩张转换的DenseNet在Sort-of-CLEVR数据集上的关系推理方面表现优异,允许我们放弃这个关系模块及其相关费用。
translated by 谷歌翻译
在保护隐私的多代理规划中,一组代理尝试在保持私有数据和操作的同时解决多代理规划问题。虽然在过去的这些领域已经开展了很多工作,但其理论基础还没有完全解决。具体而言,虽然具有精确隐私保护的算法很有用{Yao82b,GMW87},但即使是最有效的实现也不够现实。而对于实际算法,存在着许多隐私保证。 \ smafs~ \ cite {Brafman15},多代理正向搜索算法的变体〜\ cite {nissim2014distributed}是唯一一种尝试提供更精确保证的实用算法,但仅限于非常有限的设置和仅有校对草图。在本文中,我们为基于搜索的算法制定了安全计算的精确概念,并证明\ smafs \在所有领域都具有此属性。我们还提供了其完整性的证明。
translated by 谷歌翻译
我们为深度强化学习方法引入了一个探索奖金,该方法易于实现,并且增加了计算执行的最小开销。奖励是神经网络预测由固定随机初始化神经网络给出的观察特征的误差。我们还介绍了一种灵活地结合内在和外在奖励的方法。我们发现随机网络蒸馏(RND)加值与这种增加的灵活性相结合,可以在几个难以探索的Atarigames上取得重大进展。特别是我们在Montezuma'sRevenge上建立了最先进的表现,这个游戏很难用于强化学习方法。据我们所知,这是第一种方法,在不使用演示或接近游戏的基本状态的情况下,在此游戏中实现比平均人类表现更好的方法,并且偶尔完成第一级。
translated by 谷歌翻译
这份非正式的技术报告详细介绍了三层完全连接神经网络中ReLU装置的决策边界的几何图示。设计和训练网络以预测来自(x,y)输入位置的像素强度。构建神经网络(GINN)工具的几何图形,以便在网络经过培训时可视化和跟踪ReLU单元从活动切换到关闭(或反之亦然)的点。在此观察并讨论了几种现象。本技术报告是在线演示的博客文章的支持文档,可从http://www.bayeswatch.com/2018/09/17/GINN/获取。
translated by 谷歌翻译
在这篇简短的技术报告中,我们介绍了CINIC-10数据集作为CIFAR-10的插件替代方案。它是通过将CIFAR-10与从ImageNet数据库中选择和下采样的图像组合而编译的。我们提出了编译数据集的方法,说明不同类的示例图像,为存储库的每个部分提供像素分布,并为众所周知的模型提供标准基准。可以在关联的github存储库中找到有关下载,使用和编译的详细信息。
translated by 谷歌翻译