已经证明,学习辅助任务可以改善主要任务的概括。然而,这是以手动标记附加任务为代价的,这些任务可能对主要任务有用,也可能没有用。我们提出了一种新方法,可以自动学习辅助任务的标签,这样就可以改进任何监督学习任务,而无需访问其他数据。该方法是训练两个神经网络:用于预测辅助标签的标签生成网络,以及用于训练辅助任务的主要任务的多任务网络。标签生成网络的损失包含了多任务网络的性能,因此两个网络之间的这种交互可以被视为元学习的一种形式。我们表明,我们提出的方法Meta AuXiliary Learning(MAXL)在7个图像数据集上的表现优于单一任务,而不需要额外的辅助标签。我们还展示了MAXLout执行其他几个基线来生成辅助标签,并且与人工定义的辅助标签相比,它们具有竞争力。我们方法的这种监督性质导致了一种朝着自动化概括的有希望的新方向。源代码可从\ url {https://github.com/lorenmt/maxl}获得。
translated by 谷歌翻译
磁共振成像(MRI)是一种非侵入性诊断工具,无需使用电离辐射即可提供出色的软组织对比度。但与其他临床成像模式(如CT或超声)相比,MRI的数据采集过程本质上是慢。此外,动态应用需要快速连续收集一系列图像。因此,减少采集时间和提高采样数据集的成像质量一直是最后二十年代研究的活跃领域。并行成像和压缩感测(CS)的组合已被证明有益于广泛的MRI应用。最近,已经证明深度学习技术胜过CS方法。这些技术中的一些通过训练深度神经网络(DNN)从测量的傅立叶样本和最终图像进行映射,将MRI重建作为直接反演问题和解决方案。考虑到MRI中的正演模型从一个数据集变为下一个数据集,这些方法必须要经过大量的数据语料库或仅限于特定应用程序,并且无法确保数据一致性。另一种方法是使用“即插即用”(PnP)算法,该算法迭代基于前向模型的信号恢复的图像去噪。 PnP算法非常适合压缩MRI,因为它们将图像建模与正向模型分离,由于线圈灵敏度图,采样模式和图像分辨率的变化,它们可能在不同扫描之间发生显着变化。因此,利用PnP,可以直接利用现有技术的图像去噪技术(例如基于DNN的技术)来进行压缩MRI图像重建。本文的目标是双重的:i)回顾最新的插入和播放方法的进展,以及ii)讨论它们在压缩MRI图像重建方面的应用。
translated by 谷歌翻译
互惠是人类社会互动的重要特征,也是人们合作的基础。更重要的是,简单的互惠形式已经证明在矩阵游戏社会困境中具有显着的弹性。最着名的是,在针对囚徒困境的比赛中,针对性的策略表现得非常好。不幸的是,这种策略并不适用于现实世界,其中合作或缺陷的选择在时间和空间上得到延伸。在这里,我们提出一般的在线强化学习算法,显示对其共同参与者的互惠行为。我们表明,在与$ 2 $ $ -player Markov游戏以及$ 5 $ -player intertmporal socialdilemmas中进行学习时,它可以为更广泛的群体带来更好的社交结果。我们分析了由此产生的政策,以表明往复行为受其共同参与者行为的强烈影响。
translated by 谷歌翻译
在本文中,我们提出了可利用性下降,一种新的算法,用于通过针对最坏情况的直接策略优化来计算具有不完全信息的双玩家零和广义形式游戏中的近似均衡。我们证明,当遵循这种优化时,玩家策略的可利用性渐近地收敛为零,因此当两个玩家都采用这种优化时,联合策略会收敛到纳西均衡。与虚构游戏(XFP)和反事实后悔化(CFR)不同,我们的融合结果与被优化的政策而不是平均政策有关。我们的实验表明,在四个基准游戏中,收敛率与XFP和CFR相当。使用函数逼近,我们发现我们的算法在两个游戏中执行表格版本,据我们所知,这是在这类算法中不完全信息游戏中的第一个这样的结果。
translated by 谷歌翻译
最近关于集合上函数表示的工作考虑了在潜在空间中使用求和来强制置换不变性。特别是,有人推测,随着所考虑的集合的基数增加,这个潜在空间的维度可能会保持不变。但是,我们证明导致这种猜想的分析需要高度不连续的映射,并认为这仅仅是有限的实际用途。 。在这种观察的启发下,我们证明了通过连续映射(例如由神经网络或高斯过程提供)实现该模型实际上对该空间的维度施加了约束。用于设定输入的实际通用函数表示通常至少具有输入元素的最大数量的大小的潜在维度来实现。
translated by 谷歌翻译
关于新闻诚信的主题,目前准确,公正的新闻报道状况在2016年美国总统选举中引起了很多争论。为了追求新闻文本的计算评估,媒体机构对来源的陈述(归因)提供了一个共同的证据来运作。在本文中,我们开发了一种方法来比较新闻文本属性的党派特征,并应用它来描述候选人希拉里克林顿和现任总统唐纳德特朗普的陈述中的差异。在这样做的过程中,我们提供了一个训练模型,该模型经过600多个内部注释归因,以确定每个候选人的精确度> 88%。最后,我们将讨论其未来研究表现的见解。
translated by 谷歌翻译
发现和利用环境中的因果结构对于智能代理来说是一项艰巨的挑战。在这里,我们探讨通过元强化学习是否可以出现因果反应。我们通过无模型强化学习训练一个经常性的网络来解决一系列问题,每个问题都包含因果结构。我们发现受过训练的代理人可以在新情况下进行因果推理以获得奖励。代理人可以选择信息干预,从观察数据中得出因果推论,并进行反事实预测。虽然也存在已建立的正式因果推理算法,但在本文中我们表明这种推理可以从无模型强化学习中获得,并且表明复杂环境中的因果推理可能会受益于此处提供的更多端到端的基于学习的方法。通过为代理人提供执行和解释实验的能力,这项工作还为强化学习中的结构探索提供了新的策略。
translated by 谷歌翻译
表征行为的神经编码仍然是许多研究领域中的一项具有挑战性的任务,部分原因是由于大脑活动的复杂和嘈杂的时空动态。对这些神经编码进行建模的一个重要方面是将强大的,行为相关的信号与背景活动分离,后者通常包含来自无关脑过程的信号和来自先前行为事件的信息。为了实现这一分离,我们开发了一个双分支状态空间变分自动编码器(SSVAE)模型,以分别描述瞬时诱发前景信号和依赖于上下文的背景信号。我们使用平滑的高斯混合模型模拟自发性语言诱发的大脑动力学。通过应用所提出的SSVAE模型来跟踪一个参与者多个小时内的ECoG动态,我们发现该模型可以比其他潜在因子推断算法更准确地预测语音相关动态。我们的结果证明,单独建模瞬时语音诱发和慢速上下文依赖的大脑动力学可以增强跟踪性能,这对于各种神经科学子学科的高级神经编码和解码模型的发展具有重要意义。
translated by 谷歌翻译
我们提出了ParaBank,这是一个大规模的英语复述数据集,在数量和质量上都超过了前所未有的工作量。按照ParaNMT的方法,使用捷克语 - 英语神经机器翻译(NMT)系统来生成英语参考语句的新颖翻译。然而,通过在NMT解码过程中添加词汇约束,我们能够为每个源句产生多个高质量的句子释义,产生一个英语词汇表资源,其中包含超过40亿个生成的令牌并表现出更大的词汇多样性。利用人类的判断,我们还证明了帕拉班克的释义在语义相似性和流畅性方面都优于ParaNMT。最后,我们使用ParaBank来训练单语NMT模型,同时支持用于句子重写任务的词法约束解码。
translated by 谷歌翻译
利用新数据源是加快材料设计和发现步伐的关键一步。为了补充由历史,实验和计算数据驱动的综合计划的进步,我们提出了一种将科学文献与综合见解联系起来的自动化方法。从自然语言文本开始,我们应用来自语言模型的单词嵌入,这些嵌入被输入到命名实体识别模型中,在该模型上训练条件变分自动编码器以生成任意材料的合成。我们通过预测两种钙钛矿材料的前体来展示这种技术的潜力,仅使用他们首次报道的合成之前十年内发表的训练数据。我们证明该模型学习了与合成相关的属性相对应的材料的表示,并且该模型的行为补充了现有的热力学知识。最后,我们应用该模型对所提出的钙钛矿化合物进行合成性筛选。
translated by 谷歌翻译