基于树的机器学习模型,例如随机森林,决策树和梯度增强树,是当今实践中使用的最流行的非线性预测模型,但是对于解释它们的预测却相对较少关注。在这里,我们通过三个主要贡献显着提高了树模型的可解性:1)基于游戏理论计算最优解释的第一个多项式时间算法。 2)一种直接测量局部特征相互作用效果的新型解释。 3)一组新的工具,用于基于每个预测的许多局部解释来理解全局模型结构。我们将这些工具应用于三个医学机器学习问题,并展示如何结合许多高质量的局部解释使我们能够代表全局结构,同时保持对原始模型的本地忠诚度。这些工具可以使我们知道i)在美国一般人群中识别高幅度但低频率的非线性死亡率因素,ii)突出显示具有共同风险特征的不同群体子群,iii)识别慢性肾病危险因素之间的非线性相互作用, iv)通过识别哪些特征随着时间的推移降低模型的性能来监控部署在医院中的机器学习模型。鉴于基于树的机器学习模型的普及,这些对其可解释性的改进对于广泛的领域具有影响。
translated by 谷歌翻译
在过去的十年中,受到大脑启发的人工智能(AI)模型在执行真实世界的感知任务(如对象分类和语音识别)方面取得了前所未有的进步。最近,自然智能的研究人员已经开始使用这些AI模型来探索大脑如何执行这些任务。这些发展表明,未来的进展将受益于学科之间不断增加的互动。在这里,我们将AlgonautsProject介绍为一个结构化和定量的沟通渠道,用于自然和人工智能研究人员之间的跨学科交互。该项目的核心是一个开放的挑战,其定量基准,其目标是通过计算模型来计算大脑数据。该项目有可能提供更好的自然智能模型,并收集推进人工智能的研究结果。 2019年的Algonauts项目专注于对人类观察物体图像时预测人类大脑活动的计算模型进行基准测试。 2019年版的Algonauts项目可在线获取:http://algonauts.csail.mit.edu/。
translated by 谷歌翻译
在这项工作中,我们通过将生成潜在变量模型拟合到多语言字典来实现以离线方式学习多语言单词表示的任务。我们将不同语言中的等价单词建模为由表示其潜在词汇意义的共同潜在变量生成的同一单词的不同视图。我们通过查询拟合的多语言嵌入模型来探索对齐任务,从而在各种任务中实现竞争结果。所提出的模型在嵌入空间中具有鲁棒性,使其成为从嘈杂语料库中学习的分布式表示的合适方法。
translated by 谷歌翻译
图是有用的结构,可以模拟几个重要的现实问题。最近,学习图表引起了相当多的关注,从而提出了学习这些数据结构的新方法。其中一个研究产生了NetGAN,这是一种通过随机游走生成图形的新方法。虽然NetGAN在生成图形和链接预测的任务中的准确性方面已经显示出有希望的结果,但是从中开始随机游走的顶点的选择可能导致不一致和高度变量结果,特别是当步行时间很短时。作为randomstarting的替代方案,本研究旨在建立一种从一组密集顶点初始化随机行走的新方法。我们的目的是通过不同大小的随机游走,基于其对其邻域的整个顶点的影响的倒数来估计阳极的重要性。所提出的方法管理实现了显着更好的准确性,更少的方差和减少了更小的方法。
translated by 谷歌翻译
基于深度的人体活动分析研究取得了突出的成绩,并证明了3D表示在行动识别中的有效性。现有的基于深度和基于RGB + D的动作识别基准具有许多局限性,包括缺乏大规模训练样本,不同类别的实际数量,多样化的内部视图,不同的环境条件以及各种人类主体。在这项工作中,我们引入了一个用于RGB + D人类行为识别的大规模数据集,该数据集来自106个不同的主题,包含超过114,000个视频样本和800万帧。该数据集包含120种不同的动作类,包括日常,相互和健康相关的活动。我们评估了该数据集上一系列现有3D活动分析方法的性能,并展示了将deeplearning方法应用于基于3D的人类行为识别的优势。此外,我们在数据集上研究了一种新的一次性三维活动识别问题,并为此任务提出了一种简单而有效的动作部分语义相关性(APSR)框架,为新型动作类的识别提供了有希望的结果。我们相信,引入这个大规模数据集将使社区能够应用,调整和开发各种渴望数据的学习技术,以实现基于深度和基于RGB + D的人类活动理解。 [数据集可在以下网址获得:http://rose1.ntu.edu.sg/Datasets/actionRecognition.asp]
translated by 谷歌翻译
本文通过使用生成网络(SPLINE-Net)的LightingInterpolation和Normal Estimation来解决稀疏光度立体声.SPLINE-Net包含一个光照插值网络,在稀疏的光线作为输入的情况下生成密集的照明观测,然后是一个估算表面的normalestimation网络法线。两个网络由所提出的对称和非对称损失函数共同约束,以强制执行各向异性约束并执行对全局照明效果的异常拒绝。通过仅使用10个不同光源的图像而不是使用近100个图像,SPLINE-Net被验证为优于现有BRDF光度计的现有方法。
translated by 谷歌翻译
信用评分无处不在,对贷款提供商和监管机构起着重要作用。在本文中,我们展示了如何在实际环境中开发小额贷款信用系统。我们展示了出现的挑战并讨论了解决方案。特别是,我们关注模型的可解释性和数据质量。最后,我们介绍了有助于模型开发和评估其性能的半监督算法。
translated by 谷歌翻译
在本报告中,我们回顾了基于记忆的元学习作为建筑样本有效策略的工具,该策略从过去的经验中学习以适应目标类中的任何任务。我们的目标是为读者提供此工具的概念基础,以构建在陆域上运行的新的可扩展代理。为此,我们提出了基本的算法模板,用于建立最佳预测器和强化学习器,其行为就好像它们具有允许它们有效地利用任务结构的概率模型。此外,我们在贝叶斯框架内重建基于内存的元学习,显示元学习策略接近最优,因为它们分摊贝叶斯过滤数据,其中适应在内存动态中实现为具有足够统计数据的状态机。从本质上讲,基于记忆的学习 - 学习将概率序贯推理的难题转化为回归问题。
translated by 谷歌翻译
在过去的一年中,用于预训练和转学习的新模型和方法在各种语言理解任务中带来了显着的性能提升。一年前推出的GLUE基准提供了一个单数量度量标准,总结了各种此类任务的进展情况,但最近基准测试的表现接近非专家人员的水平,表明进一步研究的空间有限。本文回顾了从GLUE基准测试中汲取的经验教训,并介绍了SuperGLUE,这是一款以GLUE为基础的新标记,具有一系列更加困难的语言理解任务,改进的资源以及新的公共排行榜.SuperGLUE将很快在super.gluebenchmark.com上发布。
translated by 谷歌翻译
最近,用于语音识别的端到端序列到序列模型已经引起了研究界的极大兴趣。虽然以前的架构选择围绕延时神经网络(TDNN)和长期记忆(LSTM)递归神经网络,但我们建议通过Transformer架构作为替代方案来引起自我关注。我们的分析表明,具有高学习能力的深层变压器网络能够超越先前的端到端方法,甚至与传统的混合系统相匹配。此外,我们培训了非常深的模型,其中包含多达48个变压器层,用于编码器和解码器以及随机残余连接,这极大地提高了通用性和培训效率。由此产生的模型在Switchboard基准测试中优于所有先前的端到端ASR方法。这些模型的集合分别在Switchboard和CallHome测试集上实现了9.9%和17.7%的WER。这一发现使我们的端到端模型与之前的混合动力系统达到了竞争水平。此外,通过模型集成,变形金刚可以胜过某些混合系统,这在系统结构和训练过程方面都比较复杂。
translated by 谷歌翻译