基于树的机器学习模型,例如随机森林,决策树和梯度增强树,是当今实践中使用的最流行的非线性预测模型,但是对于解释它们的预测却相对较少关注。在这里,我们通过三个主要贡献显着提高了树模型的可解性:1)基于游戏理论计算最优解释的第一个多项式时间算法。 2)一种直接测量局部特征相互作用效果的新型解释。 3)一组新的工具,用于基于每个预测的许多局部解释来理解全局模型结构。我们将这些工具应用于三个医学机器学习问题,并展示如何结合许多高质量的局部解释使我们能够代表全局结构,同时保持对原始模型的本地忠诚度。这些工具可以使我们知道i)在美国一般人群中识别高幅度但低频率的非线性死亡率因素,ii)突出显示具有共同风险特征的不同群体子群,iii)识别慢性肾病危险因素之间的非线性相互作用, iv)通过识别哪些特征随着时间的推移降低模型的性能来监控部署在医院中的机器学习模型。鉴于基于树的机器学习模型的普及,这些对其可解释性的改进对于广泛的领域具有影响。
translated by 谷歌翻译
信息融合是众多工程系统和生物功能的重要组成部分,例如人类认知。融合发生在许多层面,从信号的低级组合到异构决策过程的高级聚合。虽然过去十年见证了深度学习研究的爆发,但神经网络融合并没有观察到同样的革命。具体而言,大多数神经融合方法是特定的,不被理解,分布与局部,和/解释性低(如果存在的话)。在此,我们证明了模糊Choquet积分(ChI),一种强大的非线性聚合函数,可以表示为多层网络,以下称为ChIMP。我们还提出了一种改进的ChIMP(iChIMP),它根据ChI不等式约束的指数数量导致基于随机梯度下降的优化。 ChIMP / iChIMP的另一个好处是它可以实现可解释的AI(XAI)。提供了综合验证实验,并将iChIMP应用于远程感知中的一组异构架构深度模型的融合。我们展示了模型精度的提高,我们之前建立的XAI指数揭示了我们的数据,模型及其决策的质量。
translated by 谷歌翻译
从我们的环境中过滤掉无关信息的能力对于高效处理至关重要。然而,在发展过程中,当建立世界的知识基础时,选择性地分配有意资源的能力是有限的(例如,Amso&Scerif,2015)。在成年期,研究表明围绕注意力焦点的空间位置是一个抑制场,由自上而下的注意力促进相关刺激的处理和抑制周围的干扰物(例如,Hopf等,2006)。然而,尚不完全了解这种现象是否在发展中。在目前的研究中,我们检查了围绕视觉注意焦点的空间抑制是否表现为发育年龄组。 12至27岁的参与者在视觉注意力方面表现出空间抑制。它们的准确度随着空间线索(和有人值守)目标与第二个目标之间的间隔距离的增加而增加,这表明压缩环围绕有人参与的目标。当一个中心线索被提出并因此注意力不再被空间提示时,没有观察到环绕抑制,这表明我们最初的压抑发现确实与注意力的焦点有关。在8至11岁的儿童中没有观察到有意的环绕抑制,即使有较长的空间急救时间,也表明在这些年龄段缺乏效果不是由于注意力反馈过程减慢。我们的研究结果表明,在大约12岁时,自上而下的注意力过程仍然不成熟,并且它们在整个青春期中不断完善,与以前的注意力发展研究很好地融合。
translated by 谷歌翻译
我们开发了一种卷积神经网络(CNN),它可以首次对液氩时间投影室(LArTPC)记录的图像数据中的物体进行像素级预测。我们描述了为培训该网络而开发的网络设计,培训技术和软件工具。这项工作的目的是为MicroBooNE探测器开发一个完整的基于深度神经网络的数据构建链。我们使用MicroBooNEcollection平面图像显示网络在实际LArTPC数据上的有效性的第一次演示。演示用于停止μ子和$ \ nu_ \ mu $充电电流中性π介数数据样本。
translated by 谷歌翻译
综合症监测通过急诊科记录等来源检测和监测个体和人群健康指标。这些记录的自动分类可以提高爆发检测速度和诊断准确性。当前的综合症系统依赖于手工编码的基于关键词的方法来解析书面字段并且可以受益于使用现代监督学习分类器模型。在本文中,我们实现了两个基于长短期记忆(LSTM)和门控恢复单元(GRU)细胞的重复神经网络模型,并将它们与两个传统的词袋分类器进行比较:多项式朴素贝叶斯(MNB)和支持向量机( SVM).MNB分类器是目前用于综合症监测的仅有的两种机器学习算法之一。所有四个模型都经过培训,可以预测临床分类软件定义的诊断代码组,首先是出院诊断的预测,然后是主要投诉领域。这些分类器接受了来自美国一个司法管辖区的360万个去识别的紧急部门记录的培训。我们主要使用F1分数比较这些模型的表现。使用放电诊断,LSTM分类器表现最佳,尽管所有模型的F1分数均高于96.00.GRU在主诉上表现最佳(F1 = 47.38),并且具有bigrams的MNB表现最差(F1 = 39.40)。某些综合症类型比其他类型更容易被发现。例如,使用GRU模型的主要投诉很好地预测了酒精相关疾病(F1 = 78.91),但预测流感很差(F1 = 14.80)。在所有情况下,RNN模型都优于词袋分类器,这表明深度学习模型可以显着改善非结构化文本的自动分类,用于综合症监测。
translated by 谷歌翻译
疾病控制和预防中心(CDC)协调alabor密集型过程,以测量美国儿童中自闭症谱系障碍(ASD)的患病率。随机森林方法在加速这一过程方面表现出了一定的优势,但它们落后于人类分类准确度约5%。我们探讨最近可用的文档分类算法是否可以弥补这一差距。我们应用了8种有监督的学习算法来预测儿童是否满足ASD的病例定义,而不是基于评估中的单词。我们比较了数据的10个随机列车 - 测试分裂中的算法性能,使用分类准确性,F1分数和正呼叫数来评估他们对监视的潜在用途。在10个列车测试周期中,具有朴素贝叶斯特征(NB-SVM)的随机森林和支持向量机均获得略高于87%的平均准确度。 NB-SVM产生的假阴性明显多于假阳性(P = 0.027),但随机森林没有,使其流行率估计与数据中的真实流行率非常接近。对于两种测量,表现最佳的神经网络与随机森林的表现相似。随机森林以及最近可用的模型如NB-SVM和神经网络,以及它也产生了良好的流行率估计。由于假阴性增加,NB-SVM可能不适合用于全自动监控工作流程。由于数据的特征,更复杂的算法,例如分层卷积神经网络,可能不可行训练。如果数据被抽象和处理不同,并且除了评估之外还考虑有关孩子的信息,则当前算法可能表现得更好。
translated by 谷歌翻译
了解模型进行某种预测的原因与许多应用程序中预测的准确性一样重要。然而,大型现代数据集的最高精度通常是通过复杂的模型来实现的,即使是专家也可以解释,例如集合或深度学习模型,在准确性和可解释性之间创造扩展。作为回应,最近提出了各种方法来帮助用户解释复杂模型的预测,但是通常不清楚这些方法是如何相关的,并且当一种方法优于另一种方法时。为了解决这个问题,我们提出了一个用于解释预测的统一框架,即SHAP(SHapley AdditiveexPlanations)。 SHAP为每个要素分配特定预测的重要性值。其新颖的组成部分包括:(1)确定一类新的附加特征重要性度量,以及(2)理论结果表明该类中有一个独特的解决方案,具有一系列理想的性质。新类统一了六种现有方法,值得注意的是因为该类中最近的几种方法缺乏所提出的理想特性。基于这种统一的见解,我们提出了新的方法,这些方法显示出比以前的方法更好的计算性能和/或与人类直觉更好的一致性。
translated by 谷歌翻译
机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
评估图像处理技术功效的传统指标无法理解现代图像处理方法的能力和局限性 - 特别是那些通过深度学习实现的方法。在工程解决方案中应用图像处理时,科学家或工程师需要使用clearmetrics来证明他们的设计决策。通过在图像处理之前和之后应用盲/无参考图像空间质量(BRISQUE),结构相似性(SSIM)指数得分和峰值信噪比(PSNR),我们可以以有意义的方式量化质量改进并确定给定方法的最低可恢复图像质量。
translated by 谷歌翻译
行人和车辆经常在复杂的城市交通中共享道路。这导致车辆和行人之间的相互作用,同时影响对方的运动。为了创建可靠的方法来推理行人行为并设计自驾车和行人之间的通信接口,我们需要更好地理解这种交互。在本文中,我们提出了一种数据驱动的方法来隐式模拟行人与车辆的相互作用,以更好地预测行人行为。我们提出了一种LSTM模型,该模型将行人和自我车辆的过去轨迹以及行人头部方向作为输入,并预测行人的未来位置。我们基于使用车载摄像头拍摄的真实世界内城数据集的实验表明,与基准线使用过去的行人轨迹相比,此类线索的使用改善了行人预测。
translated by 谷歌翻译