信息融合是众多工程系统和生物功能的重要组成部分,例如人类认知。融合发生在许多层面,从信号的低级组合到异构决策过程的高级聚合。虽然过去十年见证了深度学习研究的爆发,但神经网络融合并没有观察到同样的革命。具体而言,大多数神经融合方法是特定的,不被理解,分布与局部,和/解释性低(如果存在的话)。在此,我们证明了模糊Choquet积分(ChI),一种强大的非线性聚合函数,可以表示为多层网络,以下称为ChIMP。我们还提出了一种改进的ChIMP(iChIMP),它根据ChI不等式约束的指数数量导致基于随机梯度下降的优化。 ChIMP / iChIMP的另一个好处是它可以实现可解释的AI(XAI)。提供了综合验证实验,并将iChIMP应用于远程感知中的一组异构架构深度模型的融合。我们展示了模型精度的提高,我们之前建立的XAI指数揭示了我们的数据,模型及其决策的质量。
translated by 谷歌翻译
We develop a multi-task convolutional neural network (CNN) to classify multiple diagnoses from 12-lead electrocardiograms (ECGs) using a dataset comprised of over 40,000 ECGs, with labels derived from cardiologist clinical interpretations. Since many clinically important classes can occur in low frequencies, approaches are needed to improve performance on rare classes. We compare the performance of several single-class classifiers on rare classes to a multi-headed classifier across all available classes. We demonstrate that the addition of common classes can significantly improve CNN performance on rarer classes when compared to a model trained on the rarer class in isolation. Using this method, we develop a model with high performance as measured by F1 score on multiple clinically relevant classes compared against the gold-standard cardiologist interpretation.
translated by 谷歌翻译
用于图像语义分割的深度学习模型需要大量数据。在医学成像领域,获取足够的数据是非常重要的挑战。标记医学图像数据需要专业知识。各机构之间的协作可以解决这一挑战,但是向一个集中位置分享医疗数据会面临各种法律,隐私,技术和数据所有权方面的挑战,特别是在国际机构中。在本研究中,我们首次使用联合学习机构多机构协作,在不共享患者数据的情况下实现深度学习建模。我们的定量结果表明联合语义分段模型(Dice = 0.852)在多模式脑机上的表现类似于通过共享数据训练的模型(Dice = 0.862)。我们将联合学习与两种可选的协作学习方法进行比较,发现它们无法与联邦学习的性能相匹配。
translated by 谷歌翻译
我们开发了一种卷积神经网络(CNN),它可以首次对液氩时间投影室(LArTPC)记录的图像数据中的物体进行像素级预测。我们描述了为培训该网络而开发的网络设计,培训技术和软件工具。这项工作的目的是为MicroBooNE探测器开发一个完整的基于深度神经网络的数据构建链。我们使用MicroBooNEcollection平面图像显示网络在实际LArTPC数据上的有效性的第一次演示。演示用于停止μ子和$ \ nu_ \ mu $充电电流中性π介数数据样本。
translated by 谷歌翻译
使用卷积神经网络(CNN)对X射线诊断疾病的早期结果一直很有希望,但尚未表明,来自一家医院或一组医院的X射线模型将在不同医院同样适用。在将这些工具用于实际临床环境中的计算机辅助诊断之前,我们必须验证它们在各种医院系统中进行扩展的能力。横断面设计用于训练和评估来自NIH(来自30,805名患者的n = 112,120),西奈山(来自12,904名患者的42,396名)和印第安纳(来自3,683名患者的n = 3,807)的158,323例胸部X射线上的CNN的肺炎筛查。在3/5的自然比较中,来自外部医院的胸部X射线的表现明显低于来自原始医院系统的X射线.CNN能够检测到X射线的获取位置(医​​院系统,医院部门)因此,CNN在诊断X射线疾病方面的表现不仅可以反映他们识别X射线疾病特异性成像结果的能力,还可以反映出利用混杂信息的能力。基于用于模型训练的医院系统的测试数据估计CNN表现可能会夸大其可能的实际表现。
translated by 谷歌翻译
对面孔感兴趣的科学领域已经开发了他们自己的概念和程序集,用于理解目标模型系统(无论是人或算法)如何在不同条件下感知面部。在计算机视觉中,这主要是以识别任务的数据集评估的形式,其中汇总统计用于衡量进展。虽然综合绩效持续提高,但是理解个人失败的原因一直很困难,因为并不总是清楚为什么某个特定的面孔无法被识别,或者为什么冒名顶替者被算法认可。重要的是,研究视力的其他领域通过使用视觉心理物理学:对刺激的控制操作和仔细研究它们在模型系统中引起的反应。在本文中,我们建议视觉心理物理学是一种可行的方法,使面部识别算法更容易解释。开发了一套全面的程序,用于识别人脸识别算法的行为,然后部署了过度的现有卷积神经网络和更基本但仍然广泛使用的浅层和手工制作的基于特征的方法。
translated by 谷歌翻译
通过提供大量数据和标准化评估协议,计算机视觉中的数据集有助于推动视觉识别领域的进步。但即使在最近的基准测试中取得突破性成果,我们仍然可以公平地询问我们的识别算法是否与我们认为的一样。视觉科学广泛利用被称为视觉心理物理学的各种评估机制来研究视觉感知。心理物理学是对受控刺激与他们引发实验性测试对象的行为反应之间关系的定量检查。而不是使用汇总统计来衡量绩效,心理物理学指导我们构建由个体刺激响应构成的项目 - 响应曲线以找到感知阈值,从而允许人们识别受试者不再能够可靠地识别刺激类别的确切点。在本文中,我们介绍了一个由该方法支持的视觉识别模型的综合评估框架。在数百万个程序渲染的3D场景和2D图像中,我们比较了众所周知的卷积神经网络的性能。我们的结果引发了人们对类似人类表现的近期主张,并为纠正新出现的算法缺陷提供了前进的道路。
translated by 谷歌翻译
利用观测到的流体压力和速率的瞬态数据来校准储层模型是获得地球地下流动和运移行为的预测模型的关键任务。模型校准任务,通常称为“历史匹配”,可以形式化为不适定的反问题,其中我们的目标是找到解释观察到的动态数据的岩石物理特性的基础空间分布。我们使用在地质统计学基于对象的模型上预训练的年龄对抗网络来表示烃类储层合成模型的岩石属性分布。使用瞬态两相不可压缩达西公式来模拟储层流体的动态行为。通过首先使用预先训练的生成模型对属性分布进行建模,然后使用前向问题的相邻方程对控制生成模型输出的潜变量进行梯度下降,对基础储层性质进行转换。除了动态观测数据外,我们还通过引入额外的目标函数来包括岩石类型的约束。我们的贡献表明,对于一个综合测试案例,我们能够通过优化深度生成模型的潜变量空间来获得逆问题的解,给出一组非线性前向问题的瞬态观察。
translated by 谷歌翻译
Hessian矩阵在各种不同的领域中具有许多重要的应用,例如优化,图像处理和统计。在本文中,我们将重点放在使用Python脚本语言和TensorFlow库在深度学习环境中有效计算Hessianmatrices的实际方面。
translated by 谷歌翻译
执法部门或大众媒体机构经常需要面对隐瞒提供隐私保护。共享敏感内容,其中遮蔽或减少技术可能未能完全消除所有可识别的痕迹,可能导致危及生命的后果。因此,能够系统地测量给定技术的面部遮蔽性能是至关重要的。在本文中,我们建议测量三种模拟技术的有效性:高斯模糊,中值模糊和像素化。通过在两种情况下识别编辑的面部来进行编辑:将遮蔽的面部分类为一组身份,并将遮蔽的面部与清晰面部的相似性进行比较。威胁建模还被认为是为每种研究的遮蔽技术提供漏洞分析。基于ourevaluation,我们表明基于像素化的面部遮蔽方法是最有效的。
translated by 谷歌翻译