我们探索人工神经网络作为从虚构时间格林函数重建光谱函数的工具,这是一个经典条件反问题。我们的ansatz基于有监督的学习框架,其中先验知识在训练数据中被编码,并且逆变换流形通过神经网络被明确地参数化。我们系统地研究了这种新的重建方法,提供了对其在物理动机模拟数据上的表现的详细分析,并将其与已建立的贝叶斯推理方法进行了比较。发现构造精度至少是可比较的,并且特别是在较大的噪声水平下可能是优越的。我们认为,在监督环境中使用标记的训练数据和确定优化目标的自由度是本方法的固有优势,并且可能导致对未来最先进方法的重大改进。进一步研究的潜在方向是详细讨论。
translated by 谷歌翻译
我们提出了一种基于深度学习和集合理论的新技术,它具有出色的分类和预测结果。通过访问足够大量的标记训练数据,即使训练数据与测试数据完全无关,我们的方法也能够几乎始终预测测试数据的标签。换句话说,我们在非特定设置中证明,只要有一个人可以访问足够的数据点,数据的质量就无关紧要了。
translated by 谷歌翻译
在这里,我们介绍DIVE:数据驱动的顶点演化推理。 DIVE是一种基于图像的疾病进展模型,具有单顶点分辨率,旨在从短期纵向数据集重建脑病理学的长期模式。 DIVE聚集在患者人群中具有相似时间动态的皮质表面上的顶点生物标记物测量,并且同时估计每个聚类中的顶点测量的平均轨迹。 DIVE独特地将一个分区输出到具有共同进展模式的区域,从而为个体疾病带来新的签名。潜水进一步估计每个受试者每次就诊的疾病阶段和进展速度,可能增强临床试验或管理的分层。在模拟数据上,如果平均轨迹在群集之间充分不同,则DIVE可以恢复地面真实群及其潜在轨迹。我们对来自两个队列的数据进行了潜水:阿尔茨海默氏病神经影像学研究(ADNI)和英国老年痴呆症研究中心(DRC),其中包括患有后皮质萎缩(PCA)的患者以及典型的阿尔茨海默氏病(tAD)。 DIVE在两个独立数据集(ADNI和DRC)中发现tAD受试者萎缩的类似空间模式,并进一步揭示不同疾病(tAD与PCA)和不同类型生物标志物数据的不同病理模式:来自磁共振成像(MRI)的皮质厚度来自正电子发射断层扫描(PET)的抗淀粉样蛋白负荷。最后,DIVE可以用于估计大脑中病理学的细粒度空间分布,使用任何类型的体素或顶点测量,包括雅可比压缩图,来自扩散成像的分数各向异性(FA)图或其他PET测量。 DIVE源代码可在线获取:https://github.com/mrazvan22/dive
translated by 谷歌翻译
我们介绍了疾病知识转移(DKT),这是一种在相关神经退行性疾病之间转移生物标志物信息的新技术。即使只有有限的单峰数据可用,DKT也可以通过转移来自常见神经退行性疾病的较大多模式数据集的信息,在罕见的神经退行性疾病中推断出稳健的多模式生物标志物轨迹。 DKT是生物标志物进展的联合疾病生成模型,其利用跨疾病共享的生物标志物关系。与目前的深度学习方法相比,DKT是可解释的,它允许理解潜在的疾病机制。在这里,我们展示了DKT onAlzheimer's disease(AD)变体及其在后皮质萎缩(PCA)中预测多模态生物标志物的轨迹的能力,缺乏来自PCA受试者的此类数据。为此,我们在包含两个不同疾病和大小数据的主题的组合数据集上训练DKT:1)来自TADPOLE挑战的更大的多模式典型AD(tAD)数据集,以及2)来自更小的单峰后部皮质萎缩(PCA)数据集英国痴呆症研究中心(DRC),其中只有有限数量的磁共振成像(MRI)扫描。我们首先表明DKT估计PCA中可能的多模轨迹与先前的文献一致。我们在两种情况下进一步验证DKT:(1)合成数据,显示它可以准确估计地面实况参数;(2)来自对照和PCA患者的20次DTI扫描,表明它与标准方法相比具有良好的预测性能。虽然我们展示了DKT onAlzheimer的变异,但我们注意到DKT对于其他形式的相关神经退行性疾病是普遍存在的。 DKT的源代码可在线获取:https://github.com/mrazvan22/dkt。
translated by 谷歌翻译
机器学习(ML),人工智能(AI)和其他现代统计方法为操作以前未开发和快速增长的数据来源提供了新的机会,以便患者受益。虽然目前正在进行许多有前景的研究,但整个文学缺乏:透明度;明确报告以促进复制;探索潜在的道德问题;并且,明确有效的演示。造成这些问题的原因有很多,但我们提供初步解决方案的最重要原因之一是目前缺乏针对ML / AI的最佳实践指南。尽管最佳实践在这一领域的看法尚未达成共识,但我们认为,在开展健康领域的ML / AI研究和影响项目的跨学科团体将从回答基于开展此类工作时存在的重要问题的一系列问题中受益。在这里,我们提出了涵盖整个项目生命周期的20个问题,从理论,数据分析和模型评估到实施,作为促进项目规划和事后(结构化)独立评估的平均值。通过开始在不同的环境中回答这些问题,我们可以开始理解什么是一个好的答案,并且我们希望所得到的讨论对于制定一个国际共识框架来进行透明,可复制,道德和有效的人工智能研究(AI-TREE)是至关重要的。为了健康。
translated by 谷歌翻译
光诱导过程本质上是基本的,但精确的模拟受到基础量子化学计算成本的严重限制,妨碍了它们在长时间尺度上的应用。在这里,我们介绍了一种基于机器学习的方法,以克服这个瓶颈,在纳秒时间尺度上可以实现精确的光动力学,这是当代方法无法实现的。在分子动力学模拟过程中,我们使用深度神经网络而不是昂贵的量子化学,从而容忍分子几何与其高维电子特性之间的关系。作为一个例子,主题甲基铵阳离子的时间演变为1纳秒用于证明机器学习算法在提供相同的准确性时可以胜过标准激发态分子动力学方法的计算效率。
translated by 谷歌翻译
人体表面的统计模型通常从预定义姿势的数千个高质量3D扫描中学习,以覆盖人体形状和关节的多种多样。获取此类数据需要昂贵的设备,校准程序,并且有限的技术人员可以理解并遵循指示,例如成人。我们提出了一种从不完全,低质量的自由活动婴儿的RGB-D序列学习统计3D皮肤多婴儿线性身体模型(SMIL)的方法。定量实验表明,SMIL忠实地代表了RGB-D数据,并恰当地分析了婴儿的形状和姿势。 Todemonstrate SMIL的适用性,我们将模型拟合到RGB-D序列的移动婴儿,并通过案例研究显示,我们的方法捕获了一般运动评估(GMA)的运动细节,这是一种用于早期发现神经发育的临床实践的方法紊乱的婴儿。 SMIL提供了一种分析婴儿形状和运动的新工具,是迈向GMA自动化系统的一步。
translated by 谷歌翻译
统计形态学信号通常通过完全监督的类型级数据进行训练。剩下的一个开放性研究问题如下:我们如何有效地利用原始的令牌级数据来提高其性能?为此,我们引入了一种新的生成潜变量模型,用于拐点生成的半监督学习。为了能够对潜在变量进行后验推断,我们基于唤醒 - 睡眠算法推导出一种有效的变分推理过程。我们使用Universal Dependencies语料库在模拟的低资源设置下对23种语言进行了实验,并发现在某些情况下提高了10%以上的绝对准确度。
translated by 谷歌翻译
对于应用于不同语言的一般建模方法,一个自然的问题是:我们应该期望我们的模型能够处理具有不同语言轮廓的语言?在这项工作中,我们开发了一个评估框架,用于语言模型的公平交叉语言比较,使用翻译文本,以便要求所有模型预测大致相同的信息。然后,我们对21种语言进行了一项研究,证明在某些语言中,使用$ n $ -gramand LSTM语言模型更难预测信息的文本表达。我们展示复杂的屈折形态是导致语言之间性能差异的原因。
translated by 谷歌翻译
词汇歧义使得难以计算语料库的各种有用统计数据。给定的单词形式可能代表几种形态特征包中的任何一种。然而,可以使用无监督学习(如在EM中)来拟合概率地消除词形式歧义的模型。我们提出了这样一种方法,它采用神经网络来平滑地模拟先前的分布特征包(甚至是罕见的特征包)。虽然这个基本模型不考虑令牌的上下文,但是这个属性允许它在unigram类型计数的简单列表上操作,在该unigram的不同分析之间划分每个计数。我们讨论了这项新任务的评估指标,并报告了5种语言的结果。
translated by 谷歌翻译