在线检测数据序列的生成过程中的瞬时变化通常集中在这些变化点的回顾性推断上,而不考虑它们将来的发生。我们扩展贝叶斯在线变换点检测算法以推断直到下一个变化点(即剩余时间)的时间步数。这使我们能够处理依赖于总段持续时间的观察模型,这是使用具有时间缩放的模型数据序列。另外,我们通过删除i.i.d来扩展模型。对观测模型参数的假设。用于分段检测的结果推理算法可以以在线方式部署,并且我们将合成和两个医学真实世界数据集的应用说明。
translated by 谷歌翻译
In recent years, the interest in unsupervised learning of disentangled representations has significantly increased. The key assumption is that real-world data is generated by a few explanatory factors of variation and that these factors can be recovered by unsupervised learning algorithms. A large number of unsupervised learning approaches based on auto-encoding and quantitative evaluation metrics of disentanglement have been proposed; yet, the efficacy of the proposed approaches and utility of proposed notions of disentanglement has not been challenged in prior work. In this paper, we provide a sober look on recent progress in the field and challenge some common assumptions. We first theoretically show that the unsupervised learning of disentangled representations is fundamentally impossible without inductive biases on both the models and the data. Then, we train more than 12 000 models covering the six most prominent methods, and evaluate them across six disentanglement metrics in a reproducible large-scale experimental study on seven different data sets. On the positive side, we observe that different methods successfully enforce properties "encouraged" by the corresponding losses. On the negative side, we observe in our study that well-disentangled models seemingly cannot be identified without access to ground-truth labels even if we are allowed to transfer hyperparameters across data sets. Furthermore, increased disentanglement does not seem to lead to a decreased sample complexity of learning for downstream tasks. These results suggest that future work on disentanglement learning should be explicit about the role of induc-tive biases and (implicit) supervision, investigate concrete benefits of enforcing disentanglement of the learned representations, and consider a reproducible experimental setup covering several data sets.
translated by 谷歌翻译
胶质瘤是最常见的原发性脑恶性肿瘤,具有不同程度的侵袭性,可变预后和各种异质性组织亚区域,即肿瘤周围水肿/侵入组织,坏死核心,活性和非增强核心。这种内在的异质性也被用于它们的放射性表型,因为它们的子区域通过在多参数磁共振成像(mpMRI)扫描中传播的不同强度分布来描绘,反映了不同的生物学特性。它们的异质形状,范围和位置是其中的一部分。使这些肿瘤难以切除的因素,在某些情况下无法手术。切除肿瘤的数量也是纵向扫描中考虑的一个因素,用于评估表观肿瘤以进行潜在的进展诊断。此外,有越来越多的证据表明,各种肿瘤亚区域的准确分割可以为定量图像分析提供预测患者整体的基础。生存。该研究评估了在国际脑肿瘤分割(BraTS)挑战的最后七个实例(即2012-2018)期间用于mpMRI扫描中的脑肿瘤图像分析的最先进的机器学习(ML)方法。具体而言,我们专注于i)评估术前mpMRI扫描中各种神经胶质瘤亚区的分割,ii)通过肿瘤亚区的纵向生长评估潜在的肿瘤进展,超出RECIST标准的使用,以及iii)预测整体术前mpMRI扫描对经历完全切除的患者的生存率。最后,我们研究了为每个任务确定最佳ML算法的挑战,考虑到除了在每个挑战实例上多样化之外,多机构mpMRI BraTS数据集也是一个不断发展/不断发展的数据集。
translated by 谷歌翻译
学习解开高维,非结构化数据变异的基础知识的解缠结表示的能力对于数据有效和强大地使用神经网络具有重要意义。最近提出了针对这一目标的各种方法 - 验证现有工作是指导进一步发展的关键任务。先前的验证方法侧重于生成因素和学习特征之间的共享信息。然而,罕见事件或来自多种因素的累积影响对编码的影响仍未被捕获。 Ourexperiments表明,这已经在一个简单的噪声自由基因中变得明显。这就是我们引入介入稳健性评分的原因,该评分提供了对生成因子的干预性和改变滋扰因素的学习表征的稳健性的定量评估。我们展示了如何从标记的观察数据中估计这个分数,这可能是混淆的,并且进一步提供了一种在数据集大小中线性缩放的有效算法。我们的因果激励框架的好处在广泛的实验中得到了说明。
translated by 谷歌翻译
在自然科学中,微分方程被广泛用于描述动力系统。从数据中发现和验证此类模型已成为当今科学的基本挑战。从统计的角度来看,我们区分了两个问题:参数估计和结构搜索。在参数估计中,我们从给定的微分方程开始,估计在离散时间点观察到的噪声数据中的参数。估计非线性地取决于参数。这带来了统计和计算方面的挑战,使得结构搜索的任务变得更加雄心勃勃。现有方法使用标准模型选择技术或各种类型的稀疏强制正则化,因此专注于预测性能。在这项工作中,我们开发了用于常微分方程模型中的结构搜索的新方法。利用因果推理开发思想,我们建议不仅通过预测性能对模型进行排名,还考虑稳定性,即在不同的实验环境中对其能力进行良好预测。基于该模型排序,我们还构建了反映因果重要性的个体变量排名。它为研究人员提供了一系列有希望的候选变量,可以在介入实验中进一步研究。我们的排名方法(模型和变量)都带有理论渐近保证,并且基于对模拟数据的广泛实验评估,其表现优于当前最先进的方法。在尚未公布的生物数据集上说明了程序的实际适用性。我们的方法学已全面实施。代码将在线提供,也可作为R包提供。
translated by 谷歌翻译
我们介绍一种方法,使复现动力学模型能够在时间上抽象。我们称之为自适应跳过间隔(ASI)的方法基于以下观察:在许多顺序预测任务中,事件发生的确切时间与基本目标无关。此外,在许多情况下,存在预测间隔,其导致特别容易预测的转变。我们表明,通过允许模型以可选择的采样率进行预测,我们可以获得预测任务,从而获得计算效率和预测精度。
translated by 谷歌翻译
许多视觉和语言模型都受到视觉基础差的影响 - 往往是简单易学的语言先验,而不是将语言与视觉概念联系起来。在这项工作中,我们提出了一个通用框架,它呼吁人类重要性感知网络调整(HINT),有效地利用人工监督来改善视觉基础。提示限制深度网络对与人类相同的输入区域敏感。至关重要的是,我们的方法优化了人类注意力图和基于梯度的网络重要性之间的一致性 - 确保模型不仅要学习,而且还要依赖人类在进行预测时发现与任务相关的视觉概念。我们展示了我们对视觉问题回答和Image Captioningtasks,实现VQA-CP数据集的最新技术,该数据集惩罚过度依赖语言先验。
translated by 谷歌翻译
我们提出了一种GAN设计,它可以有效地模拟多个分布,并发现它们的共性和特殊性。每个数据分布都使用$ K $生成器分布的混合进行建模。由于生成器在不同真实数据分布的建模之间共享,因此共享的捕获分布的共性,而非共享的捕获它们的独特方面。我们展示了我们的方法在各种数据集(MNIST,Fashion MNIST,CIFAR-10,Omniglot,CelebA)上的有效性,并且具有令人瞩目的结果。
translated by 谷歌翻译
癫痫发作类型的准确分类在癫痫患者的治疗和疾病管理中起着至关重要的作用。癫痫发作类型不仅影响药物的选择,而且还影响患者可以安全参与的活动范围。随着人工智能的最新进展使得自动发作检测成为可能,下一步是癫痫发作类型的自动分类。在这篇文章中,我们进行了第一项研究,探讨机器学习算法在多类癫痫发作类型分类中的应用。我们使用了最近发布的TUH EEG Seizure Corpus并进行了彻底的搜索空间探索,以评估各种预处理技术,机器学习算法和相应的高参数组合在此任务中的性能。我们证明我们的算法可以达到高达0.907的加权F1分数,从而为基于头皮EEG的多级癫痫发作类型分类设定了第一个基准。
translated by 谷歌翻译
我们提出了第一种基于条件生成对抗网络(cGAN)的3D点云到图像转换的方法。该模型处理来自不同域的多模态信息源,即原始点集和图像。生成器能够处理三个条件,而点云被编码为原始点集和相机投影。 imagebackground补丁用作约束来偏置环境纹理。生成器内的全局近似函数直接应用于点云(Point-Net)。因此,代表性学习模型直接在潜在特征空间中结合全局3D特征。条件用于偏置背景和所生成图像的视点。这开辟了增强或纹理化3D数据的新方法,以瞄准生成个人图像。我们成功地在Kitti andSunRGBD数据集上评估了我们的方法,并获得了出色的物体检测初始分数。
translated by 谷歌翻译