我们提出了一种基于注意力的方法,该方法将局部图像特征聚合到主题级表示以预测疾病严重性。与需要固定维度输入的经典深度学习相比,我们的方法在一组图像补丁上运行;因此它可以容纳可变长度输入图像而无需调整图像大小。该模型学习临床解释的主题水平表示,反映疾病的严重程度。我们的模型由三个相互依赖的模块组成,这些模块相互调节:(1)一个辨别网络,它从局部特征中学习固定长度的表示,并将它们映射到疾病严重程度; (2)通过关注对预测任务贡献最大的解剖学区域来提供可解释性的注意机制; (3)生成网络可以促进当地潜在特征的多样性。生成的关键是注意力量是非退化的,同时保持局部区域与疾病严重程度的相关性。我们在慢性阻塞性肺病(COPD)的大规模肺CT研究中训练我们的模式到终点。我们的模型为预测COPD严重程度的临床指标提供了最先进的性能。注意力的分布提供了肺组织与临床测量的区域相关性。
translated by 谷歌翻译
Vossian Antonomasia是一种多产的风格设备,自古以来就在使用。它可以将人或其他名称的引入或描述压缩成简洁,尖锐的配方,最好用一个例子来解释:当挪威世界冠军马格努斯卡尔森被描述为“国际象棋的莫扎特“,这是我们正在处理的Vossian Antonomasia。模式简单:源(莫扎特)用于描述目标(马格努斯卡尔森),通过修饰符(“国际象棋”)达到意义转移。之前已经讨论过这种现象(作为“隐喻性的antonomasia”,或者特别关注源对象,作为“paragons”),但尚未开发出基于语料库的方法来探索其广度和多样性。我们正在研究一个完整的文本报纸语料库(纽约时报,1987-2007),并描述了一种基于维基数据库自动提取Vossian Antonomasia的新方法。我们的分析提供了对热门对象的发生及其分布的新见解。
translated by 谷歌翻译
进化算法已被广泛用于一系列随机优化问题。在大多数研究中,目标是优化解决方案的预期质量。受约束性违反具有极大破坏性影响的现实问题的启发,我们考虑了背包问题的一种变体,即利用最大$ $ alpha $的小概率违反背包容量限制的约束下利润最大化。这个问题被称为机会约束的背包问题,而且机会约束优化问题迄今为止在进化计算文献中很少受到关注。我们展示了如何在通过进化算法解决这些问题时使用流行的偏差等值,如Chebyshev不等式和Chernoff边界作为解决方案评估的一部分,并将我们的算法的有效性与广泛的机会约束背包实例进行比较。
translated by 谷歌翻译
利用神经网络将话语映射到距离反映说话者之间的相似性的空间的说话人嵌入模型驱动了说话人识别任务中的最近进展。然而,在识别训练组中的发言者与非感知者之间仍然存在显着的性能差距。后一种情况对应于几次学习任务,其中在看不见的类上评估了训练模型。在这里,我们优化了具有原型网络丢失(PNL)的Speakerembedding模型,这是一种针对少数镜头图像分类任务的最先进方法。由此产生的嵌入模型在视频和非传感器方面均优于基于三元组损耗的模型,无论是扬声器验证还是识别任务。
translated by 谷歌翻译
Ising模型描述了二元特征变量向量的联合概率分布。通常,并非所有变量都相互影响,并且人们对学习相互作用变量的可能稀疏网络结构感兴趣。但是,在存在潜在变量的情况下,学习稀疏模型的常规方法可能会失败。这是因为相关变量引起观察变量的间接相互作用。在仅有少数潜在条件高斯变量的情况下,这些伪相互作用为观察到的Ising模型的相互作用参数贡献了额外的低秩分量。因此,我们建议使用凸规则化似然问题来学习Ising模型参数的稀疏+低秩分解。我们表明,同样的问题可以通过新型弛豫的最大熵问题的对偶获得,其中样本意味着总共需要匹配期望值仅达到agiven容差。凸优化问题的解决方案在高维设置中具有一致性属性,其中允许的二元变量的数量和潜在条件高斯变量的数量被允许随着训练样本的数量而增长。
translated by 谷歌翻译
目的:评估基于深度学习的高分辨率合成CT生成的可行性,从下臂的MRI扫描进行矫形应用。方法:训练条件生成性对抗网络从多回波MR图像合成CT图像。获得了9个离体下臂的MRI和CT扫描训练集,并将CT图像记录在MRI图像上。应用三重交叉验证以生成整个数据集的独立结果。合成CT图像用平均绝对误差度量和骰子相似度和皮质骨分割的表面距离进行定量评估。结果:总体组织体积的平均绝对误差为63.5HU,皮质骨的平均绝对误差为144.2HU。皮质骨分割的平均Dice相似性为0.86。骨与实验CT之间的平均表面与表面之间的距离为0.48mm。定性地,合成CT图像与实际CT扫描相对应,并且在骨小梁中部分维持高分辨率结构。合成CT图像上的骨分割显示肌腱有一些假阳性,但骨的一般形状被精确重建。结论:本研究表明,可以从下臂的MRI扫描中生成高质量的合成CT。骨骼分割的良好对应性表明,合成CT可以与依赖于这种分割的真实CT应用竞争,例如规划骨科手术和3D打印。
translated by 谷歌翻译
我们提出了一种在线算法,该算法使用梯度信息作为监督来源来诱导决策树。与先前基于梯度的树学习的方法相比,我们不需要软切换或为每次更新构造新树。在实验中,我们的方法执行比较标准的增量分类树,并且优于现有的增量回归树。我们还展示了如何使用该方法来构建适合于从表格数据中学习表示的新型神经网络层,并发现它提高了多类别和多标签分类的准确性。
translated by 谷歌翻译
The traditional Minkowski distances are induced by the corresponding Minkowski norms in real-valued vector spaces. In this work, we propose novel statistical symmetric distances based on the Minkowski's inequality for probability densities belonging to Lebesgue spaces. These statistical Minkowski distances admit closed-form formula for Gaussian mixture models when parameterized by integer exponents. This result extends to arbitrary mixtures of exponential families with natural parameter spaces being cones: This includes the binomial, the multinomial, the zero-centered Laplacian, the Gaussian and the Wishart mixtures, among others. We also derive a Minkowski's diversity index of a normalized weighted set of probability distributions from Minkowski's inequality.
translated by 谷歌翻译
在本文中,我们提出了一种在序列到序列的神经文本到语音(TTS)综合框架下的特征强化方法。所提出的方法利用多输入编码器来获取三级文本信息,即音素序列,预训练词嵌入和来自解析器的句子的语法结构作为神经TTS系统的输入特征。添加的单词和句子级别信息可以作为基于特征的预训练策略来查看,这明显增强了模型的概括化能力。所提出的方法不仅显着提高了系统的鲁棒性,而且在我们的域外文本实验中也提高了合成语音到接近记录的质量。
translated by 谷歌翻译
设计RNA分子最近引起了人们对医学,合成生物学,生物技术和生物信息学的兴趣,因为许多功能性RNA分子被证明参与转录,表观遗传学和翻译的调控过程。由于RNA的功能取决于其结构特性,因此RNA设计问题是找到折叠成指定二级结构的RNA序列。在这里,我们提出了一个新的RNADesign问题算法,称为LEARNA。 LEARNA使用深度强化学习traina政策网络,依次设计一个完整的RNA序列作为指定的二级目标结构。通过在20个核心上跨越8000个不同的靶标结构进行元学习一小时,我们的扩展Meta-LEARNA构建了一个RNA设计策略,可以开箱即用于溶剂化RNA靶标结构。在方法论上,对于我们认为是第一次,我们共同优化政策网络的丰富的神经架构空间,培训程序的超参数和决策过程的制定。关于二次使用的RNA二级结构设计基准的综合实证结果,以及我们介绍的第三个基准,表明我们的方法在所有基准上实现了新的最先进的性能,同时在达到之前的状态时也更快地达到了数量级 - 最先进的表现。在消融研究中,我们分析了我们方法的不同组成部分的重要性。
translated by 谷歌翻译