在这项工作中,我们报告了结合IEEE国际生物医学成像研讨会(ISBI)2016和国际医学影像计算机辅助干预会议(MICCAI)2017年组织的肝肿瘤分割基准(LITS)的设置和结果。将24种有效的最先进的肝脏和肝脏肿瘤分段算法应用于一组131个计算机断层扫描(CT)体积,具有不同类型的肿瘤对比度水平(高强度/低强度),组织异常(转移瘤)大小和不同程度的病变。已提交的算法已在70个未公开的卷上进行了测试。该数据集是与七家医院和研究机构合作创建的,由三位独立的放射科医师手动审查。我们发现没有一种算法对肝脏和肿瘤表现最佳。最佳肝脏分割算法的Dice评分为0.96(MICCAI),而对于肿瘤分割,最佳算法评估为0.67(ISBI)和0.70(MICCAI)。 LITS图像数据和手动注释继续通过在线评估系统公开提供,作为持续的基准测试资源。
translated by 谷歌翻译
Robust localisation and identification of vertebrae is essential for automated spine analysis. The contribution of this work to the task is twofold: (1) Inspired by the human expert, we hypothesise that a sagittal and coronal reformation of the spine contain sufficient information for labelling the vertebrae. Thereby, we propose a butterfly-shaped network architecture (termed Btrfly Net) that efficiently combines the information across reformations. (2) Underpinning the Btrfly net, we present an energy-based adversarial training regime that encodes local spine structure as an anatomical prior into the network, thereby enabling it to achieve state-of-art performance in all standard metrics on a benchmark dataset of 302 scans without any post-processing during inference.
translated by 谷歌翻译
肝脏及其病变的自动分割是获得用于精确临床诊断和计算机辅助决策支持系统的定量生物标志物的重要步骤。本文提出了一种利用级联卷积神经网络(CFCN)和密集的三维条件随机场(CRF)自动分割CT腹部图像中的肝脏和病变的方法。我们训练和级联两个FCN,用于肝脏及其病变的组合分割。在第一步中,我们训练FCN来分割第二个FCN的liveras ROI输入。第二个FCN仅从步骤1的预测肝脏ROI中分割出病变。我们使用腺苷三维CRF来细化CFCN的分割,其同时考虑空间相干性和外观。 CFCN模型在包括15个肝肿瘤体积的腹部CT数据集3DIRCAD上进行2倍交叉验证训练。我们的研究结果表明,基于CFCN的语义肝脏和病变分割实现肝脏的Dice评分超过94%,计算时间低于每体积100s。我们通过实验证明了该方法作为一种决策支持系统的鲁棒性,该系统具有高精度和高速度,可用于日常临床常规。
translated by 谷歌翻译
机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
像POMCP这样的部分可观察规划的最先进方法是基于随机树搜索。虽然这些方法在计算上是有效的,但它们仍然可以构建相当大的搜索树,这可能由于受限的存储器资源而限制性能。在本文中,我们提出了部分可观察的堆叠汤普森采样(POSTS),这是一种在大型POMDP中进行开环规划的记忆有限方法,可优化Thompson采样强盗的固定堆栈。我们在四大基准问题中对POSTS进行实证评估,并将其性能与不同的基于树的方法进行比较。我们表明,与基于totree的开环规划相比,POSTS实现了竞争性能,并提供了性能 - 内存权衡,适用于具有高度受限的计算和内存资源的部分可观察规划。
translated by 谷歌翻译
我们提出了最先进的自动语音识别(ASR)系统,采用标准的混合DNN \ / HMM架构,与LibriSpeech任务的基于解释的编码器 - 解码器设计相比。为系统架构提供了系统开发的详细描述,包括模型设计,预训练方案,训练计划和优化方法。混合DNN / HMM和基于注意力的系统都采用双向LSTM进行声学建模/编码。对于语言建模,我们使用LSTM和基于Transformer的架构。我们所有的系统都是使用RWTH开源工具包RASR和RETURNN构建的。根据作者的最佳知识,在完整的LibriSpeech培训集上进行培训时获得的结果是目前最好的,对于混合DNN / HMM和基于注意的系统而言。我们的单一混合系统甚至优于以前从八个单一系统组合中获得的结果。我们的比较显示,在LibriSpeech 960h任务中,混合DNN / HMM系统在干净度方面优于基于注意力的系统15%,在其他测试集上在字错误率方面优于40%。此外,LibriSpeech培训语料库中减少的100h子集的实验甚至在混合DNN / HMM和基于注意力的体系结构之间显示出更明显的差异。
translated by 谷歌翻译
新一代的多核处理器正在崛起,它在芯片上提供了数十个甚至更多的内核,从某种意义上说,它融合了主处理器和加速器。在本文中,我们针对这些机器上的广义线性模型的有效训练。我们提出了一种实现并行性的新方法,我们在均匀核心(HTHC)上调用异构任务。它将问题分为多个根本不同的任务,这些任务本身是并行化的。为了评估,我们在最近的72核Knights Landing处理器上设计了一个详细的,体系结构认知的方案实现,该处理器适应缓存,内存和核心结构。具有不同数据集的Lasso和SVM的实验显示,与C ++中的直接并行实现相比,加速通常为一个数量级。
translated by 谷歌翻译
最近,用于语音识别的端到端序列到序列模型已经引起了研究界的极大兴趣。虽然以前的架构选择围绕延时神经网络(TDNN)和长期记忆(LSTM)递归神经网络,但我们建议通过Transformer架构作为替代方案来引起自我关注。我们的分析表明,具有高学习能力的深层变压器网络能够超越先前的端到端方法,甚至与传统的混合系统相匹配。此外,我们培训了非常深的模型,其中包含多达48个变压器层,用于编码器和解码器以及随机残余连接,这极大地提高了通用性和培训效率。由此产生的模型在Switchboard基准测试中优于所有先前的端到端ASR方法。这些模型的集合分别在Switchboard和CallHome测试集上实现了9.9%和17.7%的WER。这一发现使我们的端到端模型与之前的混合动力系统达到了竞争水平。此外,通过模型集成,变形金刚可以胜过某些混合系统,这在系统结构和训练过程方面都比较复杂。
translated by 谷歌翻译
目的:最近,进行了几次尝试将深度学习转移到医学图像重建。越来越多的出版物遵循将CT重建作为已知算子嵌入到神经网络中的概念。然而,所提出的大多数方法缺乏完全集成到深度学习环境中的有效CT重构框架。因此,许多方法被迫使用变通方法来解决数学上可解决的问题。方法:PYRO-NN是一个通用的框架,将已知的操作员引入普遍的深度学习框架Tensorflow。目前的状态包括最先进的并行,扇形和锥形投影仪以及通过CUDA加速作为Tensorflowlayers加速的反投影仪。最重要的是,该框架提供了一个高级Python API,可以利用来自真实CT系统的数据进行FBP和迭代重建实验。结果:该框架为集成CT重建算法的设计到终端神经网络管道提供了所有必要的算法和工具。高级Python API允许简单地使用Tensorflow中提出的层。为了证明这些层的功能,框架结合了三个基线实验,显示了锥形束短扫描FDD重建,CT重建滤波器学习设置和TVregularized迭代重建。所有算法和工具都参考科学出版物,并与现有的非深度学习重构框架进行比较。该框架以开源软件\ url {https://github.com/csyben/PYRO-NN}的形式提供。结论:PYRO-NN具有普遍的深度学习框架Tensorflow,允许在医学图像重建环境中建立端到端的可训练神经网络。 Webelieve认为该框架将是迈向可重复研究的一步
translated by 谷歌翻译
临床研究人员使用疾病进展建模算法来预测未来患者状态并表征进展模式。用于疾病进展建模的一种方法是使用少数状态描述患者状态,所述状态代表一组观察到的测量值的独特分布。隐马尔可夫模型(HMM)及其变体是一类模型,既可以发现这些状态,也可以预测新患者的未来状态。可以使用来自大规模队列研究,临床试验和电子健康记录的主题的纵向观察来训练HMM。尽管使用算法发现感兴趣的模式具有优势,但对于医学专家来说,解释模型输出,复杂的建模参数以及在临床上理解模式仍然具有挑战性。为了解决这个问题,我们与医学家​​,统计学家和可视化专家进行了一项设计研究,旨在研究某些慢性疾病的疾病进展途径,即1型糖尿病(T1D),亨廷顿病,帕金森病和慢性阻塞性肺病(COPD) )。因此,我们引入了DPVis,它无缝地将模型参数和HMM的结果整合到可解释的和交互式的可视化中。在这项研究中,我们证明DPV在评估疾病进展模型,视觉总结疾病状态,交互式探索疾病进展模式,以及通过引入来自T1D临床研究的观察数据的acase研究设计和比较临床相关亚组群时成功。
translated by 谷歌翻译