在这项工作中,我们报告了结合IEEE国际生物医学成像研讨会(ISBI)2016和国际医学影像计算机辅助干预会议(MICCAI)2017年组织的肝肿瘤分割基准(LITS)的设置和结果。将24种有效的最先进的肝脏和肝脏肿瘤分段算法应用于一组131个计算机断层扫描(CT)体积,具有不同类型的肿瘤对比度水平(高强度/低强度),组织异常(转移瘤)大小和不同程度的病变。已提交的算法已在70个未公开的卷上进行了测试。该数据集是与七家医院和研究机构合作创建的,由三位独立的放射科医师手动审查。我们发现没有一种算法对肝脏和肿瘤表现最佳。最佳肝脏分割算法的Dice评分为0.96(MICCAI),而对于肿瘤分割,最佳算法评估为0.67(ISBI)和0.70(MICCAI)。 LITS图像数据和手动注释继续通过在线评估系统公开提供,作为持续的基准测试资源。
translated by 谷歌翻译
我们提出了一种用于计算机断层扫描(CT)体积中肝脏和肝脏病变的联合分割的模型。我们从两个完全协同的网络构建模型,串联连接并端到端地一起训练。我们评估了2017年MICCAI肝肿瘤分割挑战的方法,在广泛的指标范围内获得有竞争力的肝脏和肝脏病变检测和分割分数。与其他表现最佳的方法不同,我们的模型输出后处理是微不足道的,我们不使用挑战外部的数据,我们提出了一个简单的单阶段模型,即trainedend-end。然而,我们的方法几乎匹配顶部病变分割性能,并且在保持高召回率的同时实现了病变检测的第二高精度。
translated by 谷歌翻译
在本文中,我们研究了完全卷积网络(FCN)的长短跳过连接对生物医学图像分割的影响。在标准FCN中,仅使用长跳过连接来跳过从缩放路径到扩展路径的特征,以便在下采样期间恢复空间信息丢失。我们通过添加短跳过连接来扩展FCN,这类似于在剩余网络中引入的连接,以便构建非常深的FCN(数百层)。对梯度流的回顾证实,对于非常深的FCN,同时具有长和短跳过连接是有益的。最后,我们展示了一个非常深的FCN可以在EM数据集上实现最先进的结果,而无需进行任何进一步的处理。
translated by 谷歌翻译
本文展示了机器学习中常用的自适应控制优化方法之间的许多直接联系。从常见的输出错误公式开始,检查更新法修改中的相似之处。然后讨论两个领域共同的稳定性,性能和学习概念。基于更新法则和共同概念的相似性,提供了新的交叉点和改进算法分析的机会。特别地,通过从这些交叉点获得的见解来解决与高阶学习相关的特定问题。
translated by 谷歌翻译
反向传播的神经网络训练常见的低效率是更新锁定问题:每个层必须等待信号在更新之前通过网络传播。我们考虑并分析了一种训练程序,即解耦贪心学习(DGL),它可以更有效地解决这个问题,并且能够超越以前的解决方案。它基于对联合训练目标的商定放宽,最近证明在卷云神经网络(CNNs)的大规模图像分类中是有效的。我们考虑对此目标进行优化,允许我们对层培训进行解耦,从而允许在网络中对层或模块进行层中可能的线性并行化训练。从理论上和经验上看,这种方法是收敛的。此外,我们凭经验发现它可以导致比顺序优化甚至标准的端到端反向传播更好的泛化。我们表明,通过使用重放缓冲器,可以将这种方法扩展到异步设置,其中模块可以通过大的通信延迟进行操作。我们展示了DGL对CIFAR-10数据集的有效性,以及大型ImageNet数据集,我们能够有效地训练VGG和ResNet-152模型。
translated by 谷歌翻译
浅层监督的1层隐藏层神经网络具有许多有利的特性,使它们比它们的深层对应物更容易解释,分析和优化,但缺乏代表性的能力。在这里,我们使用1-hiddenlayer学习问题逐层顺序构建深层网络,这可以从浅层网络继承属性。与之前使用浅网络的方法相反,我们关注的是深度学习被报道为成功的关键问题。因此,我们使用大规模ImageNet数据集和CIFAR-10数据集研究了图像识别任务的CNN。使用一组简单的架构和培训思想,我们发现解决sequential1-hidden-layer辅助问题会导致CNN超过ImageNet上的AlexNetperformance。通过解决2-and-3-hidden层辅助问题,扩展我们的培训方法以构建个人层,我们获得了超过ImageNet的VGG-11的11层网络,获得了89.8%的前5个单一作物。据我们所知,这是CNN的端到端培训的第一个竞争性替代方案,可以扩展到ImageNet。我们进行了广泛的实验来研究它在中间层上引起的性质。
translated by 谷歌翻译
小波散射变换是一种不变的信号表示,适用于许多信号处理和机器学习应用。我们推出了Kymatio软件包,这是一种易于使用的高性能Python实现,可在1D,2D和3D中实现散射变换,与现代深度学习框架兼容。所有变换都可以在GPU上执行(除CPU之外),相对于CPU实现提供了相当快的速度。该软件包的内存占用量也很小,因此可以节省大量内存。源代码,文档和示例均可通过https://www.kymat.io/获取。
translated by 谷歌翻译
变分自动编码器(VAE)的常规先验是高斯分布。最近的研究表明,先前分布的选择会影响VAE模型的学习能力。我们提出了一种通用技术(嵌入 - 重新参数化程序,或ER),用于在VAE模型中引入任意流形值变量。我们将我们的技术与玩具基准问题上的常规VAE进行比较。这项工作正在进行中。
translated by 谷歌翻译
我们探讨了Embodied QuestionAnswering的盲目(仅限问题)基线。 EmbodiedQ​​A任务要求代理人通过在模拟环境中智能地导航来回答问题,在最终回答之前仅通过第一人称视觉收集必要的视觉信息。因此,忽略环境和视觉信息的盲目基线是一种退化解决方案,但我们通过我们在EQAv1数据集上的实验表明,在所有情况下,一个简单的仅问题基线可以在EmbodiedQ​​A任务中获得最先进的结果,除非该代理非常靠近该对象。
translated by 谷歌翻译
我们研究了一阶散射变换作为减少由卷积神经网络(CNN)处理的信号的候选者。我们展示了理论和经验证据,即在自然图像和足够小的平移不变性的情况下,该变换保留了分类所需的大部分信号信息,同时显着减小了空间分辨率和总信号大小。我们证明,使用此代表级联CNN与ImageNet分类模型相同,后者通常用于下游任务,例如ResNet-50。我们随后将ourtrained混合ImageNet模型作为基础模型应用于检测系统,该检测系统具有不典型的较大图像输入。在Pascal VOC和COCO检测任务中,与直接在输入图像上训练的模型相比,我们证明了推理速度和训练记忆消耗的改进。
translated by 谷歌翻译