在这项工作中,我们报告了结合IEEE国际生物医学成像研讨会(ISBI)2016和国际医学影像计算机辅助干预会议(MICCAI)2017年组织的肝肿瘤分割基准(LITS)的设置和结果。将24种有效的最先进的肝脏和肝脏肿瘤分段算法应用于一组131个计算机断层扫描(CT)体积,具有不同类型的肿瘤对比度水平(高强度/低强度),组织异常(转移瘤)大小和不同程度的病变。已提交的算法已在70个未公开的卷上进行了测试。该数据集是与七家医院和研究机构合作创建的,由三位独立的放射科医师手动审查。我们发现没有一种算法对肝脏和肿瘤表现最佳。最佳肝脏分割算法的Dice评分为0.96(MICCAI),而对于肿瘤分割,最佳算法评估为0.67(ISBI)和0.70(MICCAI)。 LITS图像数据和手动注释继续通过在线评估系统公开提供,作为持续的基准测试资源。
translated by 谷歌翻译
已经提出了各种用于CT中的肝脏分割的方法:除了在该研究领域中起主要作用的统计形状模型之外,最近已经引入了基于卷积神经网络的新方法。使用一组219肝脏CT数据集与肝脏手术计划的参考分析,我们评估基于2D和3D U-net架构的几个神经网络分类器的性能。令人感兴趣的观察结果是切片方法令人惊讶地表现良好,平均和中位数Dice系数高于0.97,并且在给定当前硬件和软件限制的情况下可能优选3D方法。
translated by 谷歌翻译
对同义词的研究对于解决词汇语义学中的基本问题至关重要。在本文中,我们提出了四个假设,这些假设表征了翻译,话语,搭配和感知集群中同音异义词的独特行为。我们提出了一个新的带注释的同音词资源,它允许我们测试我们对现有WSD资源的假设。实验结果为假设提供了强有力的经验证据。本研究代表了一种向计算方法迈出的一步,用于区分同义词和多义词,并构建一个明确的粗粒度感知库存。
translated by 谷歌翻译
EMNLP 2018研讨会BlackboxNLP致力于资源和技术的专门开发,用于分析和理解语言神经模型获得的内部工作和代表。方法包括:系统地操纵神经网络的输入并调查对其性能的影响,测试可解释的知识是否可以从神经网络获得的中间表示中解码,提出对神经网络体系结构的修改以使其知识状态或生成的输出更易于解释,并检查简化或正式语言的网络性能。在这里,我们回顾了每个类别中的一些代表性研究。
translated by 谷歌翻译
关于神经网络验证的先前工作集中于作为网络输出的线性函数的规范,例如,在输入的对抗扰动下的分类器输出的不变性。在本文中,我们扩展了验证算法,以便能够证明神经网络的更丰富的属性。为此,我们引入了一类凸 - 松弛规范,它构成了非线性规范,可以通过凸松弛来验证。我们表明,兴趣的一些重要属性可以在这个类中建模,包括在物理系统的学习动力学模型中保存能量;在预测手写数字总和的系统中,在对抗性扰动下的分类器输出标签的语义一致性和边界误差。我们的实验评估表明,我们的方法能够有效地验证这些规范。此外,我们的评估揭示了无法验证以满足这些规范的模型中的故障模式。因此,强调训练模型的重要性不仅仅是为了适应训练数据,还要与规范保持一致。
translated by 谷歌翻译
处理口语的一种普遍方法是首先将其自动转换为文本。另一种方法是使用端到端的方法:最近的工作已经提出从具有语音字幕的图像学习口语的语义嵌入,而没有中间转录步骤。我们建议使用多任务学习来利用端到端设置中的现有转录语音。我们描述了一个三任务架构,它结合了将语音字幕与相应图像,带文本的语音和带有图像的文本进行匹配的目标。我们表明,与单独训练语音/图像任务相比,添加语音/文本任务可以显着提高性能。我们推测这是由于转录语音为模型提供了强烈的诱导性偏见,并为此提供了支持。
translated by 谷歌翻译
虽然深度学习已经在许多具有挑战性的问题上取得了显着的成果,但研究人员发现了神经网络在对抗设置中的脆弱性,其中对输入的小但精心选择的扰动可能使模型产生极不准确的输出。这使得这些模型特别不适用于安全性非常重要的安全关键应用领域(例如自动驾驶汽车)。最近的工作表明,用对抗生成的数据增强训练可以提供一定程度的抗测试时间攻击的稳健性。在本文中,我们研究了这种方法如何随着我们增加给予防御者的计算预算而扩展。我们表明,增加对象训练模型的参数数量会增加它们的鲁棒性,特别是对于较小的模型来说,而对抗整个集合作为单个模型是比单纯使用更大的单个模型更有效的花费预算的方式。至关重要的是,我们表明它是整体的对抗性训练,而不是对抗训练的模型的集合,它提供了强大的功能。
translated by 谷歌翻译
土壤水分监测是提高农业结果和保护环境的基本过程。传统的测量土壤中水分含量的方法费力且昂贵,因此人们对开发可以减少工作量和成本的传感器和技术产生了浓厚的兴趣。在这项工作中,我们建议使用一个自动移动机器人,配备最先进的非接触式土壤湿度传感器,可以动态建立水分图并自动选择最佳的采样位置。机器人由土壤湿度模型质量驱动的自主勘探策略引导,该模型指示信息不太精确的区域。传感器模型遵循Poissondistribution,我们演示了如何将这些测量集成到kriging框架中。我们还研究了一系列不同的勘探策略,并通过一系列基于从两个不同领域收集的真实土壤湿度数据的评估实验来评估其有用性。本文提出了利用自适应测量区间和自适应采样策略构建质量更好的土壤水分模型的优势。该方法具有一般性,可以应用于其中特征现象直接影响采集时间并需要进行空间映射的其他场景。
translated by 谷歌翻译
序列标记的神经方法通常使用条件随机场(CRF)来模拟它们的输出依赖性,而递归神经网络(RNN)在其他任务中用于相同的目的。我们着手建立RNNs作为序列标记的CRF的有吸引力的替代品。为此,我们解决了RNN最突出的缺点之一,即它在最大可能性训练中没有暴露其自身的错误。我们将输出序列的预测构建为顺序决策过程,其中我们使用调整的行为者 - 评论者算法(AC-RNN)来训练网络。我们全面地将此策略与三个结构化输出任务上的RNN和CRF的最大似然训练进行比较。所提出的AC-RNN有效地匹配CRF在NER和CCG标记上的性能,并且优于机器音译。我们还表明,我们的培训策略明显优于其他解决RNN暴露偏差的技术,例如计划抽样和自我批评政策培训。
translated by 谷歌翻译
许多计算机视觉应用依赖于本地特征描述符,例如SIFT,SURF或FREAK,用于图像匹配。尽管它们的本地特征使图像匹配过程对于遮挡更加鲁棒,但是它经常导致需要过滤掉的几何不一致的关键点匹配,例如使用RANSAC。在本文中,我们提出了一种新颖的,更具辨别力的描述,其不仅包括局部特征表示,还包括关于相邻关键点的几何布局的信息。为此,我们使用Siamesearchitecture,通过最大化非对应的匹配图像块对之间的距离来学习关键点星座的低维特征嵌入,同时最小化它以进行正确的匹配。我们训练的48维oating点描述符建立在最先进的FREAK描述符之上,在竞争对手的TUM数据集上实现了显着的性能提升。
translated by 谷歌翻译