内窥镜伪影是促进中空器官疾病的诊断和治疗的核心挑战。精确检测特定伪像,如像素饱和度,运动模糊,镜面反射,气泡和碎片,对于高质量的帧恢复至关重要,对于实现可靠的计算机辅助工具以改善患者护理至关重要。目前,由于视频帧中存在大量的多类伪像,目前大多数内窥镜检查视频尚未进行分析。通过内窥镜伪影检测(EAD 2019)的挑战,我们通过解决内窥镜框架伪影的准确识别和定位来解决这一关键瓶颈问题,从而能够对不可用的视频帧进行进一步的关键定量分析,例如镶嵌和3D重建,这对于提供改善的患者护理至关重要。本文总结了挑战任务,并描述了在EAD 2019挑战中建立的数据集和评估标准。
translated by 谷歌翻译
内窥镜检查是一种常规成像技术,用于诊断和微创手术治疗。诸如运动模糊,气泡,镜面反射,浮动物体和像素饱和等伪像妨碍了内窥镜视频的视觉解释和自动分析。鉴于内窥镜在不同临床应用中的广泛应用,我们认为这种伪影的稳健可靠识别和损坏的视频帧的自动恢复是一个基本的医学成像问题。现有的最先进的方法只涉及检测和恢复选定的文物。然而,通常内窥镜视频包含许多工件,这些工件促使建立全面的解决方案。我们提出了一个全自动框架,它可以:1)检测和分类六个不同的主要工件,2)为每个帧提供质量分数,3)恢复轻度损坏的帧。为了检测不同的伪像,我们的框架开发了快速多尺度,单级卷积神经网络检测器。我们引入质量度量来评估帧质量并预测图像恢复成功。具有精心选择的规则化的生成对抗网络最终用于恢复损坏的帧。我们的探测器产生的最高平均精度(mAP在5%阈值)为49.0,最低计算时间为88 ms,可实现精确的实时处理。我们用于盲目去模糊,饱和度校正和修复的修复模型比以前的方法显示出显着的改进。在一组10个测试视频中,我们显示我们的方法保留了68.7%的平均值,这比原始视频保留的帧多25%。
translated by 谷歌翻译
我们研究了用于深度神经网络的更广泛的Winograd族卷积算法。我们提出了显式的Winograd卷积算法一般情况(使用了高于1的度数的多项式)。它允许我们在常用的Winograd卷积算法的性能方面构建更多不同的版本,并提高卷积计算的准确性和性能。我们发现在$ fp16 $中,这种方法使我们能够获得更好的图像识别精度,同时保持与单个输出点计算的相同数量的一般乘法,因为常用的Winograd算法适用于尺寸为$ 3 \ times 3 $且输出大小等于$ 4 \ times的内核$ 4。我们证明,在$ bf16 $中,可以更快地执行卷积计算,保持图像识别的准确性与直接卷积方法相同。我们测试了我们的方法,从Imaginet验证集中获得了2000美元$图像的子集。我们给出了三个精度计算结果$ fp32 $,$ fp16 $和$ bf16 $。
translated by 谷歌翻译
我们介绍了精确合成图像和LiDAR(PreSIL)数据集的自主车辆感知。 Grand Theft Auto V(GTA V)是一款商业视频游戏,拥有大量详细的世界,具有逼真的图形,可提供广泛的数据采集环境。使用GTA V创建合成数据的自动驾驶的现有工作尚未发布其数据集并依赖于游戏光线投射功能,该功能将人们视为汽缸并且无法捕获超过30米的车辆。我们的工作在GTA V中创建了一个精确的LiDAR模拟器,它与所有实体的详细模型相冲突,无论其类型或位置如何。 PreSIL数据集包含50,000多个实例,包括具有全分辨率深度信息的高清图像,语义分割(图像),逐点分割(点云),地面点标签(点云)以及所有车辆和人员的详细注释。使用我们的框架收集其他数据是完全自动的,并且不需要任何类型的人工注释。我们通过显示当使用我们的数据预先训练最先进的3D物体检测网络时,KITTI 3D物体检测基准挑战的平均精度提高了5%来证明数据集的有效性。数据和代码可用于:http://uwaterloo.ca/waterloo-intelligent-systems-engineering-lab/projects/precise-synthetic-image-and-lidar-presil-dataset-autonomous
translated by 谷歌翻译
我们提出了一个建模框架,用于调查非静态环境中基于原型的分类器。具体来说,我们研究了从高维,集群数据流训练的LearningVector量化(LVQ)系统。我们考虑称为LVQ1的标准赢家通吃更新。输入数据的统计特性在训练过程定义的时间尺度上发生变化。我们应用从统计物理学中借用的分析方法,这些方法早先用于学习不稳定环境的精确描述。建议的框架有助于在存在虚拟和真实概念漂移的情况下计算学习曲线。在这里,我们关注训练数据中与时间相关的阶级偏差。第一个结果证明,虽然基本的LVQ算法适用于训练非固定环境,但作为一种明确的遗忘机制,权重衰减并不能改善所考虑的漂移过程下的性能。
translated by 谷歌翻译
人的适应能力主要依赖于学习和合并知识的能力,包括有监督和无监督的学习:父母指出了重要的概念,然后孩子们自己填补了空白。这是特别有效的,因为有监督的学习永远不会是穷举的,因此自主学习可以发现有助于概括的不变性和不规则性。在本文中,我们建议将相似的方法应用于跨域的对象识别任务:我们的模型以监督的方式学习语义标签,并通过学习自我监督的信号扩展其对数据的理解,如何在相同的图像上解决拼图游戏。此次要任务有助于网络容忍空间关联的概念,同时充当分类任务的正则化器。在PACS,VLCS,Office-Home和数据集上进行的多次实验证实了我们的直觉,并表明这种简单的方法优于以前的领域泛化和适应解决方案。 Anablation研究进一步说明了我们的方法的内部运作。
translated by 谷歌翻译
一旦处理高维数据或冗余传感器信号,大多数现有的特征选择方法不足以用于分析目的,因为由于虚假效应或相关性而不是因果效应可以选择特征。为了支持在生物医学实验中发现因果特征,我们在此提出了FRI,这是一个开源Python库,可用于识别线性分类和(序数)回归问题中的所有相关变量。使用最近提出的特征相关方法,FRI能够为进一步的基因实验提供基础,或者特定的可以促进对替代生物标记的搜索。它可以在交互式环境中使用,通过提供模型操作和可视化方法,或在批处理过程中用作过滤方法。
translated by 谷歌翻译
数据科学需要耗时的迭代手动活动。特别是,数据选择,预处理,转换和挖掘等活动高度依赖于迭代的试错过程,这些过程可以通过提供有关变更影响的快速反馈来显着提高。渐进式数据科学的理论是以渐进的方式计算变化的结果,快速返回结果的第一近似值并允许迭代细化直到收敛到最终结果。使用户能够与中间结果进行交互,可以及早发现错误或次优的选择,对管道修改的指导定义及其快速评估。在本文中,我们讨论了数据科学管道不同步骤中出现的渐进性挑战。我们将描述管道每个步骤的变化如何影响后续步骤,并概述为什么渐进式数据科学将有助于提高流程的效率。计算由变化引起的结果的渐进近似会产生许多研究挑战,特别是如果在管道的早期阶段进行改变的话。我们讨论了这些挑战,并概述了迈向渐进的第一步,我们认为,这最终将有助于显着加速整个数据科学过程。
translated by 谷歌翻译
我们提出了一种新的变分模型,用于时空成像中的关节图像重建和运动估计,这是根据我们用形状理论提出的一般框架进行研究的。该模型由两个组件组成,一个用于进行修改的静态图像重建,另一个用于执行顺序间接图像配准。对于后者,我们将大变形微分形式度量映射框架概括为顺序间接注册设置。所提出的模型在理论上与替代方法(基于光学流动的模型和双重运动模型)进行了比较,并且我们证明了所提出的模型在最优解的方面具有期望的性质。理论推导和有效算法也针对所提出的模型的时间离散化场景,表明时间离散化版本的最优解与时间连续版本的最优解一致,并且大多数计算组件是容易的 - 实现线性化变形。还分析了算法的复杂性。这项工作被2D空间+时间层析成像中的一些数值例子所包含,其具有verysparse和/或高噪声数据。
translated by 谷歌翻译
深度学习NLP域缺乏模型鲁棒性分析的程序。在本文中,我们提出了一个框架,通过模型解释器验证任何问答模型的鲁棒性。我们提出一个健壮的模型应该超越由嵌入词引起的语义相似性的初始概念,以学习更像人类的意义理解。我们通过两种方式操纵问题来测试这个属性:交换重要问题单词1)它的语义正确的同义词和2)对于嵌入空间中接近的单词vectort。我们通过局部可解释模型不可知解释方法(LIME)来估计问题中词语的重要性。通过这两个步骤,我们比较了最先进的Q&A模型。我们表明,尽管最先进模型的准确性很高,但它们在输入中的变化非常脆弱。此外,我们提出了两种对抗性训练方案,通过高达7%的准确度测量,提高模型对真实同义词的敏感度。我们的研究结果有助于了解哪些模型更稳定以及如何改进。此外,我们还创建并发布了一个新数据集,可用于验证Q&A模型的稳健性。
translated by 谷歌翻译