内窥镜伪影是促进中空器官疾病的诊断和治疗的核心挑战。精确检测特定伪像,如像素饱和度,运动模糊,镜面反射,气泡和碎片,对于高质量的帧恢复至关重要,对于实现可靠的计算机辅助工具以改善患者护理至关重要。目前,由于视频帧中存在大量的多类伪像,目前大多数内窥镜检查视频尚未进行分析。通过内窥镜伪影检测(EAD 2019)的挑战,我们通过解决内窥镜框架伪影的准确识别和定位来解决这一关键瓶颈问题,从而能够对不可用的视频帧进行进一步的关键定量分析,例如镶嵌和3D重建,这对于提供改善的患者护理至关重要。本文总结了挑战任务,并描述了在EAD 2019挑战中建立的数据集和评估标准。
translated by 谷歌翻译
内窥镜检查是一种常规成像技术,用于诊断和微创手术治疗。诸如运动模糊,气泡,镜面反射,浮动物体和像素饱和等伪像妨碍了内窥镜视频的视觉解释和自动分析。鉴于内窥镜在不同临床应用中的广泛应用,我们认为这种伪影的稳健可靠识别和损坏的视频帧的自动恢复是一个基本的医学成像问题。现有的最先进的方法只涉及检测和恢复选定的文物。然而,通常内窥镜视频包含许多工件,这些工件促使建立全面的解决方案。我们提出了一个全自动框架,它可以:1)检测和分类六个不同的主要工件,2)为每个帧提供质量分数,3)恢复轻度损坏的帧。为了检测不同的伪像,我们的框架开发了快速多尺度,单级卷积神经网络检测器。我们引入质量度量来评估帧质量并预测图像恢复成功。具有精心选择的规则化的生成对抗网络最终用于恢复损坏的帧。我们的探测器产生的最高平均精度(mAP在5%阈值)为49.0,最低计算时间为88 ms,可实现精确的实时处理。我们用于盲目去模糊,饱和度校正和修复的修复模型比以前的方法显示出显着的改进。在一组10个测试视频中,我们显示我们的方法保留了68.7%的平均值,这比原始视频保留的帧多25%。
translated by 谷歌翻译
在这项工作中,我们报告了结合IEEE国际生物医学成像研讨会(ISBI)2016和国际医学影像计算机辅助干预会议(MICCAI)2017年组织的肝肿瘤分割基准(LITS)的设置和结果。将24种有效的最先进的肝脏和肝脏肿瘤分段算法应用于一组131个计算机断层扫描(CT)体积,具有不同类型的肿瘤对比度水平(高强度/低强度),组织异常(转移瘤)大小和不同程度的病变。已提交的算法已在70个未公开的卷上进行了测试。该数据集是与七家医院和研究机构合作创建的,由三位独立的放射科医师手动审查。我们发现没有一种算法对肝脏和肿瘤表现最佳。最佳肝脏分割算法的Dice评分为0.96(MICCAI),而对于肿瘤分割,最佳算法评估为0.67(ISBI)和0.70(MICCAI)。 LITS图像数据和手动注释继续通过在线评估系统公开提供,作为持续的基准测试资源。
translated by 谷歌翻译
我们提出了两种算法,它们可以在有限和一般随机非凸优化中比最先进的算法更快地找到局部最小值。所提出的算法的核心是$ \ text {One-epoch-SNVRG} ^ + $使用随机嵌套方差减少(Zhou etal。,2018a),其优于最先进的方差约简算法,如SCSG( Lei等,2017)。特别是,对于有限求和优化问题,建议的$ \ text {SNVRG} ^ {+} + \ text {Neon2} ^ {\ text {finite}} $算法达到$ \ tilde {O}(n ^ {1 / 2} \ epsilon ^ { - 2} + n \ epsilon_H ^ { - 3} + n ^ {3/4} \ epsilon_H ^ { - 7/2})$梯度复杂度收敛到$(\ epsilon,\ epsilon_H) )$ - second-ordertationary point,胜过$ \ text {SVRG} + \ text {Neon2} ^ {\ text {finite}} $(Allen-Zhu and Li,2017),这是现有的最佳算法,在广泛的范围内。对于一般随机优化问题,建议$ \ text {SNVRG} ^ {+} + \ text {Neon2} ^ {\ text {online}} $达到$ \ tilde {O}(\ epsilon ^ { - 3} + \ epsilon_H ^ { - 5} + \ epsilon ^ { - 2} \ epsilon_H ^ { - 3})$梯度复杂度,优于$ \ text {SVRG} + \ text {Neon2} ^ {\ text {online}}在某些制度下,$(Allen-Zhu和Li,2017)和Natasha2(Allen-Zhu,2017)。此外,我们探讨了目标函数的三阶平滑带来的加速度。
translated by 谷歌翻译
Recently, improving the relevance and diversity of dialogue system has attracted wide attention. For a post x, the corresponding response y is usually diverse in the real-world corpus, while the conventional encoder-decoder model tends to output the high-frequency (safe but trivial) responses and thus is difficult to handle the large number of responding styles. To address these issues, we propose the Atom Responding Machine (ARM), which is based on a proposed encoder-composer-decoder network trained by a teacher-student framework. To enrich the generated responses, ARM introduces a large number of molecule-mechanisms as various responding styles, which are conducted by taking different combinations from a few atom-mechanisms. In other words, even a little of atom-mechanisms can make a mickle of molecule-mechanisms. The experiments demonstrate diversity and quality of the responses generated by ARM. We also present generating process to show underlying interpretability for the result.
translated by 谷歌翻译
在本文中,我们提出了一个新的实体关系提取任务范例。我们将任务转换为多回合问题回答问题,即,实体和关系的提取被转换为从上下文识别答案跨度的任务。这种多转QA形式化有几个关键优势:首先,问题查询编码我们想要识别的实体/关系类的重要信息;其次,QA提供了一种自然的方式来联合建模实体和关系;第三,它允许我们利用完善的机器阅读理解(MRC)模型。在ACE和CoNLL04公司的实验表明,所提出的范例明显优于以前的最佳模型。我们能够获得所有ACE04,ACE05和CoNLL04数据集的最新结果,增加了三个数据集的SOTA结果49.6(+1.2),60.3(+0.7)和69.2(+1.4) , 分别。此外,我们构建了一个新开发的数据集RESUME,它需要多步推理来构造实体依赖关系,而不是先前数据集中三元组提取中的单步依赖提取。提出的多转QA模型也在RESUME数据集上实现了最佳性能。
translated by 谷歌翻译
我们提出了一个新的CogQA框架,用于多跳问题回答inweb-scale文档。受认知科学中的双重过程理论的启发,该框架通过协调隐式提取模块(系统1)和显式推理模块(系统2)逐步在迭代过程中构建\ textit {认知图}。在给出准确答案的同时,我们的框架进一步提供了可解释的推理路径。具体而言,基于BERT和图形神经网络的实现有效处理了HotpotQAfullwiki数据集中的多跳推理问题的数百万个文档,在排行榜上获得了34.9的联合$ F_1 $得分,而最佳竞争对手的得分为23.6。
translated by 谷歌翻译
对于文本分析,人们经常采用有损表示来完全忽略单词顺序或将每个单词嵌入为低维密集特征向量。在本文中,我们提出了卷积泊松因子分析(CPFA),其直接在无损表示上操作,该无损表示将每个文档中的字处理为高维单热矢量序列。为了表现其性能,我们进一步提出了卷积Poisson伽玛信念网络(CPGBN),它通过新概率汇集层将CPFA与伽马信念网络耦合。 CPFA将单词组成短语并捕获非常特定的短语级主题,而CPGBN进一步构建了更加通用的短语级主题的层次结构。为了有效推理,我们开发了Gibbs采样器和基于Weibull分布的卷积变分自动编码器。实验结果表明,CPGBN可以提取捕获单词顺序信息的高质量文本潜在表示,因此可以作为构建块来丰富各种忽略单词顺序的现有潜变量模型。
translated by 谷歌翻译
交通信号控制是一种新兴的应用场景,用于加强学习。除了作为影响人们通勤日常生活的重要问题之外,交通信号控制在适应动态交通环境和协调包括车辆和行人在内的数千名代理人方面对于强化学习提出了独特的挑战。现代强化学习成功的关键因素依赖于商品模拟器来生成大量用于学习的数据样本。然而,最常用的开源流量模拟器SUMO不能扩展到大型公路网和大流量,这阻碍了对交通场景的强化学习的研究。这促使我们创建一个新的流量模拟器CityFlow,它具有基本优化的数据结构和高效的算法。 CityFlow可以根据合成和真实数据支持灵活的道路网络和交通流量定义。它还提供了用户友好的强化学习界面。最重要的是,CityFlow比SUMO快20多倍,并且能够通过交互式渲染形式监控来支持全市范围的交通模拟。除了交通信号控制,CityFlow还可以作为其他交通研究的基础,并为智能交通领域的测试机器学习方法创造新的可能性。
translated by 谷歌翻译
为了解决医学图像在图像超分辨率重建过程中由于缺乏高频细节而导致严重模糊的问题,提出了一种基于密集神经网络和混合注意机制的医学图像超分辨率方法。所提出的方法将混合注意块添加到密集神经网络(DenseNet),使得神经网络可以将更多的注意力集中在具有足够高频细节的区域和信道上。去除Batchnormalization层以避免高频纹理细节的丢失。最后得到的高分辨率医学图像是利用网络末端的反卷层作为上采样算子获得的。实验结果表明,该方法对峰值信号的改善分别为0.05db~11.25dB和0.6%~14.04%。 - 噪声比(PSNR)度量和结构相似性指数(SSIM)度量,分别与主流图像超分辨率方法进行比较。这项工作为医学图像超分辨率重建的理论研究提供了新的思路。
translated by 谷歌翻译