对于前列腺癌患者,Gleason评分是最重要的预后因素之一,可能决定独立于分期的治疗。然而,Gleason评分基于肿瘤形态的主观显微镜检查并且具有较差的再现性。在这里,我们提出了一个深度学习系统(DLS),用于Gleason评分前列腺切除术的全幻灯片图像。我们的系统是使用来自1,226张幻灯片的1.12亿个病理学家注释的图像片段开发的,并在331个幻灯片的独立验证数据集上进行评估,其中参考标准由泌尿生殖专家病理学家建立。在验证数据集中,29名一般病理学家的平均准确度为0.61。 DLS的诊断准确率显着提高0.70(p = 0.002),并且与临床随访数据的相关性趋向于更好的患者风险分层。我们的方法可以提高格里森评分的准确性和随后的治疗决策,特别是在专业知识不可用的情况下。 DLS还超越了当前的格里森系统,以更精细地表征和定量肿瘤形态,为格里森系统本身的细化提供了机会。
translated by 谷歌翻译
视网膜血管的准确分割是糖尿病性视网膜病变(DR)检测的基本步骤。大多数基于深度卷积神经网络(DCNN)的方法具有较小的感受野,因此它们无法捕获较大区域的全局背景信息,具有难以识别的病变。最终的分段视网膜血管包含更多噪声,分类精度低。因此,在本文中,我们提出了一个名为D-Net的DCNN结构。在所提出的D-Net中,扩张卷积用于骨干网络中以获得更大的感受野而没有空间分辨率,从而减少特征信息的丢失并减少细小血管分割的难度。大的感受野可以更好地区分病变区域和血管容器。在所提出的多尺度信息融合模块(MSIF)中,使用具有不同扩张率的平行卷积层,使得模型可以获得更密集的特征信息并且更好地捕获不同尺寸的视网膜血管信息。在解码模块中,跳过层连接用于将上下文信息传播到更高分辨率的层,以防止低级信息通过整个网络结构。最后,我们的方法在DRIVE,STARE和CHASE数据集上得到了验证。实验结果表明,我们的网络结构在准确性,灵敏度,特异性方面优于N4-fields,U-Net和DRIU等一些现有方法。和AUCROC。特别是,D-Net在DRIVE,STARE和CHASE三数据集中的U-Net分别优于1.04%,1.23%和2.79%。
translated by 谷歌翻译
大多数的脱轨工作都集中在雨水条纹的去除上,但是它们不能在大雨图像的情况下发挥作用。在大雨中,条纹强烈可见,浓密的雨水堆积或雨幕效应显着地消除了图像,进一步的场景相对更模糊等。在本文中,我们提出了一种解决这些问题的新方法。我们提出了一个两阶段的网络:一个基于物理的骨干,然后是深度引导的GAN细化。第一阶段估计由基础物理学控制的雨条纹,透射和大气光。为了更可靠地梳理这些组件,使用引导过滤框架将图像分解为其低频和高频分量。这种过滤由无雨残留图像引导 - 其内容用于以空间变化的方式设置两个通道的通带,使得背景细节不会与雨条混合。对于第二阶段,精炼阶段,我们提出了深度引导的GAN来恢复第一阶段无法检索的背景细节,以及纠正该阶段引入的人工制品。我们已经针对艺术方法的状态评估了我们的方法。大量实验表明,我们的方法在实现图像数据方面优于它们,恢复具有良好细节的视觉清晰图像。
translated by 谷歌翻译
基于学习的散列算法是“热门话题”,因为它们可以极大地增加现有方法的运行规模。在本文中,我们提出了一种新的基于学习的散列方法,称为“快速监督离散散列”(FSDH),基于``在有限的最小二乘回归中广泛使用了训练离散散列“(SDH)。将训练样本(或散列码)回归到相应的类标签中。而不是采用这种方法,FSDH使用非常简单但有效的回归训练实例的类标签。加速算法的相应哈希码。据我们所知,此策略以前没有用于散列.TanveySDH将优化分解为三个子问题,其中最关键的子问题 - 二进制哈希码的离散优化 - 用迭代求解离散循环坐标下降(DCC),这是耗时的。但是,FSDH有一个封闭形式的解决方案,只需要一个相当的过度哈希码解决步骤,效率很高。此外,FSDH通常比SDH更快以求解最小二乘回归的投影矩阵,使得FSDH通常比SDH更快。例如,我们的结果表明,当CIFAR-10数据库上的hashingbits数为128时,FSDH比SDH快约12倍,而当MNIST上的散列位数为64时,FSDH比FastHash快约151倍数据库。实验结果表明,FSDH不仅速度快,而且优于其他比较方法。
translated by 谷歌翻译
在本文中,我们试图解决培训低精度网络的两个挑战:1)由于不可微分量化功能导致通过低精度网络传播梯度的臭名昭着的困难; 2)在残余类型网络架构中全面精确实现跳过连接的要求。在训练过程中,我们引入了一个辅助梯度模块,模拟跳过连接的效果,以辅助优化。然后用全精度辅助梯度模块扩展原有的低精度网络,形成混合精度残差网络,并与低速共同优化。 - 使用权重共享和单独批量标准化的精确模型。该策略确保梯度回传更容易传播,从而减轻了训练低精度网络的主要困难。此外,我们发现,当用我们的方法训练低精度平面网络时,普通网络可以实现与具有剩余跳过连接的对应物相似的性能;即,没有浮点跳过连接的普通网络在部署推理时间方面同样有效。为了进一步促进反向传播过程中的梯度流,我们采用随机结构精度策略随机采样和量化子网络,同时保持其他部分的全精度。我们通过各种量化方法对图像分类任务提出的方法进行评估,并显示出一致的性能提升。
translated by 谷歌翻译
Takagi-Sugeno-Kang(TSK)模糊系统是用于回归问题的非常有用的机器学习模型。然而,据我们所知,已经注意到一种有效且有效的训练算法,使他们能够处理大数据。受TSK模糊系统和神经网络之间的联系的启发,我们将三种强大的神经网络优化技术,即小批量梯度下降,正则化和AdaBound扩展到TSK模糊系统,并提出了一种专门用于训练TSK模糊系统的新型DropRule技术。我们的最终算法,具有规范化的小批量梯度下降,DropRule和AdaBound(MBGD-RDA),可以在训练TSK模糊系统时实现快速收敛,并且还具有优越的泛化性能。它可以用于在任何大小的数据集上训练TSK模糊系统;但是,它对于大数据集特别有用,目前还没有其他有效的训练算法。
translated by 谷歌翻译
与2D对应物相比,迄今为止,原始和稀疏点云的3D物体检测得到了很大的改进。在本文中,我们提出了一个名为FVNet的新框架,用于3D前视图提议生成和点云对象检测。它包括两个阶段:生成前视图提议和3D边界框参数估计。我们首先将点云投影到圆柱面上,以生成保留丰富信息的前视特征图,而不是从相机图像或鸟瞰图中生成建议。然后,我们引入一个提议生成网络,以从生成的地图中预测3D区域提议,并从整个点云中进一步描述感兴趣的对象。最后,我们提出了另一个网络,从挤出的对象点中提取逐点特征,并在规范坐标中回归最终的3D边界框参数。我们的框架实现了每个pointcloud样本12ms的实时性能。关于3D检测基准KITTI的大量实验表明,所提出的架构在精度和参考时间方面优于最先进的技术,该技术将相机图像或点云作为输入。
translated by 谷歌翻译
在线编程服务,例如Github,TopCoder和EduCoder,已经促进了服务用户之间的许多社交互动。然而,由于源代码库的快速增加,现有的社交交互相当有限且效率低下,难以手动探索。源代码挖掘的出现为分析源代码提供了一种很有前途的方法,因此这些源代码可以是相对容易理解并在这些服务用户之间分享。在所有源代码挖掘尝试中,程序分类为与资源代码理解相关的各种任务奠定了基础,因为如果机器无法正确地对程序进行分类,则机器无法理解计算机程序。尽管已经提出了许多机器学习模型,例如基于自然语言处理(NLP)的模型和基于抽象语法树(AST)的模型,以基于其相应的源代码对计算机程序进行分类,但是现有的工作不能从视觉上完全表征源代码。语法和语义信息。为了解决这个问题,我们提出了一种基于图形神经网络(GNN)的模型,它将数据流和函数调用信息集成到AST中,并将改进的GNN模型应用于集成图,从而实现最先进的程序分类准确性。实验结果表明,拟议的工作可以准确地对程序进行分类,准确率超过97%。
translated by 谷歌翻译
无模型单目标跟踪(SOT)算法的最新进展极大地激发了将SOT应用于\ emph {多目标跟踪}(MOT)以提高鲁棒性以及减轻对外部检测器的依赖性。然而,SOT算法通常被设计用于将目标与其环境区分开,因此当目标在空间上与在MOT中经常观察到的类似物体混合时遇到问题。为了解决这个问题,在本文中,我们提出了一种实例感知跟踪器,用于在目标模型内部和目标模型之间集成SOT技术以实现MOTby编码感知。特别地,我们通过融合用于区分目标与背景和其他实例(跟踪目标)的信息来构建每个目标模型。为了保证所有目标模型的唯一性,我们的实例感知跟踪器会考虑来自所有目标模型的响应图,并专门分配空间位置以优化整体精度。我们做出的另一个贡献是通过卷积神经网络学习的动态模型再雾化策略。该策略有助于消除初始化噪声以及适应目标大小和外观的变化。为了显示所提出的方法的有效性,它在流行的MOT15和MOT16挑战基准上进行了评估。在两个基准测试中,与已发布的结果相比,我们的方法实现了最佳的整体性能。
translated by 谷歌翻译
在现实世界的场景中,用于连续控制的强化学习的观测数据通常是有噪声的,并且其中一部分可能在时间上动态地丢失,这违反了当前开发的许多当前方法的假设。我们使用基于模型的方法在部分可观察马尔可夫决策过程(POMDP)的框架内解决了该问题,其中使用新提出的具有局部近似的替代损失函数从不完整和噪声观察来估计过渡模型,而政策和价值函数是在信仰归责的帮助下学到了。在后一个目的中,构建了一个生成模型,并将其无缝地融入到POMDP的信念更新过程中,即使在显着的不完整性和噪声下也能实现抢占。所提出方法的有效性在一组基准任务上得到验证,表明我们的方法在各种具有挑战性的情景下优于多种比较方法。
translated by 谷歌翻译