为了研究是否可以使用深度学习技术评估在彩色眼底照片上描绘的中心性浆液性脉络膜视网膜病变(CSC)的程度和程度。我们收集了在不同主题上获得的总共2,504个眼底图像。我们使用相应的光学相干断层扫描(OCT)图像验证了这些图像的CSC状态。共有1,329张图片描绘了CSC。对这些图像进行预处理和标准化。将得到的数据集随机分成三部分,比例分别为8:1:1,用于训练,验证和测试目的。我们使用称为InceptionV3的深度学习架构来训练分类器。我们进行了非参数接收机操作特性(ROC)分析,以评估所开发算法识别CSC的能力。两个评价者之间的Kappa系数为0.48(p <0.001),而计算机和两个评价者之间的Kappa系数分别为0.59(p <0.001)和0.33(p <0.05)。我们的实验表明,基于深度学习的计算机算法以相对可靠和一致的方式评估彩色眼底照片上描绘的CSC。
translated by 谷歌翻译
目的:验证和比较八种可用的深度学习架构在基于colorfundus图像评估青光眼严重程度方面的表现。材料与方法:我们回顾性地收集了5978例眼底图像的数据集,并通过两位经验丰富的眼科医生的共识对其青光眼严重程度进行了注释。我们预处理图像以生成全局和局部感兴趣区域(ROI),即全局视场图像和局部盘区域图像。然后,我们将生成的图像分成三个独立的子组,用于训练,验证和测试目的。利用数据集,分别训练8个卷积神经网络(CNN)(即VGG16,VGG19,ResNet,DenseNet,InceptionV3,InceptionResNet,Xception和NASNetMobile)以评定青光眼严重程度,并使用接收器操作特征下的区域进行定量验证( ROC)曲线和二次kappa评分。结果:除VGG16和VGG19外,CNNs在全球和局部ROI上的平均kappa评分分别为80.36%和78.22%,使用预训练后的体重分别为85.29%和82.72%。 VGG16和VGG19从头开始训练时达到了合理的准确度,但是当使用预训练的权重进行全球和本地ROI时,它们都失败了。在这些CNN中,使用全球ROI时,基于预先训练的权重,密集网具有最高的分类准确度(即75.50%),而使用本地ROI时则为65.50%。结论:实验证明了深度学习技术在评估青光眼严重程度方面的可行性。特别是,全球视野图像包含相对更丰富的信息,这些信息可能对青光眼评估至关重要,这表明我们应该使用眼底图像的整个视野​​来训练深度学习网络。
translated by 谷歌翻译
本研究旨在使用深度卷积神经网络自动诊断在x射线(CXR)图像上描绘的胸部疾病。现有方法通常将整个CXR图像用于训练目的,但是这种策略可能存在两个缺点。首先,整个CXR图像中潜在的未对准或不相关对象的存在可能导致不必要的噪声,从而限制网络性能。其次,由调整大小操作引起的相对低的图像分辨率(其是用于训练神经网络的常见预处理过程)可能导致图像细节的丢失,使得难以检测具有小病变区域的病理。为了解决这些问题,我们提出了一种新方法,称为基于分割的融合网络(SDFN),它利用了局部肺区域的高分辨率信息。具体而言,通过肺部发生器(LRG)识别并分配局部肺区域。然后将两个基于CNN的分类模型用作特征提取器以获得整个CXR图像和裁剪的肺部区域图像的辨别特征。最后,通过特征融合模块对获得的特征进行融合,进行疾病分类。通过NIH基准分割对胸部X射线14数据集的评价,实验结果表明,与现有方法相比,所开发的方法通过接受者操作特征实现了更准确的疾病分类。 (ROC)分析。还发现,与传统方法相比,SDFN可以更精确地定位病变区域。
translated by 谷歌翻译
网络视频应用(例如视频会议)由于意外的网络波动和有限的带宽而经常遭受视觉质量的影响。在本文中,我们开发了一个质量增强网络(QENet)来减少视频压缩伪像,利用各个多尺度卷积产生的空间和时间先验,在时间上以循环方式进行空间和扭曲时间预测。我们已将此QENet集成为高效视频编码(HEVC)兼容解码器的标准单独后处理子系统。实验结果表明,我们的QENet在HEVC和其他基于深度学习的方法中展示了针对默认环路滤波器的最先进性能,其中在峰值信噪比(PSNR)和主观增益中具有明显的目标增益。
translated by 谷歌翻译
在基于暗通道的方法中,局部常数假设被广泛用于使算法可逆。它不可避免地会引入缺陷,因为这种假设不能完全避免深度不连续性,同时还要考虑像素。不幸的是,由于先验的限制,它只能确认暗物质的存在,但没有指明它们的位置或可能性,因此在细化中没有保真度测量可用,因此缺陷要么是校正不足要么是过度校正。在本文中,我们比黑暗通道理论更好地克服了这个问题。我们将暗通道的概念分为暗像素和局部常数假设,然后根据新的权重图控制有问题的假设。通过sucheffort,我们的方法显示出质量的显着提高并具有竞争力的速度。最后,我们表明该方法对初始传输估计具有高度鲁棒性,并且可以通过提供更好的暗像素位置来不断改进。
translated by 谷歌翻译
在本文中,我们解决了四元数域中自回归移动平均(ARMA)模型的自适应学习问题。通过将原始学习问题转化为具有明确噪声项的完整信息优化任务,然后利用梯度下降和牛顿类比求解优化问题,我们得到了四元数ARMA的两种在线学习算法。此外,提出了遗嘱约束分析对四元数代数的特定性质的讨论,证明了在线算法的性能渐近地接近最佳四元数ARMA模型的性能。
translated by 谷歌翻译
现有的基于深度学习的差异融合方法可以实现最先进的性能,但它们需要地面实况差异数据。据我所知,这是第一次提出不使用地面实况差异数据的无监督差异融合。本文提出了一种视差融合的数学模型,用于指导对抗网络在没有地面实况差异数据的情况下进行有效训练。初始视差图从左视图连同辅助信息(梯度,左和右强度图像)一起输入到细化器中,并且训练细化器以输出在左视图上登记的细化视差图。左侧视差图和左侧强度图用于重建右侧强度图像。最后,伪造的和真实的右侧强度图像(来自右侧立体视觉相机)被馈送到鉴别器中。在模型中,精炼器被训练以输出接近用于全局初始化的差异输入的加权和的精细差异值。然后,采用三个细化原则来进一步细化结果。 (1)伪造和真实权利强度图像之间的构造强度误差最小化。 (2)虚假和真实右图像之间的相似性无关紧要的感受野最大化。 (3)基于相应的强度图像对精细视差图进行平滑。对抗性网络的体系结构对于融合任务是有效的。使用所提出的网络的融合时间很小。当输入分辨率为1242 * 375(宽度*高度)而没有下采样和裁剪时,网络可以在Kitti2015数据集上使用Nvidia GeforceGTX 1080Ti实现90 fps。这项工作的准确性等于(或优于)最先进的监督方法。
translated by 谷歌翻译
本文提供了一种提高REINFORCE培训过程效率的新方法。我们将它应用于distantsupervision中的实例选择任务。将一个包中的实例选择建模为顺序决策过程,训练强化学习代理以确定实例是否有价值并构建具有较少噪声实例的新包。然而,无偏见的方法,例如REINFORCE,通常需要花费很长时间来训练。本文采用后验正则化(PR),在实例选择中使用REINFORCE整合了一些特定领域的规则。实验结果表明,该方法显着提高了清理远程监督数据集训练的相关分类器的性能以及REINFORCE训练的效率。
translated by 谷歌翻译
基于神经网络的深度学习技术已经在各种AI任务中获得了显着的成功。大规模培训数据集是其成功的关键因素之一。但是,当训练数据集来自个人并包含敏感信息时,模型参数可能会编码私人信息并承担隐私信息的风险。最近发展的预先培训模式的共享和发布趋势进一步加剧了这种隐私风险。为了解决这个问题,我们提出了一种用于训练神经网络的差异私有方法。 Ourapproach包括几种用于优化隐私丢失和模型准确性的新技术。我们采用差异隐私的概括,称为集中差异隐私(CDP),对两种不同的数据批处理方法进行了正式和精细的私有化分析。我们在培训过程中实施动态隐私预算分配器,以提高模型的准确性。大量实验表明,我们的方法有效地改善了特定隐私预算下的隐私损失会计,培训效率和模型质量。
translated by 谷歌翻译
曲线文本或任意形状文本在实际场景中非常常见。在本文中,我们提出了一种新的框架,其中使用局部分割网络(LSN),然后是曲线连接,以水平,定向和弯曲形式检测文本。 LSN由两个元素组成,即,建议生成以获得与文本和文本分段具有高重叠的水平矩形提议,以在提案内找到任意形状文本区域。然后设计曲线连接以将本地掩模连接到检测结果。我们使用所提出的框架对两个真实世界的曲线文本检测数据集进行实验,并证明了之前方法的有效性。
translated by 谷歌翻译