为了研究是否可以使用深度学习技术评估在彩色眼底照片上描绘的中心性浆液性脉络膜视网膜病变(CSC)的程度和程度。我们收集了在不同主题上获得的总共2,504个眼底图像。我们使用相应的光学相干断层扫描(OCT)图像验证了这些图像的CSC状态。共有1,329张图片描绘了CSC。对这些图像进行预处理和标准化。将得到的数据集随机分成三部分,比例分别为8:1:1,用于训练,验证和测试目的。我们使用称为InceptionV3的深度学习架构来训练分类器。我们进行了非参数接收机操作特性(ROC)分析,以评估所开发算法识别CSC的能力。两个评价者之间的Kappa系数为0.48(p <0.001),而计算机和两个评价者之间的Kappa系数分别为0.59(p <0.001)和0.33(p <0.05)。我们的实验表明,基于深度学习的计算机算法以相对可靠和一致的方式评估彩色眼底照片上描绘的CSC。
translated by 谷歌翻译
目的:验证和比较八种可用的深度学习架构在基于colorfundus图像评估青光眼严重程度方面的表现。材料与方法:我们回顾性地收集了5978例眼底图像的数据集,并通过两位经验丰富的眼科医生的共识对其青光眼严重程度进行了注释。我们预处理图像以生成全局和局部感兴趣区域(ROI),即全局视场图像和局部盘区域图像。然后,我们将生成的图像分成三个独立的子组,用于训练,验证和测试目的。利用数据集,分别训练8个卷积神经网络(CNN)(即VGG16,VGG19,ResNet,DenseNet,InceptionV3,InceptionResNet,Xception和NASNetMobile)以评定青光眼严重程度,并使用接收器操作特征下的区域进行定量验证( ROC)曲线和二次kappa评分。结果:除VGG16和VGG19外,CNNs在全球和局部ROI上的平均kappa评分分别为80.36%和78.22%,使用预训练后的体重分别为85.29%和82.72%。 VGG16和VGG19从头开始训练时达到了合理的准确度,但是当使用预训练的权重进行全球和本地ROI时,它们都失败了。在这些CNN中,使用全球ROI时,基于预先训练的权重,密集网具有最高的分类准确度(即75.50%),而使用本地ROI时则为65.50%。结论:实验证明了深度学习技术在评估青光眼严重程度方面的可行性。特别是,全球视野图像包含相对更丰富的信息,这些信息可能对青光眼评估至关重要,这表明我们应该使用眼底图像的整个视野​​来训练深度学习网络。
translated by 谷歌翻译
本研究旨在使用深度卷积神经网络自动诊断在x射线(CXR)图像上描绘的胸部疾病。现有方法通常将整个CXR图像用于训练目的,但是这种策略可能存在两个缺点。首先,整个CXR图像中潜在的未对准或不相关对象的存在可能导致不必要的噪声,从而限制网络性能。其次,由调整大小操作引起的相对低的图像分辨率(其是用于训练神经网络的常见预处理过程)可能导致图像细节的丢失,使得难以检测具有小病变区域的病理。为了解决这些问题,我们提出了一种新方法,称为基于分割的融合网络(SDFN),它利用了局部肺区域的高分辨率信息。具体而言,通过肺部发生器(LRG)识别并分配局部肺区域。然后将两个基于CNN的分类模型用作特征提取器以获得整个CXR图像和裁剪的肺部区域图像的辨别特征。最后,通过特征融合模块对获得的特征进行融合,进行疾病分类。通过NIH基准分割对胸部X射线14数据集的评价,实验结果表明,与现有方法相比,所开发的方法通过接受者操作特征实现了更准确的疾病分类。 (ROC)分析。还发现,与传统方法相比,SDFN可以更精确地定位病变区域。
translated by 谷歌翻译
基于神经网络的深度学习技术已经在各种AI任务中获得了显着的成功。大规模培训数据集是其成功的关键因素之一。但是,当训练数据集来自个人并包含敏感信息时,模型参数可能会编码私人信息并承担隐私信息的风险。最近发展的预先培训模式的共享和发布趋势进一步加剧了这种隐私风险。为了解决这个问题,我们提出了一种用于训练神经网络的差异私有方法。 Ourapproach包括几种用于优化隐私丢失和模型准确性的新技术。我们采用差异隐私的概括,称为集中差异隐私(CDP),对两种不同的数据批处理方法进行了正式和精细的私有化分析。我们在培训过程中实施动态隐私预算分配器,以提高模型的准确性。大量实验表明,我们的方法有效地改善了特定隐私预算下的隐私损失会计,培训效率和模型质量。
translated by 谷歌翻译
曲线文本或任意形状文本在实际场景中非常常见。在本文中,我们提出了一种新的框架,其中使用局部分割网络(LSN),然后是曲线连接,以水平,定向和弯曲形式检测文本。 LSN由两个元素组成,即,建议生成以获得与文本和文本分段具有高重叠的水平矩形提议,以在提案内找到任意形状文本区域。然后设计曲线连接以将本地掩模连接到检测结果。我们使用所提出的框架对两个真实世界的曲线文本检测数据集进行实验,并证明了之前方法的有效性。
translated by 谷歌翻译
Learning a generative model from partial data (data with missingness) is a challenging area of machine learning research. We study a specific implementation of the Auto-Encoding Variational Bayes (AEVB) algorithm, named in this paper as a Variational Auto-Decoder (VAD). VAD is a generic framework which uses Variational Bayes and Markov Chain Monte Carlo (MCMC) methods to learn a generative model from partial data. The main distinction between VAD and Varia-tional Auto-Encoder (VAE) is the encoder component , as VAD does not have one. Using a proposed efficient inference method from a multivari-ate Gaussian approximate posterior, VAD models allow inference to be performed via simple gradient ascent rather than MCMC sampling from a probabilistic decoder. This technique reduces the inference computational cost, allows for using more complex optimization techniques during latent space inference (which are shown to be crucial due to a high degree of freedom in the VAD latent space), and keeps the framework simple to implement. Through extensive experiments over several datasets and different missing ratios, we show that encoders cannot efficiently marginalize the input volatility caused by imputed missing values. We study multimodal datasets in this paper , which is a particular area of impact for VAD models.
translated by 谷歌翻译
我们工作的目标是在不使用任何注释的情况下发现主要对象。我们专注于在严格的一般设置中执行无监督的对象发现和本地化,其中仅给出单个图像。这比典型的共定位或弱监督本地化任务更具挑战性。为了解决这个问题,我们提出了一种简单但有效的基于模式挖掘的方法,称为对象挖掘(OM),它利用了数据挖掘的优势和预先训练的卷积神经网络(CNN)的特征表示。具体而言,对象挖掘首先将特征映射从预先训练的CNN模型转换为一组事务,然后通过模式挖掘技术从事务数据库中发现频繁模式。我们观察到那些发现的模式,即共现突出区域,通常具有外观和空间一致性。受此观察的启发,我们可以通过以无人监督的方式合并相关的有意义的模式,轻松地发现和本地化可能的对象。对各种基准测试的广泛实验表明,与最先进的方法相比,Object Mining实现了竞争性能。
translated by 谷歌翻译
步态是一个人的自然行走方式和复杂的生物过程,每个人都是独一无二的。最近,已经利用WiFi设备的信道状态信息(CSI)来捕获用于用户识别的人体步态生物特征。然而,现有基于CSI的步态识别系统的性能远非令人满意。它们只能为一小部分人(即2到10人之间)达到有限的识别准确度(最高$ 93 \%$)。为了应对这样的挑战,开发了端到端的深度CSI学习系统,利用深度神经网络自动学习CSI数据中的显着步态特征,这些特征足以区分不同的人。首先,通过基于窗口的去噪对原始CSI数据进行消毒处理然后,将经过消毒的数据传递给残余深度卷积神经网络(DCNN),该神经网络自动提取嵌入在CSI数据中的分数特征的分层特征。最后,softmax分类器利用提取的特征来进行关于用户身份的最终预测。在典型的室内环境中,对于30人的数据集,可实现$ 97.12 \ pm1.13 \%$的前1精度。
translated by 谷歌翻译
我们确定了鲁棒性和准确性之间的权衡,这是在设计防御对抗性实例时的一个主要原则。虽然这个问题已经在经验上得到广泛研究,但仍有许多未知关注这种权衡的理论基础。在这项工作中,我们根据对抗性示例的风险与非对抗性示例的风险之间的差距来量化交易。挑战是在代理损失方面提供这个数量的紧密限制。我们根据分类校准损失给出该数量的最佳上限,其与最坏情况下的下限匹配。在我们的理论分析的启发下,我们还设计了一种新的防御方法TRADES,以对抗对抗性,而不是准确性。我们提出的算法在实际数据集中实验性地表现良好。该方法论是我们进入神奇的2018年对抗视觉挑战赛的基础,我们在强劲的模型赛道中赢得了1,995份参赛作品中的第一名,以平均$ $ ell_2 $的价格超过亚军奖金$ 11.41 \%$扰动距离。
translated by 谷歌翻译
远程监督利用知识库自动标记实例,从而允许我们在没有人工注释的情况下训练关系提取器。然而,生成的训练数据通常包含大量噪声,并且可能导致香草监督学习的不良表现。在本文中,我们建议进行具有新的交叉关系交叉包选择性注意(C $ ^ 2 $ SA)的多实例学习,这导致​​对远程监督关系提取器的tonoise-robust训练。具体来说,我们采用句子级选择性注意来减少噪声不匹配句子的影响,同时捕捉关系之间的相关性以提高注意力量的质量。而且,我们不是平等地对待同等对偶,而是试图更加关注具有更高质量的实体对。同样,我们采用选择性注意机制来实现这一目标。两种类型的关系提取器的实验证明了所提出的方法优于现有技术的优越性,而进一步的消融研究验证了我们的直觉并证明了我们提出的两种技术的有效性。
translated by 谷歌翻译