光学相干断层扫描(OCT)是一种非侵入性成像模式,其广泛用于临床眼科学。 OCT图像能够可视化深层视网膜层,这对于视网膜病变的早期诊断至关重要。在本文中,我们描述了一个全面的开放存取数据库,包含500多个分类为不同病理状况的高分辨率图像。图像类别包括正常(NO),黄斑裂孔(MH),年龄相关性黄斑变性(AMD),中央浆液性视网膜病变和糖尿病性视网膜病变(DR)。这些图像是从光栅扫描协议获得的,扫描长度为2mm,分辨率为512×1024像素。我们还包括25个正常OCT图像及其相应的地面实况描绘,可用于准确评估OCT图像分割。
translated by 谷歌翻译
我们考虑高维数据点y的最大似然分类问题到数十亿个类$ x_1,...,x_N $,其中条件概率p(y | x)是已知的。在最一般的情况下,这种分类的蛮力方法的复杂性随着类别N的数量呈线性增长,O(N)。引入了有效的多类分类方法来解决这个具有对数复杂度的问题。然而,这些方法受到影响。从维度的诅咒,即在大尺寸中,它们的复杂性接近每个查询数据点$ O(N)$。在条件概率分布$ p(y | x)$是以x为中心的高斯的特殊情况下,即$ p(y | x)\ propto N(x,\ sigma)$,最大似然分类减少到最近邻居用欧几里德规范搜索。已经引入了基于局部敏感散列(LSH)的次线性方法来求解高维数据的近似邻域的近似版本。受这些进步的启发,我们在这里引入了分布敏感散列(DSH)来通过联合维数减少来求解最大似然分类问题的近似版本。在离散概率分布的情况下,我们设计了TriSH,这是一个基于决策树的通用分布敏感哈希族,并表明它们的复杂性呈亚线性增长。本文提出的理论和模拟表明,TreeDSH比LSH-hamming和Min-Hashing方案更有效。最后,我们将TreeDSH应用于质谱数据中肽识别的问题。
translated by 谷歌翻译
与DSLR相机相比,智能手机相机具有更小的传感器,这限制了它们的空间分辨率;较小的孔径,限制了它们的光收集能力;和更小的像素,这降低了它们的信噪比。使用滤色器阵列(CFA)需要去马赛克,这进一步降低了分辨率。在本文中,我们使用多帧超分辨率算法取代传统的去帧在单帧和连拍摄影管道中的应用,该算法直接从CFA原始图像的突发中创建完整的RGB图像。我们利用手持式摄影中典型的自然手震,获得一小段偏移的原始帧。然后对齐并合并这些帧以在每个像素位置处形成具有红色,绿色和蓝色值的单个图像。这种方法不包括显式去掩蔽步骤,用于增加图像分辨率和提高信号噪声比。我们的算法对于具有挑战性的场景条件具有鲁棒性:局部运动,遮挡或场景变化。它在大规模生产的手机上以每12百万像素RAW输入突发帧100毫秒运行。具体来说,该算法是Super-Res Zoom功能的基础,以及Night Sight模式中的默认合并方法(无论是否缩放) onGoogle的旗舰手机。
translated by 谷歌翻译
基于超分辨率卷积神经网络(SRCNN)的单图像超分辨率(SISR)技术应用于砂岩和碳酸盐岩的微观计算机断层扫描({\ mu} CT)图像。数字岩石成像受扫描装置的能力限制,导致分辨率和视野之间的折衷,并且在该研究中测试的超分辨率方法旨在补偿这些限制。 SRCNN模型SR-Resnet,EnhancedDeep SR(EDSR)和宽激活深度SR(WDSR)用于4x下采样图像的Digital RockSuper Resolution 1(DRSRD1)数据集,包括2000个高分辨率(800x800)原始微CT图像Bentheimer砂岩和碳酸盐岩。经过训练的模型应用于数据集中的验证和测试数据,与双三次插值相比,图像质量提高3-5 dB,所有测试模型均在0.1 dB范围内执行。差异图表明在训练模型范围内的图像中边缘锐度完全恢复,只有高频噪声相关的细节损失。我们发现,除了生成高分辨率图像之外,应用合成降级图像的超分辨率方法的有益副作用是去除图像噪声,同时恢复明显的锐度,这有利于分割过程。该模型还针对Bentheimer岩石的真实低分辨率图像进行了测试,并通过图像增强来解释自然噪声和模糊。在这些情况下,SRCNN方法可以作为图像分割的预处理器,这自然会导致未来进一步发展和训练直接分割图像的模型。 SRCNN对岩石图像的图像恢复质量明显高于传统方法,并表明SRCNN方法是数字岩石工作流程中可行的处理步骤。
translated by 谷歌翻译
成像中的反问题被广泛研究,多年来积累了各种策略,工具和理论。最近,这一领域受到了深度学习技术的出现的极大影响。其中一个贡献是本文的重点,是Ulyanov,Vedaldi和Lempitsky(2018)的深度图像优先(DIP)工作。 DIP提供了一种新的逆向正则化方法,通过强制从agiven深层架构合成恢复的图像而获得。虽然DIP已被证明是有效的,但与最先进的替代方案相比,其结果很短。在这项工作中,我们的目标是通过添加一个明确的先验来提升DIP,这丰富了整体的规划效应,以便获得更好的恢复图像。更具体地说,我们建议引入去噪正则化(RED)的概念,利用现有的去噪器来规范反问题。我们的工作展示了如何将两者(DeepRED)合并到一个高效的恢复过程,同时避免区分需要选择的降噪器,并导致非常有效的结果,证明了几个测试的反向异常。
translated by 谷歌翻译
我们研究了猜测游戏Mastermind的基于排列的变体的查询复杂性。在这个变体中,秘密是一对$(z,\ pi)$,它包含二进制字符串$ z \ in \ {0,1 \} ^ n $和$ \ pi $ $ [n] $的排列。必须通过询问$ x \ in \ {0,1 \} ^ n $形式的查询来揭示这些秘密。 Foreach这样的查询,我们返回得分\ [f_ {z,\ pi}(x):= \ max \ {i \ in [0..n] \ mid \ forall j \ leq i:z _ {\ pi( j)} = x _ {\ pi(j)} \} \ ,; \]即,$ x $的分数是$ x $和$ z $的最长公共前缀的长度,相对于$强加的顺序\ PI $。目标是最小化识别$(z,\ pi)$所需的查询数量。这个问题起源于黑盒优化启发式的研究,它被称为\ textsc {LeadingOnes}问题。在这项工作中,我们证明了该游戏的确定性和随机查询复杂度的上下界匹配,分别是$ \ Theta(n \ log n)$和$ \ Theta(n \ log \ log n)$。
translated by 谷歌翻译
深度神经网络非常容易受到对抗性扰动。目前最先进的对抗性攻击方法通常需要非常耗时的超参数调整,或者需要多次迭代来解决基于优化的对抗性攻击。为了解决这个问题,我们提出了一系列基于信任区域的对抗性攻击,其目标是有效地计算对抗性扰动。我们基于信任区域优化方法的变体提出了几种攻击。我们使用包括AlexNet,ResNet-50,VGG-16和DenseNet-121模型在内的几种不同模型测试了Cifar-10和ImageNet数据集的建议方法。我们的方法与Carlini-Wagner(CW)攻击相比具有可比性,但对于Titan XpGPU上的VGG-16模型,其速度可达37美元以上。对于ImageNet上ResNet-50的情况,我们可以将其分类精度降低到小于0.1%,最多只需1.5美元\%$相对$ L_ \ infty $(或$ L_2 $)扰动,相比之下只需1.02美元CW攻击$ 27.04 $秒。我们开源了我们的方法,可以在[1]中获得。
translated by 谷歌翻译
最佳参数初始化仍然是神经网络训练的关键问题。较差的权重初始化可能需要更长的时间来训练和/或收敛到次优解决方案。在这里,我们提出了一种通过在训练过程中重复退火和注入噪声来重新初始化的方法。通过贝叶斯神经网络训练推动的周期性批量计划来实现这一点。我们通过对语言建模,自然语言推理和图像分类中的任务进行深入的实验来评估我们的方法。我们展示了我们的方法能够将语言建模性能提高多达7.91,并将训练迭代次数减少多达$ 61 \%$,此外还具有enablingsnapshot集成和使用对抗训练的灵活性。
translated by 谷歌翻译
增加随机梯度下降的小批量大小为减少挂钟培训时间提供了显着的机会,但是存在许多阻碍该技术广泛使用的理论和系统挑战。我们通过对跨多个架构和问题域的网络培训进行广泛的实证分析,包括图像分类,图像分割和语言建模,研究这些问题,重点是收敛时间和总计算成本。虽然为了充分利用可用的计算资源来增加批量大小是常见的做法,但我们发现了一个基本上更加丰富的图片。我们的主要发现是,在广泛的网络体系结构和问题域中,将批量大小增加到超过某个特定点时,不会减少挂接时间到\ emph {}}列车或测试丢失的收敛时间。该批量通常大大低于当前系统的容量。我们表明,在我们可以填充所有可用的计算资源之前,大批量优化的流行培训策略开始失败,并且我们表明这些方法分解的点更多地取决于模型体系结构和数据复杂性等属性,而不是直接依赖于模型体系结构和数据复杂性的大小。数据集。
translated by 谷歌翻译
我们提出了一种多模态数据融合方法,通过获得$ M + 1 $ dimensiontensor来考虑$ M $模态和神经网络模型的输出层之间的高阶关系。应用基于模态的张量因子化方法,该方法对不同的模态采用不同的因子,导致相对于模型输出去除冗余信息,并导致更少的模型参数,同时性能损失最小。该分解方法用作正则化器,其导致不太复杂的模型并避免过度拟合。此外,基于模态的因子化方法有助于理解每种模态的有用信息量。我们已将该方法应用于三种不同的多模态数据集的遗传分析,人格特质识别和情感识别。结果表明,与所有技术领域的最新技术相比,该方法在几项评估指标上的效率提高了1%至4%。
translated by 谷歌翻译