我们解决了从单个RGB图像自动重建场景的完整3D模型的问题。这项具有挑战性的任务需要推断出可见和遮挡表面的形状。我们的方法利用以观察者为中心的多层表示场景几何图形,从最近的方法改编为单个对象形状完成。为了提高复杂场景的以视图为中心的表示的准确性,我们引入了一种新颖的“极线特征变换器”,它将卷积网络特征从输入视图传输到其他虚拟摄像机视点,从而更好地覆盖3D场景几何。与首先在3D中检测和定位对象,然后使用类别特定模型推断对象形状的现有方法不同,我们的方法是完全卷积的,端到端可微分的,并且避免了体素表示的分辨率和存储器限制。我们展示了多层深度表示和极势变换器在重建大型室内数据库中的优势。
translated by 谷歌翻译
深度学习研究的长期目标是精确地描述培训和概括。然而,神经网络经常复杂的损失景观使学习动力学理论变得难以捉摸。在这项工作中,我们表明,对于广泛的神经网络,学习动力学显着简化,并且在无限宽度限制中,它们由一个线性模型控制。网络初始参数的一阶泰勒展开式。此外,镜像宽贝叶斯神经网络和高斯过程之间的对应关系,具有平方损失的宽神经网络的基于梯度的训练产生了从具有特定组成核的高斯过程绘制的测试集预测。虽然这些理论结果仅在无限宽度限制中是精确的,但我们仍然发现原始网络的预测与线性化版本的预测之间存在极好的经验一致性,即使对于有限的实际大小的网络也是如此。该协议在不同的体系结构,优化方法和损失函数方面都很强大。
translated by 谷歌翻译
本文描述了神经网络,一个用于神经网络和深度学习的并行Fortran框架。它具有简单的界面,可构建任意结构和大小的前馈神经网络,severalactivation函数和随机梯度下降作为默认优化算法。 Neural-fortran还利用Fortran 2018标准集合子程序在共享或分布式内存机器上实现基于数据的并行性。首先,我描述了使用Fortran派生类型,全数组算法和集体命令广播操作实现神经网络以实现并行性。其次,我在一个从图像中识别手写数字的例子中演示了使用neur-fortran。最后,我评估了串行和并行模式的计算性能。易用性和计算性能类似于现有的流行机器学习框架,使得神经堡垒成为进一步开发和用于生产的可行候选者。
translated by 谷歌翻译
正确地评估对抗对抗性例子的防御已经证明是非常困难的。尽管最近大量的工作试图设计出能够抵御自适应攻击的防御措施,但很少有人成功;提出防御的大多数报纸很快被证明是不正确的。我们认为,一个重要的因素是进行安全评估的难度。在本文中,我们讨论了方法论基础,回顾了普遍接受的最佳实践,并提出了评估对抗性例子的新方法。我们希望研究发展方面的研究人员以及希望了解评估完整性的读者和评论者都要考虑我们的建议,以避免常见的弊端。
translated by 谷歌翻译
高光谱图像(HSI)分类广泛用于分析遥感图像。高光谱图像包括不同的图像带。卷积神经网络(CNN)是最常用的基于深度学习的视觉数据处理方法之一。在最近的工作中也可以看到CNN用于HSI分类。这些方法主要基于2D CNN。然而,HSI分类性能高度依赖于空间和光谱信息。由于计算复杂性增加,很少有方法利用3D CNN。该信提出了用于HSI分类的混合光谱卷积神经网络(HybridSN)。基本上,HybridSN是频谱空间3D-CNN,其后是空间2D-CNN。 3D-CNN促进来自一叠光谱带的联合空间光谱特征表示。 3D-CNN顶部的2D-CNN进一步学习更抽象的空间表示。此外,与单独的3D-CNN相比,使用混合CNN降低了模型的复杂性。通过这种混合方法的表现,在Indian Pines,Pavia University和Salinas Sceneremote传感数据集上进行了非常严格的HSI分类实验。将结果与最先进的手工制作以及端到端深度学习方法进行比较。使用所提出的用于HSI分类的HybridSN获得了令人满意的性能。源代码可以在\ url {https://github.com/gokriznastic/HybridSN}找到。
translated by 谷歌翻译
我们展示了第一种可能的子线性记忆草图,它可以解决近似的近邻搜索问题。特别是,我们开发了一个在线草图算法,它可以将$ N $向量压缩成一个小型草图,由一小部分计数器组成,其大小标度为$ O(N ^ {b} \ log ^ 2 {N})$,其中$ b < 1 $取决于近邻搜索的稳定性。该草图足以识别具有高概率的顶级$ v $近邻。据我们所知,这是第一个破坏线性内存($ O(N)$)障碍的近邻搜索算法。我们通过将基于局部敏感性散列(LSH)的估计(尤其是最近发布的ACE算法)与压缩感知和重击电技术相结合,实现了子线性存储器。我们提供强有力的理论保证;特别是,我们的分析揭示了近邻搜索设置中的内存准确性权衡以及压缩感知中稀疏性的作用,这可能是独立的兴趣。大力评估我们的框架,我们在Google plus图表上的朋友推荐任务上称为RACE(重复ACE)数据结构,其中包含超过100,000个高维向量。 RACE提供的压缩比基于随机投影的替代方案更好,这是理论上的优势,这是令人惊讶的。我们预计RACE将为近邻搜索提供新的理论视角,并为高速数据挖掘,物联网(IoT)等应用提供新方法。
translated by 谷歌翻译
据我们所知,我们报告了生成对抗网络(GAN)的第一次端到端应用,用于合成视网膜的光学相干断层扫描(OCT)图像。在给定数据类型的采样时,生成模型已经获得了他们可以合成的越来越逼真的图像的最近的注意力。在本文中,我们将GAN应用于视网膜OCT的采样分布。我们观察到现实OCT图像的合成,描绘了可识别的病理学,例如黄斑裂孔,脉络膜血管膜,近视变性,黄斑囊样水肿和中心性视网膜病变等。这是其第一次这样的报道。这项新技术的潜在应用包括手术模拟,治疗计划,疾病预测,以及加速开发新药和治疗视网膜疾病的外科手术。
translated by 谷歌翻译
这项工作研究土耳其语中非正式短文的情感分析的分割方法。提出的工作分区和深度神经网络模型的两个构建块。分段侧重于使用不同方法对文本进行预处理。这些方法分组为:形态学,子词,标记化和混合方法。我们分析了这四种方法中的每一种的几种变体。第二阶段重点评估用于情绪分析的神经模型。在文献中提出的用于情感分类的卷积神经网络(CNN)和逆流神经网络(RNN)模型下评估每种分割方法的性能。
translated by 谷歌翻译
预测自然图像中的显着区域需要检测场景中存在的对象。为了为这项具有挑战性的任务开发强大的表示,必须通过上下文信息提取和扩充多个空间尺度的高级视觉特征。然而,旨在解释人类固定图的现有模型并未明确地包含这样的机制。在这里,我们提出了一种基于在大规模图像分类任务上预训练的卷积神经网络的方法。该体系结构形成编码器 - 解码器结构,并包括具有不同扩张率的多个卷积层的模块,以并行捕获多尺度特征。此外,我们将得到的表示与全局场景信息相结合,以准确地预测视觉显着性。我们的模型在两个公共显着性基准上获得了竞争性结果,并且我们证明了所选方法的建议方法的有效性。该网络基于轻量级图像分类主干,因此为具有有限计算资源的应用程序提供了合适的选择,以便在复杂的自然场景中估计人类注视。
translated by 谷歌翻译
本文是Berkel和Lyon在2019年发表的“Cut-free Calculi and RelationalSemantics for Temporal STIT logics”一文的附录。它提供了基本STIT逻辑Ldm(相对于无反射,时间Kripke STIT帧)的完整性证明以及给出了逻辑Xstit的代理公理的独立性的推导。
translated by 谷歌翻译