深度尖峰神经网络(SNN)支持异步事件驱动计算,大规模并行性,并显示出提高其同步模拟对应的能量效率的巨大潜力。然而,在设计SNN学习规则时,神经编码的注意力不足。值得注意的是,时间信用分配已经在速率编码的尖峰输入上进行,导致学习效率低下。在本文中,我们引入了一种新的基于尖峰的速率编码深度SNN学习规则,其中每个神经元的尖峰数被用作梯度反向传播的替代。我们通过在UCI机器学习和MNIST手写数字数据集上训练深度尖峰多层感知器(MLP)和尖峰卷积神经网络(CNN)来评估所提出的学习规则。我们展示了所提出的学习规则在allbenchmark数据集上实现了最先进的精度。所提出的学习规则允许将延迟,尖峰速率和硬件约束引入到SNN学习中,这优于间接方法,其中传统的人工神经网络首先被训练然后被转换为SNN。因此,它允许直接部署到神经形态硬件并支持有效推理。值得注意的是,在我们的实验中,只有10个模拟时间步长,当训练时施加相同的延迟约束时,MNIST数据集的测试精度达到98.40%。
translated by 谷歌翻译
在本文中,我们提出了一种新的甲状腺细胞病理学WSIs高效滤泡分离方法。首先,我们提出了一种混合分段架构,它通过添加分支将分类器集成到Deeplab V3中。通过使用分类分支来浏览不相关区域,节省了大量的WSI分段时间。其次,将Deeplab V3中的低尺度精细特征融入到原始的空间金字塔空间(ASPP)中,以准确地表示细胞病理图像。第三,我们的混合模型采用面向准则的自适应损失函数进行训练,使模型收敛速度更快。对甲状腺贴片的实验结果表明,所提出的模型在分割精度上达到80.9%。此外,采用我们提出的方法,WSI分割的时间减少了93%,WSI水平精度达到53.4%。
translated by 谷歌翻译
深度神经网络允许融合多种模式的高级特征,并已成为多模态融合的有前途的端到端解决方案。虽然最近提出的门控架构改进了CNN中采用的常规融合机制,但这些模型并不总是特别容易出现传感器故障。本文表明现有的门控体系结构无法有力地学习批判性地控制不同模态的融合权重,从而导致问题的重要性不一致。我们提出了一种新的门控结构,它通过引入辅助模型来规范主模型,从而可以有力地学习每种感觉模态的融合权重。因此,这种新的辅助模型调节架构及其变体在传感器故障导致的清洁和损坏的传感输入下优于现有的非门控和门控融合架构。在后一种情况下,获得的性能增益相当显着。
translated by 谷歌翻译
仿真系统已成为自动驾驶技术开发和验证的重要组成部分。流行的最先进的模拟方法是使用游戏引擎或高保真计算机图形(CG)模型来创建驾驶场景。然而,创建CG模型和车辆运动(例如,用于模拟的资产)仍然是手动任务,这可能是昂贵且耗时的。此外,CG图像的保真度仍然缺乏现实世界图像的丰富性和真实性,并且使用这些图像进行训练会导致性能下降。在本文中,我们提出了一种解决这些问题的新方法:增强自主驾驶模拟(AADS)。我们的配方通过模拟交通流量增强了真实世界的图像,以创建照片般逼真的模拟图像和渲染。更具体地说,我们使用LiDAR和相机来扫描街道场景。从获得的轨迹数据中,我们为汽车和行人产生高度合理的交通流,并将它们组合成背景。合成图像可以用不同的视点和传感器模型重新合成。由此产生的图像是照片般逼真的,完全注释的,并且可以用于自动驾驶系统的端到端训练和测试,以及规划。我们通过检测分类和预测来解释我们的系统设计并验证具有许多自动驾驶任务的算法。与传统方法相比,我们的方法提供了无与伦比的可扩展性和真实性。可扩展性对于AD模拟和网络来说尤为重要,现实世界的复杂性和多样性无法在虚拟环境中实际捕获。我们的增强方法将虚拟环境中的灵活性(例如,车辆运动)与现实世界的热度相结合,以允许有效模拟地球上的任何地方。
translated by 谷歌翻译
协同过滤(CF)是推荐系统(RS)的关键技术。 CF仅利用用户项行为交互(例如,点击)并且因此遭受数据稀疏性问题的困扰。一个研究主题是整合诸如产品评论和新闻标题之类的辅助信息,从而导致混合过滤方法。另一个线索是从其他源域转移知识,例如利用书籍领域的知识改进电影推荐,从而导致转移学习方法。在现实世界中,没有一种服务可以满足用户的所有信息需求。因此,本文探讨了利用RS的辅助信息和源信息的动机。我们提出了一种新颖的神经模型,可以平滑地实现转发会议混合(TMH)方法,以端到端的方式使用非结构化文本进行跨域推荐。 TMH通过内存模块专注地从非结构化文本中提取有用内容,并通过atransfer网络选择性地从源域传输知识。在两个真实世界的数据集中,通过与各种基线进行比较,TMH显示了三个排名指标的更好的性能中间。我们进行了大量分析,以了解文本内容和传递的知识如何帮助我们提出模型。
translated by 谷歌翻译
本文重点介绍一项新任务,即将特定于任务和特定任务的神经网络移植到通用的模块化网络中,而无需严格的监督。我们为通用网络设计了一个功能可解释的结构。与构建乐高积木一样,我们通过直接移植与预先训练的网络相对应的类别的模块来教授通用网络一个新类别,其中一些甚至没有样本注释。我们的方法逐步向通用网络添加新类别,但不影响现有类别的表示。通过这种方式,我们的方法打破了为大量任务和类别学习网络的典型瓶颈,即在学习开始之前的同一时间收集所有任务和类别的样本的要求。因此,我们使用新的蒸馏算法,即反蒸馏,以克服网络转移的特定挑战。我们没有训练样本的方法甚至超过了100个训练样本的基线。
translated by 谷歌翻译
布局对于图形设计和场景生成很重要。我们提出了一种称为LayoutGAN的新型生成对抗网络,它通过对不同类型的2D元素的几何关系进行建模来合成布局。 LayoutGAN的生成器将一组随机放置的2D图形元素作为输入,并使用自注意模块共同细化其标签和几何参数,以产生逼真的布局。准确的对齐对于良好的布局至关重要。因此,我们提出了一种新颖的可区分线框图,它将生成的布局映射到线框图像,基于CNN的鉴别器用于优化图像空间中的布局。我们在各种实验中验证LayoutGAN的有效性,包括MNISTdigit生成,文档布局生成,剪贴画抽象场景生成和七巧板图形设计。
translated by 谷歌翻译
路面裂缝检测是确保道路安全的关键任务。 Manualcrack检测非常耗时。因此,需要一种自动道路裂缝检测方法来促进这一进步。然而,由于裂缝的强度不均匀性和背景的复杂性,例如与周围路面的低对比度和具有相似强度的可能阴影,它仍然是具有挑战性的任务。受深度学习计算机视觉的最新进展的启发,我们提出了一种新的网络体系结构,称为特征金字塔和层次提升网络(FPHBN),用于路面裂缝检测。所提出的网络将语义信息集成到用于以特征金字塔方式进行裂缝检测的低级特征。并且,它通过嵌套样本重新加权以分层方式平衡了简单和硬样本对损失的贡献。为了证明所提方法的优越性和通用性,我们对五种裂缝数据集进行了评估,并与现有的裂缝检测,边缘检测,语义分割方法进行了比较。大量实验表明,所提出的方法在准确性和通用性方面优于这些最先进的方法。
translated by 谷歌翻译
编码器 - 解码器架构是用于生物医学图像分割的主流深度学习模型。编码器完全压缩输入并生成编码特征,然后解码器使用编码特征生成密集预测。然而,解码器仍未在结构中进行探索。在本文中,我们全面研究了最先进的编码器 - 解码器架构,并提出了一种新的通用解码器,称为级联解码器,以提高语义分割的准确性。我们的级联解码器可以嵌入到现有网络中,并以端到端的方式完全训练。级联解码器结构旨在对分层编码的特​​征进行更有效的解码,并且与已知解码器的公共编码更加兼容。我们使用我们的级联解码器替换最先进模型的解码器,用于几个具有挑战性的生物医学图像分割任务,并且所实现的显着改进证明了我们的新解码方法的功效。
translated by 谷歌翻译
在开发机器学习算法来解决实际问题时,预测精度和模型可解释性是两个最重要的目标。已知神经网络具有良好的预测性能,但缺乏足够的模型可解释性。在本文中,我们建议通过以下架构约束来增强神经网络的可解释性:a)稀疏加性子网; b)正交投影追踪; c)平滑函数近似。它导致稀疏,正交和平滑的可解释神经网络(SOSxNN)。 SOSxNN模型中的多个参数通过基于反向传播技术的改进的小批量梯度下降算法同时估计,用于计算导数和Cayley变换以保持投影正交性。控制稀疏和平滑约束的超参数通过网格搜索进行优化。通过仿真研究,我们将SOSxNN方法与几种基准方法进行比较,包括最小绝对收缩和选择算子,支持向量机,随机森林和多层感知器。结果表明,所提出的模型保持了追求预测精度的灵活性,同时获得了改进的可解释性,因此可以作为复杂模式近似的有前途的替代模型。最后,来自Lending Club的真实数据示例被用作SOSxNN应用程序的展示。
translated by 谷歌翻译