我们在卷积神经网络(CNN)中显示隐式滤波器级稀疏性表现,其使用批量归一化和ReLU激活,并且利用自适应梯度下降技术和L2正则化或权重衰减来训练。通过广泛的实证研究(Mehta et al。,2019),我们假设了稀疏化过程背后的机制,并发现与文献中提出的某些过滤器稀疏化启发式相关联。选择性特征的出现和随后的修剪被认为是有贡献的机制之一,导致特征稀疏性比某些明确的稀疏/修剪方法更好或更好。在本研讨会文章中,我们总结了我们的研究结果,并指出了选择性特征化的推论,这些推论也可以用作过滤修剪的启发式方法。
translated by 谷歌翻译
在拣选场景中,感兴趣对象的多个实例随机堆叠在堆中,因此,实例本身就受到挑战:严重遮挡,杂乱和类似外观的干扰物。然而,大多数现有方法对于单个孤立的对象实例,而一些最近的方法将人群场景作为后期细化来处理多个对象关系。在本文中,我们通过深度神经网络中的多任务学习来解决在深度模态中的拾取场景中恢复多个实例的6D姿态。我们的架构共同学习多个子任务:单个对象的2D检测,深度和3D姿态估计;以及多个对象的联合注册。对于训练数据生成,物理可信对象姿势配置的深度图像由物理模拟中的3D对象模型生成,其产生不同的遮挡模式以进行学习。我们采用最先进的物体探测器,并通过网络进一步估算2D偏移,以改善未对准的2D探测。 depthand 3D姿势估计器被设计用于生成多个假设检测。这允许联合注册网络学习遮挡模式并移除物理上难以置信的姿势假设。我们对合成(我们自己的和Sileane数据集)和real(publicBin-Picking数据集)数据应用了结构,表明它的平均精度显着高于最先进的方法15-31%。
translated by 谷歌翻译
我们提出了一种新的预测器组合算法,该算法基于潜在相关的参考预测器来改进给定的任务预测器。现有方法的局限性在于,为了发现潜在的任务依赖性,它们要么需要所有预测变量的已知参数形式,要么访问所有预测变量共同评估的单个固定数据集。为了克服这些限制,我们设计了一种新的非参数任务依赖性估计程序,该程序自动对齐不相交特征集的异构预测器的评估。我们的算法被实例化为一个强大的流形扩散过程,它共同改进了估计的预测分配和相应的任务依赖性。我们将该算法应用于相对属性排序问题,并证明它不仅扩展了预测器组合方法的应用范围,而且即使应用于经典预测器组合设置也优于现有方法。
translated by 谷歌翻译
本文介绍了深度增强学习在通信和网络中应用的综合文献综述。现代网络,例如物联网(IoT)和无人驾驶飞行器(UAV)网络,变得更加分散和自主。在这样的网络中,网络实体需要在本地制定决策以在网络环境的不确定性下最大化网络性能。强化学习已被有效地用于使网络实体能够获得最优策略,包括例如决策,当状态和动作空间很小时给定它们的状态。然而,在复杂和大规模网络中,状态和动作空间通常是大,加强学习可能无法在合理的时间内找到最优政策。因此,深入强化学习,强化学习与深度学习的结合,已经发展到克服缺点。在本次调查中,我们首先提供从基本概念到高级模型的深度强化学习教程。然后,提出深入的强化学习方法,以解决通信和网络中的新兴问题。问题包括动态网络访问,数据速率控制,无线缓存,数据卸载,网络安全和连接保存等,这对下一代网络(如5G及更高版本)都非常重要。此外,我们还介绍了深度增强学习在流量路由,资源共享和数据收集方面的应用。最后,我们重点介绍了应用深层强化学习的重要挑战,开放性问题和未来研究方向。
translated by 谷歌翻译
在RF供电的反向散射认知无线电网络中,多个二级用户通过反向散射或收获能量与二级网关通信,并根据主要信道状态主动发送其数据。为了协调多个辅发射机的传输,辅助网关需要调度它们之间的反向散射时间,能量收集时间和传输时间。然而,在主要信道的动态和次级发射机的能量状态的不确定性下,网关找到最大化总吞吐量的时间调度机制是具有挑战性的。在本文中,我们建议使用深度强化学习算法来导出网关的最优时间调度策略。具体来说,为了解决大型状态和动作空间的问题,我们采用双深度Q网络(DDQN)来维护网关以学习最优策略。仿真结果清楚地表明,所提出的深度强化学习算法在网络吞吐量方面优于非学习方案。
translated by 谷歌翻译
在本文中,我们根据语义属性的主观测量,研究了生成对抗网络在图像生成任务中的应用。与通过离散分类标签生成图像的标准(CGAN)不同,我们的架构可处理连续和离散标记。给定图像的成对比较,我们的模型,称为RankCGAN,执行两个任务:它学习使用主观测量对图像进行排名;并且它可以通过该措施控制生成模型。 RankCGAN将每个主观感兴趣的度量与一些特定空间的不同维度联系起来。我们在UT-Zap50K,PubFig和OSR数据集上进行实验,并证明该模型具有足够的表现力和多样性,可以进行两个属性的探索和图像编辑。
translated by 谷歌翻译
在本文中,我们提出了在编码器 - 解码器结构(EDiED)内包含小编码器 - 解码器的T-Net。 T-Net克服了U-Net只能在编码器和解码器块之间只有一组连接层的限制。更准确地说,U-Net对称地形成了连接层,因此编码器的低级特征连接到解码器的部分,并且高级特征连接到解码器的开始。 T-Net在编码器处理过程中适当地安排合并和上采样,同样在解码过程中,在单个块中获得各种尺寸的特征图。因此,所有特征从低级到高级 - 从编码器提取的电平从解码器的开始传送以预测更准确的掩模。我们评估了T-Net在冠状动脉造影图像中分割三个主要血管的问题。该实验包括在相同条件下对U-Net和T-Nets进行比较,以及针对主要血管分割的优化T-Net。结果,T-Net记录的DiceSimilarity系数得分(DSC)为0.815,比U-Net高0.095,优化的T-Net记录的DSC为0.890,比U-Net高0.170。此外,我们可视化T-Net和U-Net的卷积层的重量激活,以显示T-Net实际上预测了早期解码器的掩码。因此,我们期望T-Net可以有效地应用于其他类似的医学图像分割问题。
translated by 谷歌翻译
盲视频去除是一个问题,即自动删除文本覆盖并在没有任何输入掩码的情况下修复视频中的被遮挡部分。虽然基于修复方法的最新深度学习处理单个图像并且通常假设已损坏像素的位置是已知的,但我们的目标是在没有掩模信息的视频序列中自动删除文本。在本文中,我们提出了一个简单而有效的快速盲视频瞄准框架。我们构建了一个编码器 - 解码器模型,其中编码器采用多个源帧,可以提供从动态动力学中显示的可见像素。这些提示被聚合并馈送到解码器中。我们应用从输入帧到解码器输出的各种连接,以强制我们的网络只关注损坏的区域。我们提出的模型在ECCV Chalearn 2018 LAP修复竞赛第2轨道中排名第一:视频消除。此外,我们通过应用反复反馈进一步改进这一强大的模型。反复出现的反馈不仅可以强制执行时间一致性,还可以提供有关损坏像素位置的强有力线索。定性和定量实验都证明我们的全模型能够实时(50 + fps)产生准确且时间一致的视频结果。
translated by 谷歌翻译
最近成功的脑激发深度神经网络(DNN)在解决复杂的高级视觉任务方面已经导致人们对其与人类视觉系统匹配的潜力的期望越来越高。然而,DNN表现出的异性表明它们的视觉表现和处理可能与人类视觉完全不同。 DNN的一个限制是它们易受对抗性示例的影响,输入图像上添加了细微的,精心设计的噪声以欺骗机器分类器。人类视觉系统对抗对抗性示例的稳健性可能具有重要意义,因为它可以揭示机器视觉融合的关键机制特征。在这项研究中,我们通过利用功能磁共振成像(fMRI)比较DNN和人类中白色和黑盒对抗性实例的视觉表现。我们发现对于人类和DNN的不同(即白盒与黑盒)类型的对抗性示例的表示模式存在小但显着的差异。然而,与DNN不同,无论类型如何,人类对分类判断的表现都不会受到噪音的影响。这些结果表明,对抗性的例子可能会在人类视觉系统中出现,但不能影响感知体验。
translated by 谷歌翻译
视频修复旨在通过视频填充具有合理内容的时空漏洞。尽管用于图像绘制的深度神经网络取得了巨大进步,但是将这些方法扩展到视频域以及额外的时间维度是具有挑战性的。在这项工作中,我们提出了一种新的深度网络体系结构,用于快速视频修复。我们的框架基于图像 - 基础编码器 - 解码器模型,旨在从相邻帧收集和细化信息并合成仍然未知的区域。在同一时间,输出被强制执行以通过recurrentfeedback和时间内存模块在时间上一致。与最先进的图像绘制算法相比,我们的方法可以生成更加语义正确且时间平滑的视频。与先前的视频完成方法相比,该方法依赖于耗时的优化,我们的方法几乎实时地运行,同时产生竞争性视频结果。最后,我们将我们的框架应用于视频重定向任务,并获得视觉上令人满意的结果。
translated by 谷歌翻译