深度网络本质上消耗大量内存。我们可以在保持性能的同时减少内存需求。特别是,在这项工作中,我们解决了多个任务的记忆有效学习问题。为此,我们提出了一种新颖的网络体系结构,可以为不同的任务生成多个不同配置的网络,称为深度虚拟网络(DVN)。每个DVN都是专门的单一任务和分层结构。包含对应于不同数量的参数的多个层次结构的分层结构使得能够对不同的存储器预算进行多个推断。深度虚拟网络的构建块基于网络参数的不相交集合,我们将其称为单元。深度虚拟网络中最低级别的层次结构是一个单元,更高级别的层次结构包含较低级别的单元和其他附加单元。给定参数数量的预算,可以选择不同级别的深度虚拟网络来执行任务。一个单元可以由不同的DVN共享,允许单个网络中的多个DVN。此外,共享单元通过从其他任务中学到的额外知识为目标任务提供帮助。这种DVN的协作配置使得以记忆感知方式处理不同任务成为可能。我们的实验表明,所提出的方法优于现有的多任务方法。值得注意的是,我们的效率比其他任务更高,因为它允许对所有任务进行内存感知推理。
translated by 谷歌翻译
最近的稀疏MRI重建模型使用深度神经网络(DNN)从高度欠采样的k间距数据重建相对高质量的图像,从而实现更快的MRI扫描。然而,这些技术有时会重建锐利的图像,保留精细的细节,同时保持自然的外观。在这项工作中,我们通过使用条件Wasserstein生成对抗网络结合自适应梯度平衡技术来提高图像质量,该技术可以稳定训练并最大限度地减少伪影的程度,同时保持高质量的重建,产生比其他技术更清晰的图像。
translated by 谷歌翻译
人们所享有的本质不仅仅是创意产业的核心问题,而是文化演变的驱动力。人们普遍认为,成功的文化产品能够平衡新颖性和传统性:它们提供了一些熟悉的东西,但至少与以前的东西有些不同,并且在“更多相同”和“太奇怪”之间占据了令人满意的中间立场。我们使用来自我们自己的档案馆(AO3)的超过半数的小说作品的大型数据集来测试这一信念,研究作品所获得的认可是如何因其新颖性而变化的。我们通过基于术语的语言模型和主题模型,在同一个同人圈中的现有作品的背景下量化。与平衡理论相反,我们发现最低新颖性是最受欢迎的,并且普及性在新颖性上单调下降。可以找到一些例外:非常受欢迎的作品,是粉丝圈中最高新奇的作品。总而言之,我们的发现不仅挑战了传统的享乐价值的理论,而且还颠覆了它:人们更喜欢最不新颖的东西,被中间层所击退,偶尔会对极端异常值产生热情。它认为文化进化必须反对惯性 - 食欲者必须不断地重建熟悉的,并且可能类似于无法平衡的平衡,而不是平滑的进化。
translated by 谷歌翻译
本文提出了一种新的学习实例分割方法,以图像级别的标签作为监督。我们的方法生成训练图像的伪实例分割标签,用于训练完全监督的模型。为了生成伪标签,我们首先从图像分类模型的关注图中识别对象类的自信区域,并传播它们以发现具有精确边界的整个实例区域。为此,我们提出IRNet,它估计个体实例的粗略区域并检测不同对象类之间的边界。因此,它能够将实例标签分配给种子并在边界内传播它们,以便可以准确地估计整个实例区域。此外,IRNet在注意图上通过像素间关系进行训练,因此不需要额外的监督。我们使用IRNet的方法在PASCAL VOC 2012数据集上表现出色,不仅超越了先前在同等级别监督下接受过培训的最先进技术,而且还有一些先前依赖于更强监督的模型。
translated by 谷歌翻译
当奖励函数稀疏时,模仿学习是学习策略的有效替代方法。在本文中,我们考虑一个具有挑战性的设置,即代理人和专家使用彼此不同的行为。我们假设代理可以访问稀疏奖励函数和仅状态专家观察。我们提出了一种在模仿学习成本和强化学习目标之间逐步平衡的方法。此外,该方法基于模仿专家行为或最大化稀疏奖励来调整代理的策略。我们通过导航场景表明,(i)anagent能够有效地利用稀疏奖励优于仅标准状态的模仿学习,(ii)即使其行为与专家不同,也可以学习策略,以及(iii)表现由于稀疏奖励的优化使用,代理的范围不受专家的限制。
translated by 谷歌翻译
具有监督深度学习的图像分类的准确性和鲁棒性取决于大规模注释训练数据的可用性。但是,由于手动注释的复杂性,缺少可用的注释数据。为了克服这个问题,一种流行的方法是通过以下方式在不同的域中使用可转移的知识:1)使用已经在大规模通用图像上预训练的通用特征提取器(即,转移学习)但不适合从医学图像捕获特征;或2)使用相对较少数量的注释图像微调一般知识。我们的目标是通过使用新的分层无监督特征提取器来减少对注释训练数据的依赖,其中卷积自动编码器位于预训练的卷积神经网络的顶部。我们的方法将来自预训练域的丰富和通用图像特征限制为来自未注释医学图像域的局部图像特征的复杂表示。 Ourapproach具有比转移学习方法更高的分类准确度,并且与最先进的监督微调方法相比具有竞争力。
translated by 谷歌翻译
全身控制(WBC)是一种通用的面向任务的控制方法,用于对类人机器人中的机器人操纵行为进行反馈控制。 WBC和基于模型的步行控制器的组合已广泛用于各种类人机器人中。然而,到目前为止,WBC方法尚未用于无支撑的被动 - 踝动态运动。因此,在本文中,我们设计了一种新的WBC,称为全身运动控制器(WBLC),可以在无支撑的被动式踝式机器人上实现实验动态行走。 WBLC的一个关键方面是放宽接触约束,使得控制命令在切换脚触点时产生减少的抖动。为了实现稳健的动态运动,我们对称为时间 - 速度反转(TVR)规划器的动态步行算法进行了不确定性的深入分析。不确定性研究是基础,它允许我们改进机器人的控制算法和机械结构,以满足容忍的不确定性。此外,我们进行了广泛的实验:1)不支持的动态平衡(即在地方步进)与六自由度(DoF)两足动物,水星; 2)与水星无支撑的双向行走; 3)用水星走过一个不规则的滑溜溜; 4)使用我们新设计的10-DoFviscoelastic液冷两足动物DRACO进行就地行走。总的来说,这项工作的主要贡献在于:a)使用WBLC控制器和TVR规划器实现无支撑动态运动的各种模式,b)进行不确定性分析以改善水星的机械结构和控制器,以及c设计全身控制策略,减少行走时的运动混乱。
translated by 谷歌翻译
我们提出nnstreamer,一个处理神经网络作为流管道过滤器的软件系统,将流处理范例应用于神经网络应用程序。随着深度神经网络应用的广泛应用的新趋势是设备AI;即,直接在移动设备或边缘/物联网设备而不是云服务器上处理神经网络。新兴的隐私问题,数据传输成本和运营成本意味着对设备AI的需求,特别是在部署了大量具有实时数据处理功能的设备时。 Nnstreamer通过设备上的复杂数据流管道有效地处理神经网络,以最小的努力显着提高整体性能。此外,nnstreamer简化了神经网络管道实现,并允许直接重用现成的多媒体流过滤器;因此它显着降低了开发成本.Nnstreamer已经部署了很快发布的产品,并且是适用于各种硬件架构和软件平台的开源软件。
translated by 谷歌翻译
单视图三维形状重建是一个重要但具有挑战性的问题,主要有两个原因。首先,由于形状注释的获取非常昂贵,目前的方法依赖于合成数据,其中很容易获得地面实况3D注释。然而,当应用于自然图像时,这导致域适应问题。第二个挑战是它存在多种可以解释给定2D图像的形状。在本文中,我们提出了使用对抗性训练来改善这些挑战的框架。一方面,我们在自然和合成图像表示之间强加了域混淆,以减少分布差距。另一方面,我们通过强迫它重叠在现实物体形状的(学习的)流形上来使重建成为“现实的”。此外,我们的实验表明,这些约束在基线重构模型上大幅提高了性能。我们通过仅使用RGB图像和更简单的架构实现了与现有技术竞争的结果。
translated by 谷歌翻译
在本文中,我们提出了一种用于自动驾驶汽车端到端控制的转移学习方法,该方法使得在源域上训练的卷积神经网络(CNN)能够用于不同目标域中的相同任务。用于端到端控制的传统CNN被设计为将单个前置摄像机图像映射到转向命令。为了转移学习,我们让CNN不仅通过添加新的任务模块产生转向命令而且产生车道偏离等级(LDL),该任务模块将最后一个卷积层的输出作为输入。然后利用源域上的CNNtrained(称为源网络)来训练另一个称为目标网络的任务模块,该任务模块还获取源网络的最终卷积层的输出并被训练以产生目标域的转发命令。最终根据LDL合并来自源和目标网络的转向命令,并且合并命令用于控制目标域中的汽车。为了证明所提方法的有效性,我们分别为源域和目标域使用了两个模拟器TORCS和GTAV。实验结果表明,该方法在汽车稳定安全控制方面优于其他基线方法。
translated by 谷歌翻译