本文不是提出一种新方法,而是研究现有学习算法中存在的一个问题。我们研究了强化学习(RL)的学习动态,特别是学习和数据生成之间的特征耦合,因为RL代理控制着他们的未来数据分布。在存在函数逼近的情况下,这种耦合可以导致一种有问题的“射线干扰”类型,其特征在于学习动力学顺序地遍历许多性能平台,有效地约束代理一次学习一件事,即使并行学习更好。我们建立了发生射线干扰的条件,显示了它与鞍点的关系,并在受限制的环境中获得了精确的学习动力学。我们描述了它的许多特性,并讨论了可能的补救措施。
translated by 谷歌翻译
跨任务转移技能的能力有可能将增强型学习(RL)代理扩展到目前无法实现的环境。最近,基于两个概念,后继特征(SF)和广泛策略改进(GPI)的框架已被引入转移技能的原则性方式。在本文中,我们在两个方面扩展了SF和GPI框架。 SFs和GPI原始公式的基本假设之一是,所有感兴趣的任务的奖励可以计算为固定特征集的线性组合。我们放松了这个约束,并表明支持框架的理论保证可以扩展到只有奖励函数不同的任何一组任务。我们的第二个贡献是,可以使用奖励函数本身作为未来任务的特征,而不会损失任何表现力,从而无需事先指定一组特征。这使得可以以更稳定的方式将SF和GPI与深度学习相结合。我们在acomplex 3D环境中凭经验验证了这一主张,其中观察是来自第一人称视角的图像。我们表明,SF和GPI推动的转移几乎可以立即实现看不见任务的非常好的政策。我们还描述了如何以一种允许将它们添加到代理的技能集中的方式学习专门用于新任务的策略,从而在将来重用。
translated by 谷歌翻译
强化学习(RL)代理同时学习许多奖励功能的能力具有许多潜在的好处,例如将复杂任务分解为更简单的任务,任务之间的信息交换以及技能的重用。我们特别关注一个方面,即能够推广到看不见的任务。参数泛化依赖于函数逼近器的插值功率,该函数逼近器被赋予任务描述作为输入;其最常见的形式之一是通用值函数逼近器(UVFA)。推广到新任务的另一种方法是在RL问题本身中开发结构。广义策略改进(GPI)将先前任务的解决方案组合到针对看不见的任务的策略中;这依赖于新向下功能下的旧策略的即时策略评估,这通过后继特征(SF)实现。我们提出的通用后继特征近似器(USFAs)结合了所有这些的优点,即UVFAs的可扩展性,SF的即时参考,以及GPI的强大推广。我们讨论了培训USFA所涉及的挑战,其泛化属性,并证明其实际利益和转移能力在一个大规模的领域,其中代理人必须在第一人称视角三维环境中导航。
translated by 谷歌翻译
我们能否在移动设备的延迟约束下自动设计具有最高图像分类精度的卷积网络(ConvNet)?用于ConvNet设计的神经架构搜索(NAS)是一个具有挑战性的问题,因为它具有组合的大型设计空间和搜索时间(至少200个GPU小时)。为了减轻这种复杂性,我们提出单路径NAS,一种可分离的NAS方法,用于在不到4小时内设计出设备效率高的ConvNets。 1.新的NAS公式:我们的方法引入了单路径,过度参数化的ConvNet,用共享卷积核参数编码所有架构决策。 2. NAS效率:我们的方法将NAS搜索成本降低到8个时期(30个TPU小时),即比以前的工作高出5,000倍。 3.在设备上进行图像分类:单路径NAS在ImageNet上具有74.96%的前1精度,在aPixel 1手机上具有79ms的推理延迟,与具有相似延迟(<80ms)的NAS方法相比,这是最先进的精度。
translated by 谷歌翻译
过滤器修剪已被证明对学习资源受限的卷积神经网络(CNN)是有效的。然而,用于资源约束的滤波器修剪的现有方法具有一些妨碍其有效性和效率的限制。当搜索满足约束的CNN时,先验方法要么改变优化目标要么采用局部搜索算法和启发式参数化,这是次优的,尤其是在低资源状态下。从效率的角度来看,现有方法寻找满足约束的CNN的成本很高。在这项工作中,我们提出了全球排名,称为LeGR,它在前面提到的两个方面改进了现有技术。受理论分析的启发,LeGR被参数化以学习过滤器范数上的分层仿射变换,从而构建学习的全局排名。通过全局排名,可以有效地完成各种约束级别的资源约束过滤器修剪。我们进行了广泛的实证分析,以证明所提出的算法与ResNet和MobileNetV2网络在CIFAR-10,CIFAR-100,Bird-200和ImageNet数据集上的有效性。代码在https://github.com/cmu-enyac/LeGR上公开发布。
translated by 谷歌翻译
一些研究使用结构相关网络,得出大脑区域的fromanatomical协方差,来分析与多发性硬化症,精神分裂症和乳腺癌相关的神经系统变化[1] [2]。人类大脑结构网络的图形理论分析一直表现出小的特征 - 反映具有高度隔离和高度集成的网络的世界性。关于足球运动员的大型神经影像学文献,无论是否有脑震荡,均表现出功能和解剖学变化。在这里,我们使用基于图形的解剖相关网络拓扑性质来研究先前冲击对碰撞运动员的影响。 40名高中碰撞运动员(23名男子足球,17名女子足球; CSA)没有自我报告的脑震荡史(HOC-),18名运动员(13名男子足球,5名女子足球),有自我报告的脑震荡史(HOC +)和24名健康对照(19名男性,5名女性; CN)参加了在比赛开始前的成像会议。每组提取的剩余体积用于建立相关网络,并计算它们的小世界。计算出没有脑震荡史的CSA的小世界,显着大于对照组,。在一系列网络密度范围内,具有先前历史的CSA与HOC +相比具有显着更高(相对于95%置信区间)的小世界。 HOC +组中较长的路径长度可表明相对于健康对照的神经元整合受到破坏。
translated by 谷歌翻译
深度感应是机器人任务的关键功能,例如定位,映射和障碍物检测。由于单目相机的成本和尺寸相对较低,因此单个RGB图像的深度估计具有显着且不断增长的兴趣。然而,最先进的单视图depthestimation算法基于相当复杂的深度神经网络,这对于嵌入式平台上的实时推断来说是缓慢的,例如,安装在微型飞行器上。在本文中,我们解决了嵌入式系统中快速验证的问题。我们提出了一种高效的轻量级编码器 - 解码器网络架构,并应用网络修剪来进一步降低计算复杂性和延迟。特别是,我们专注于低延迟解码器的设计。我们的方法论证明,可以实现与先前深度估算工作相似的精度,但是参考速度要快一个数量级。我们建议的网络FastDepth在NVIDIA Jetson TX2 GPU上以178 fps运行,在使用TX2 CPU时运行速度为27 fps,有效功耗低于10 W. FastDepth在纽约大学深度v2上达到了最先进的精度数据集。据本文作者所知,本文使用深度神经网络演示了实时单目视觉识别,该神经网络在嵌入式平台上具有最低延迟和最高吞吐量,可由微型空中车载。
translated by 谷歌翻译
在具有视觉功能的自动系统(如机器人和自动驾驶汽车)中,视频对象检测起着至关重要的作用,其速度和准确性是提供可靠操作的重要因素。我们在本文中展示的关键见解是,当图像缩放时,速度和准确性不一定是权衡。我们的结果表明,将图像重新缩放到较低分辨率有时会产生更好的精度。基于这一观察,我们提出了一种称为AdaScale的新方法,该方法可自适应地选择输入图像比例,从而提高视频对象检测的准确性和速度。为此,我们在ImageNet VID和miniYouTube-BoundingBoxes数据集上的结果分别显示了1.3点和2.7点的mAP改进,加速分别为1.6倍和1.8倍。此外,我们通过额外的1.25倍加速技术改进了最先进的视频加速工作,并在ImageNet VID数据集上提供了更好的mAP。
translated by 谷歌翻译
股骨近端骨折是西方世界的一个重要实体,特别是随着老年人口的增长。这种骨折导致高发病率和死亡率,反映了对我们社会的重大健康和经济影响。对于不同的骨折类型,建议采用不同的治疗策略,手术治疗仍是大多数病例的金标准。在外科手术后治疗和预后的成功取决于标准类型之间的骨折的准确分类,例如由AO系统定义的那些。然而,基于X射线图像的分类断裂类型是困难的,这通过我们内部研究的低内部和专家间协议率以及之前的文献证实。所提出的工作提出了一种基于当前深度学习技术的全自动计算机辅助诊断(CAD)工具,能够根据AO分类识别,定位并最终对X射线图像上的股骨近端骨折进行分类。我们的实验评估结果表明,所提出的CAD工具所达到的性能可与普通专家相比,对X射线图像进行分类,即“A”,“B”和“正常”(精度为89%) ),虽然在将骨折分类与“正常”病例(精确度为94%)时表现优异。此外,广泛讨论了将所提出的CAD工具集成到日常临床常规中,以改善人类和人工智能机器之间的界面,以支持医疗决策。
translated by 谷歌翻译
组织样本的连续薄切片使得研究例如局部变化成为可能。通过在每个切片中染色新蛋白质来表达蛋白质和肿瘤异质性。为了比较和关联不同蛋白质的模式,必须高精度地记录图像。我们想要解决的问题是千兆像素整个幻灯片图像(WSI)的注册。这提出了三个挑战:(i)图像非常大; (ii)薄片部分导致使全局仿射注册容易产生非常大的局部误差的文物; (iii)需要进行局部仿射登记以保持正确的组织形态(局部大小,形状和纹理)。在我们的方法中,我们比较基于自然图像或自然子区域(与方形图块相对)的自动和手动特征选择的WSI注册。通过交互式工具处理自然子区域,可以排除包含科学无关信息的区域。我们还提出了一种通过注册置信度图(RCM)可视化本地注册质量的新途径。利用该方法,可以观察和量化肿瘤内异质性和肿瘤微环境的特征。
translated by 谷歌翻译