跨任务转移技能的能力有可能将增强型学习(RL)代理扩展到目前无法实现的环境。最近,基于两个概念,后继特征(SF)和广泛策略改进(GPI)的框架已被引入转移技能的原则性方式。在本文中,我们在两个方面扩展了SF和GPI框架。 SFs和GPI原始公式的基本假设之一是,所有感兴趣的任务的奖励可以计算为固定特征集的线性组合。我们放松了这个约束,并表明支持框架的理论保证可以扩展到只有奖励函数不同的任何一组任务。我们的第二个贡献是,可以使用奖励函数本身作为未来任务的特征,而不会损失任何表现力,从而无需事先指定一组特征。这使得可以以更稳定的方式将SF和GPI与深度学习相结合。我们在acomplex 3D环境中凭经验验证了这一主张,其中观察是来自第一人称视角的图像。我们表明,SF和GPI推动的转移几乎可以立即实现看不见任务的非常好的政策。我们还描述了如何以一种允许将它们添加到代理的技能集中的方式学习专门用于新任务的策略,从而在将来重用。
translated by 谷歌翻译
强化学习(RL)代理同时学习许多奖励功能的能力具有许多潜在的好处,例如将复杂任务分解为更简单的任务,任务之间的信息交换以及技能的重用。我们特别关注一个方面,即能够推广到看不见的任务。参数泛化依赖于函数逼近器的插值功率,该函数逼近器被赋予任务描述作为输入;其最常见的形式之一是通用值函数逼近器(UVFA)。推广到新任务的另一种方法是在RL问题本身中开发结构。广义策略改进(GPI)将先前任务的解决方案组合到针对看不见的任务的策略中;这依赖于新向下功能下的旧策略的即时策略评估,这通过后继特征(SF)实现。我们提出的通用后继特征近似器(USFAs)结合了所有这些的优点,即UVFAs的可扩展性,SF的即时参考,以及GPI的强大推广。我们讨论了培训USFA所涉及的挑战,其泛化属性,并证明其实际利益和转移能力在一个大规模的领域,其中代理人必须在第一人称视角三维环境中导航。
translated by 谷歌翻译
在具有视觉功能的自动系统(如机器人和自动驾驶汽车)中,视频对象检测起着至关重要的作用,其速度和准确性是提供可靠操作的重要因素。我们在本文中展示的关键见解是,当图像缩放时,速度和准确性不一定是权衡。我们的结果表明,将图像重新缩放到较低分辨率有时会产生更好的精度。基于这一观察,我们提出了一种称为AdaScale的新方法,该方法可自适应地选择输入图像比例,从而提高视频对象检测的准确性和速度。为此,我们在ImageNet VID和miniYouTube-BoundingBoxes数据集上的结果分别显示了1.3点和2.7点的mAP改进,加速分别为1.6倍和1.8倍。此外,我们通过额外的1.25倍加速技术改进了最先进的视频加速工作,并在ImageNet VID数据集上提供了更好的mAP。
translated by 谷歌翻译
股骨近端骨折是西方世界的一个重要实体,特别是随着老年人口的增长。这种骨折导致高发病率和死亡率,反映了对我们社会的重大健康和经济影响。对于不同的骨折类型,建议采用不同的治疗策略,手术治疗仍是大多数病例的金标准。在外科手术后治疗和预后的成功取决于标准类型之间的骨折的准确分类,例如由AO系统定义的那些。然而,基于X射线图像的分类断裂类型是困难的,这通过我们内部研究的低内部和专家间协议率以及之前的文献证实。所提出的工作提出了一种基于当前深度学习技术的全自动计算机辅助诊断(CAD)工具,能够根据AO分类识别,定位并最终对X射线图像上的股骨近端骨折进行分类。我们的实验评估结果表明,所提出的CAD工具所达到的性能可与普通专家相比,对X射线图像进行分类,即“A”,“B”和“正常”(精度为89%) ),虽然在将骨折分类与“正常”病例(精确度为94%)时表现优异。此外,广泛讨论了将所提出的CAD工具集成到日常临床常规中,以改善人类和人工智能机器之间的界面,以支持医疗决策。
translated by 谷歌翻译
组织样本的连续薄切片使得研究例如局部变化成为可能。通过在每个切片中染色新蛋白质来表达蛋白质和肿瘤异质性。为了比较和关联不同蛋白质的模式,必须高精度地记录图像。我们想要解决的问题是千兆像素整个幻灯片图像(WSI)的注册。这提出了三个挑战:(i)图像非常大; (ii)薄片部分导致使全局仿射注册容易产生非常大的局部误差的文物; (iii)需要进行局部仿射登记以保持正确的组织形态(局部大小,形状和纹理)。在我们的方法中,我们比较基于自然图像或自然子区域(与方形图块相对)的自动和手动特征选择的WSI注册。通过交互式工具处理自然子区域,可以排除包含科学无关信息的区域。我们还提出了一种通过注册置信度图(RCM)可视化本地注册质量的新途径。利用该方法,可以观察和量化肿瘤内异质性和肿瘤微环境的特征。
translated by 谷歌翻译
近年来,使用卷积神经网络(CNN)的监督学习在图像分类任务中取得了巨大成功,并且大规模标记数据集对该成就做出了显着贡献。然而,标签的定义通常取决于应用。例如,猫的图像可以标记为“猫”或者更具体地“波斯猫”。我们将其称为标签粒度。在本文中,我们利用各种数据集进行了大量的实验,以展示和分析基于细粒度标记的培训,如“波斯猫”如何在分类粗粒类(在本例中为“猫”)中提高CNN准确度。实验结果表明,用细粒度标签训练CNN可以提高网络的优化和泛化能力,直观地鼓励网络学习更多特征,从而提高所考虑的所有数据集中粗粒度类的分类准确性。此外,细粒度标签增强了数据CNN培训的效率。例如,使用细粒度标签训练的CNN仅有40%的总训练数据可以比使用全训练数据集和粗粒度标签训练的CNN获得更高的准确度。这些结果表明了这项工作的两个可能的应用:(i)有足够的人力资源,人们可以通过用细粒标签重新标记数据集来提高CNN的性能,以及(ii)人力资源有限,以提高CNN的性能,而不是收集更多的训练数据,可以改为使用细粒度标签作为数据集。我们进一步提出了一个称为平均混淆比率的度量标准来描述细粒度标记的有效性,并通过深入的实验展示其用途。代码可以通过以下网址获得://github.com/cmu-enyac/Label-Granularity。
translated by 谷歌翻译
我们提出了用于人工神经网络的超参数优化的遗传算法(GA),其包括染色体交叉以及在有性生殖期间来自超参数(例如,学习速率,重量衰减和丢失)的参数(即,权重和偏差)的耦合。儿童由三个父母生产;两个贡献超参数和一个贡献参数。我们的基于人口的培训(PBT)版本结合了传统的基于梯度的方法,如随机梯度下降(SGD)和我们的GA,以优化SGD时代的参数和超参数。我们对传统PBT的改进提供了更高的适应速度和更大的从人口中排除有害基因的能力。我们的方法提高了最终的准确性以及在各种深度神经网络架构上的固定精度的时间,包括卷积神经网络,递归神经网络,密集神经网络和胶囊网络。
translated by 谷歌翻译
由于恶意内部事件的数量不断增加,内部威胁检测越来越受到学术界,工业界和政府的关注。现有的用于检测内部威胁的方法仍然存在一个共同的缺点,即错误警报(虚假信息)的数量很多。这些方法面临的挑战是必须检测属于特定威胁的所有异常行为。为了解决这个问题,我们提出了一个机会主义知识发现系统,即AnyThreat,旨在检测所有恶意攻击威胁中的任何异常行为。我们设计了具有四个组件的AnyThreat系统。 (1)Afeature工程组件,它从具有相同角色的一组用户的活动日志构建社区数据集。 (2)一个过采样组件,我们提出了一种新颖的过采样技术,名为ArtificialMinority Oversampling and Trapper REmoval(AMOTRE)。 AMOTRE首先删除与正常(多数)实例高度相似的少数(异常)实例以减少错误警报的数量,然后通过屏蔽多数类的边界来合成地对少数类进行过采样。 (3)一个类分解组件,它引入了多数类的实例到子类中,以减弱多数类的影响而不会丢失信息。 (4)分类组件,它对子类应用分类方法,以实现多数类和少数类之间的更好的分离.AnyThreat在卡内基梅隆大学生成的合成数据集上进行评估。它检测到大约87.5%的恶意内部威胁,并且最小的误报率= 3.36%。
translated by 谷歌翻译
计算机断层扫描(CT)是急性创伤性脑损伤(TBI)后脑损伤评估的金标准技术。它允许识别大多数病变类型并确定手术或替代治疗程序的需要。然而,传统的病变分类方法仅限于视觉图像检查。在这项工作中,我们通过使用CT衍生的放射学描述符来表征和预测TBI病变。分离表征不同病变的相关形状,强度和纹理生物标记,并使用PartialLeast Squares建立病变预测模型。在包含155次扫描(105列车,50次测试)的数据集上,对于看不见的数据,该方法的准确率达到了89.7%。当仅使用纹理特征建立模型时,获得了88.2%的准确度。我们的结果表明,选择的放射学描述符可能在脑损伤预测中发挥关键作用。此外,拟议的方法接近再生放射科医生的决策。这些结果为放射学引发的脑病变检测,分割和预测开辟了新的可能性。
translated by 谷歌翻译
过程能力指数(PCI)是一种常用的统计数据,用于在给定规格内操作的过程的可测量性或生产满足所需质量规格的产品。 PCI可以是单变量的,也可以是多变量的,这取决于过程规范的数量或感兴趣的质量特性。大多数PCI在实践中进行分配假设通常是不现实的。本文提出了一种新的多变量非参数过程能力指数。当过程或质量参数的分布未知或不遵循常用分布时,例如多变量法线,可以使用该指数。
translated by 谷歌翻译