以顺序方式学习任务的能力对于人工智能的发展至关重要。一般而言,神经网络不具备此功能,并且人们普遍认为灾难性遗忘是连接模型的必然特征。我们表明,有可能克服这种限制并培养能够保持他们长期没有经历过的专业知识的网络。我们的方法通过有选择地减慢重量重要任务的权重学习来记住任务。我们通过基于MNIST手写数字数据集解决一组分类任务并依次学习几个Atari 2600游戏,证明我们的方法是可扩展和有效的。
translated by 谷歌翻译
在本文中,我们介绍了街机学习环境(ALE):既是挑战问题,也是评估一般的,与领域无关的AI技术开发的平台和方法。 ALE为数百个Atari 2600游戏环境提供了一个界面,每个环境都是不同的,有趣的,并且设计成对人类玩家的挑战。 ALE为强化学习,模型学习,基于模型的规划,模仿学习,转移学习和内在动机提出了重要的研究挑战。最重要的是,它提供了一个严格的测试平台,用于评估和比较这些问题的方法。我们通过开发和基准化使用完善的AI技术设计的领域独立代理来说明ALE的前景,用于强化学习和规划。在这样做的同时,我们还提出了ALE提供的评估方法,报告了超过55种不同游戏的经验结果。所有软件,包括基准标记代理,都是公开的。
translated by 谷歌翻译
来自社交媒体的图像可以反映不同的观点,激烈的争论和创造力的表达 - 为搜索任务增加了新的复杂性。从事基于内容的图像检索(CBIR)的研究人员传统上调整了他们的搜索算法,以便将过滤结果与用户搜索特征进行匹配。然而,我们现在被未知来源,真实性甚至意义的合成图像轰炸。由于存在这种不确定性,用户可能无法初步了解搜索查询的结果应该是什么样的。例如,隐藏的人,拼接的对象和微妙改变的场景可能使用户难以最初在模因图像中检测到,但可能对其组成有显着贡献。我们提出了一个新的图像检索框架,它使用从图像索引中检索到的图像关键点对对象级区域进行建模,然后用于精确加权结果中的小贡献对象,而无需昂贵的对象检测步骤。我们将此方法称为Needle-Haystack (NH)评分,它针对CPU上的fastmatrix操作进行了优化。我们证明了这种方法不仅可以在经典CBIR问题中与最先进的方法相媲美,而且在优质的对象和实例级检索上也能够在欧福德5K,巴黎6K,谷歌地标和NIST MFC2018上表现出色。数据集,以及Reddit的风格图像。
translated by 谷歌翻译
互惠是人类社会互动的重要特征,也是人们合作的基础。更重要的是,简单的互惠形式已经证明在矩阵游戏社会困境中具有显着的弹性。最着名的是,在针对囚徒困境的比赛中,针对性的策略表现得非常好。不幸的是,这种策略并不适用于现实世界,其中合作或缺陷的选择在时间和空间上得到延伸。在这里,我们提出一般的在线强化学习算法,显示对其共同参与者的互惠行为。我们表明,在与$ 2 $ $ -player Markov游戏以及$ 5 $ -player intertmporal socialdilemmas中进行学习时,它可以为更广泛的群体带来更好的社交结果。我们分析了由此产生的政策,以表明往复行为受其共同参与者行为的强烈影响。
translated by 谷歌翻译
In this paper, multiple instance learning (MIL) algorithms to automatically perform root detection and segmen-tation in minirhizotron imagery using only image-level labels are proposed. Root and soil characteristics vary from location to location, thus, supervised machine learning approaches that are trained with local data provide the best ability to identify and segment roots in minirhizotron imagery. However, labeling roots for training data (or otherwise) is an extremely tedious and time-consuming task. This paper aims to address this problem by labeling data at the image level (rather than the individual root or root pixel level) and train algorithms to perform individual root pixel level segmentation using MIL strategies. Three MIL methods (MI-ACE, miSVM, MIForests) were applied to root detection and compared to non-MIL approches. The results show that MIL methods improve root segmentation in challenging minirhizotron imagery and reduce the labeling burden. In our results, miSVM outperformed other methods. The MI-ACE algorithm was a close second with an added advantage that it learned an interpretable root signature which identified the traits used to distinguish roots from soil and did not require parameter selection. Note to Practitioners-Minirhizotrons provide an efficient and non-destructive way to collect plant roots for studying root system dynamically. However existing software used to extract roots from minirhizotron image require significant, tedious manual marking of roots and soil in the collected imagery. Due to this slow manual process, the ability to collect useful information from a large number of minirhizotron images is bottlenecked. In this paper, we propose an automated approach to segment roots from minirhizotron images. The proposed methods not only automatically identifies and segments root pixels in imagery, but also allow for an efficient approach to label training data. This allows one to be able to retrain the models for adaptation to new environments and soil conditions. The methods we proposed in the paper only require one to label each training image as having roots or not (as opposed to labeling individual pixels).
translated by 谷歌翻译
神经机器翻译显着推动了该领域的质量。然而,翻译仍然存在重大问题,其中一个是公平。神经模型在大文本语料库上进行训练,其中包含偏见和刻板印象。因此,模型继承了这些社会偏见。最近的方法已经显示出减少其他自然语言处理应用(例如单词嵌入)中的性别偏差的结果。我们利用单词嵌入用于神经机器翻译来提出第一个脱映机器翻译系统这一事实。具体而言,我们提出,实验和分析了在变换器翻译体系结构中Glove嵌入的双向偏移技术的集成。我们在通用英语 - 西班牙语任务上评估我们提出的系统,显示最多一个BLEU点的收益。至于性别偏见评估,我们生成一组测试职业,我们表明我们提出的系统学习均衡了基线系统的现有偏差。
translated by 谷歌翻译
这项工作提出了一种新的多类分类策略,它不需要特定于类的标签,而是利用示例之间的成对相似性,这是一种较弱的注释形式。所提出的方法,元分类学习,优化用于对相似性预测的二元分类器,并且通过该过程学习多类分类和子模块。我们制定了这种方法,为它提供了概率图形模型,并得出了一个令人惊讶的简单损失函数,可用于学习基于神经网络的模型。然后,我们证明这个相同的框架工作推广到受监督的,无监督的跨任务和半监督设置。我们的方法在所有三种学习范例中针对现有技术进行了评估,并显示出优越或相当的准确性,提供了证明学习多类别分类而无需多类别标签是一种可行的学习选择。
translated by 谷歌翻译
我们开发了一种基于变量编码器方法的新概率生成模型。我们的架构的显着方面是:一种先前指定潜在变量的新方法,以及一个强制执行单元的引入。我们描述了如何使用模型进行有监督,无监督和半监督学习,以及名义和有序分类。我们使用两个基准数据集分析方法的生成属性,以及名义和有序分类下的分类有效性。我们的结果表明,我们的模型可以在两个分类任务中获得与相关基线相当的结果。
translated by 谷歌翻译
许多人力和计算工作旨在改善深度加强学习算法在基准测试中的表现,例如AtariLearning Environment。相对较少的努力集中于理解通过这些方法学到的东西,并且研究和比较由不同的强化学习(RL)算法家族学习的表述。摩擦源包括繁重的计算要求,以及大规模运行Deep RL算法的一般逻辑和架构复杂性。我们通过以下方式减少这种摩擦:(1)大规模训练大型算法并发布经过训练的模型,(2)与之前的Deep RL模型发布集成,以及(3)发布代码,使得可以轻松地加载,可视化和分析这些模型。本文介绍了Atari Zoo框架,它包含了基于Atarigames的训练模型,以易于使用的格式,以及实现常见分析模式的代码,并将这些模型连接到流行的神经网络可视化库。此外,为了证明该数据集和软件包的潜力,我们展示了几种深度RL算法的性能和表示之间的初始定量和定性比较,突出了它们之间的有趣和以前未知的区别。
translated by 谷歌翻译
我们提出了Hinted Networks:一系列架构转换,用于通过注入输出预测的先验(即提示)来提高回归任务的神经网络模型的准确性。我们在相机重定位域内进行了研究,并提出了两个变量,即Hinted Embedding和Hinted Residual网络,bothapplied到PoseNet基础模型,用于从图像中回归相机姿态。 Ourevaluations显示标准室外和室内定位数据集的定位精度的实际改进,而不使用额外的信息。我们进一步评估在一年中不同时间在大范围区域内模拟的鸟瞰图定位设置中的准确度增益范围。
translated by 谷歌翻译