我们为连续学习领域引入了一个概念上简单且可扩展的框架,其中任务是按顺序学习的。我们的方法在参数数量上是恒定的,旨在保持以前遇到的任务的性能,同时加速后续问题的学习进度。这是通过训练具有两个组件的网络来实现的:能够解决先前遇到的问题的知识库,其连接到用于有效地学习当前任务的活动列。在学习新任务后,活动列被提炼到知识库中,注意保护以前获得的任何技能。这种主动学习(进展)循环然后进行整合(压缩)不需要架构增长,不需要访问或存储先前的数据或其他任何特定的参数。我们展示了手写字母顺序分类以及双向强化学习领域的进展和压缩方法:Atari游戏和3D迷宫导航。
translated by 谷歌翻译
以顺序方式学习任务的能力对于人工智能的发展至关重要。一般而言,神经网络不具备此功能,并且人们普遍认为灾难性遗忘是连接模型的必然特征。我们表明,有可能克服这种限制并培养能够保持他们长期没有经历过的专业知识的网络。我们的方法通过有选择地减慢重量重要任务的权重学习来记住任务。我们通过基于MNIST手写数字数据集解决一组分类任务并依次学习几个Atari 2600游戏,证明我们的方法是可扩展和有效的。
translated by 谷歌翻译
设计具有所需性质的分子是药物开发中最大的挑战之一,因为它需要在许多复杂性质方面优化化学化合物结构。为了增强复合设计过程,我们引入了Mol-CycleGAN--一种基于CycleGAN的模型,可生成与原始结构具有高度结构相似性的优化化合物。即,给定分子,我们的模型产生与所考虑的性质的优化值在结构上类似的分子。我们评估模型在与结构性质(卤素基团的存在,芳环的数量)和物理化学性质(惩罚的logP)相关的选定优化目标上的性能。在优化药物样分子的浓缩logP的任务中,我们的模型明显优于以前的结果。
translated by 谷歌翻译
本体创作是一个复杂的过程,通常会调用自动调整程序来验证新引入的更改,从而导致耗时的测试最后一种方法。用于本体创作的测试驱动开发(TDD)是最近的{\ em test-first}方法,旨在减少创作时间并提高创作效率。当前的TDD测试缺乏对OWL特征的覆盖范围和可能的测试结果,其基础和评估以确定其有效性。我们的目标是在本地创作的TDD实例中解决这些问题。我们首先提出了一个简洁的,基于逻辑的TDD测试模型,并提出了新的TDD算法,以便覆盖TBox和主要ABox断言的任何OWL 2类表达式,并证明它们的正确性。算法直接使用OWL API中的方法因此,重新分类对于测试执行不是必需的,从而减少了本体创作时间。算法在TDDonto2中实现,这是一个Prot \'eg \'e插件.TDDonto2在编辑效率和用户方面进行了评估。编辑效率研究表明它比典型的本体创作界面更快,特别是对于中等规模和大型本体。 userevaluation证明,与标准的Prot \'eg e接口相比,建模人员使用TDDonto2可以显着减少错误,并且使用更少的时间更好地完成了使用。因此,结果表明Test-DrivenDevelopment是一种在本体开发方法中很有前途的方法。
translated by 谷歌翻译
能力问题(CQ)是自然语言问题,概述和约束本体所代表的知识范围。尽管CQ是几种本体工程方法的一部分,但我们已经观察到可用本体的CQ的实际发布是非常有限的,甚至更少的是例如SPARQL查询方面的各自形式化的发布。本文旨在帮助解决在本体开发中使用CQ的工程缺点,以促进CQ的更广泛使用。为了理解CQ与本体上的查询之间的关系来测试本体上的CQ,我们收集,分析并公开发布了一组234个CQ及其翻译到SPARQL-OWL的不同领域的不同领域中的各种本体。以两种主要方式分析了CQ。第一阶段的重点是对自然语言文本本身的语言分析,即没有任何本体元素预设的词汇 - 句法分析,以及后续的语义分析步骤,以便找到模式。 CQ源的这种增加的多样性导致迄今公布的模式增加了5倍,达到106个不同的CQ模式,其具有从不同本体的CQ集合共享的少数模式的有限子集。接下来,我们分析了找到的CQ模式与46个SPARQL-OWL查询签名之间的关系,这表明一个CQ模式可以通过多个SPARQL-OWL查询签名来实现,反之亦然。我们希望我们的工作将有助于建立支持CQ制定,形式化,执行和一般管理的通用实践,模板,自动化和用户工具。
translated by 谷歌翻译
尽管他们在许多任务中表现出色,但深层神经网络却在关系推理中挣扎。最近通过引入考虑对象之间关系的插件关系模块来解决这个问题。不幸的是,这是组合昂贵的。在这个扩展的摘要中,我们展示了一个结合了扩张转换的DenseNet在Sort-of-CLEVR数据集上的关系推理方面表现优异,允许我们放弃这个关系模块及其相关费用。
translated by 谷歌翻译
由W3C机器学习模式社区组提出的ML-Schema是一个顶级本体,它提供了一组类,属性和限制,用于表示和交换有关机器学习算法,数据集和实验的信息。它可以很容易地扩展和专用,并且还映射到机器学习和数据挖掘领域中开发的其他更多特定领域的本体。在本文中,我们将介绍现有的最先进的机器学习交换格式,并介绍ML-Schema的第一个版本,这是一种规范格式,在不同研究机构中拥有超过七年的经验。我们认为,通过规范格式揭示机器学习算法,模型和实验的语义可能为更好的可解释性铺平道路,并且无论平台或采用的工作流解决方案如何,都可以实现实验的完全互操作性。
translated by 谷歌翻译