fold-r ++是一种用于二进制分类任务的新电感学习算法。它为混合类型(数值和分类)数据生成(可解释的)正常逻辑程序。我们提出了一种具有排名框架(称为fold-tr)的自定义的折叠式R ++算法,该算法旨在按照培训数据中的排名模式对新项目进行排名。与Fold-R ++一样,Fold-Tr算法能够直接处理混合型数据,并提供本机的理由来解释一对项目之间的比较。
translated by 谷歌翻译
Fold-R是一种自动感应学习算法,用于学习混合(数值和分类)数据的默认规则。它生成(可解释的)应答集编程(ASP)规则集,用于分类任务。我们提出了一种改进的折叠R算法,称为折叠-R ++,显着提高了折叠-R的效率和可扩展性。 FOLD-R ++在编码或特征选择阶段期间,在没有损害或丢失输入训练数据中的信息的情况下改善了FOL-R。折叠-R ++算法在具有广泛使用的XGBoost算法的性能中具有竞争力,但是,与XGBoost不同,折叠-R ++算法产生可说明的模型。折叠-R ++在具有RIPPER系统的性能中也具有竞争性,但是,在大型数据集上折叠-R ++优于Ripper。我们还通过将Fold-R ++与S(CASP)-A -A的ASP执行引擎组合来创建一个强大的工具集 - 使用Fold-R ++生成的答案集程序对新数据样本进行预测。 S(CASP)系统还为预测产生了理由。本文提出的实验表明,我们改进的折叠率-R ++算法是对原始设计的显着改进,并且S(CASP)系统也可以以有效的方式进行预测。
translated by 谷歌翻译
FOLD-R ++是一种针对二进制分类任务的高效且基于规则的机器学习算法。它以(可解释的)训练有素的模型生成分层的正常逻辑程序。我们对称为fold-se的fold-r ++算法进行了改进,该算法在继承fold-r ++的所有优点时提供了可扩展的解释性(SE)。可扩展的解释性意味着,无论数据集的大小如何,学识渊博的规则和学识关的数量保持很小,因此人类可以理解,同时保持分类的良好表现。 Fold-SE具有最新的算法(例如XGBoost和Multi-Layer Perceptrons(MLP))的性能竞争力。但是,与XGBoost和MLP不同,Fold-SE算法生成具有可扩展性的模型。 FOLD-SE算法在效率,性能和解释性方面优于fold-r ++和开膛手算法,尤其是对于大型数据集。 fold-rm算法是用于多类分类任务的fold-r ++的扩展。还提出了一种改进的折叠式RM算法。
translated by 谷歌翻译
尽管在现代的机器学习算法的最新进展,其内在机制的不透明仍是采用的障碍。在人工智能系统灌输信心和信任,解释的人工智能已成为提高现代机器学习算法explainability的响应。归纳逻辑程序(ILP),符号人工智能的子场中,起着产生,因为它的直观的逻辑驱动框架的可解释的解释有希望的作用。 ILP有效利用绎推理产生从实例和背景知识解释的一阶分句理论。然而,在发展中通过ILP需要启发方法的几个挑战,在实践中他们的成功应用来解决。例如,现有的ILP系统通常拥有广阔的解空间,以及感应解决方案是对噪声和干扰非常敏感。本次调查总结在ILP的最新进展和统计关系学习和神经象征算法的讨论,其中提供给ILP协同意见。继最新进展的严格审查,我们划定观察的挑战,突出对发展不言自明的人工智能系统进一步ILP动机研究的潜在途径。
translated by 谷歌翻译
归纳逻辑编程(ILP)是一种机器学习的形式。ILP的目标是诱导推广培训示例的假设(一组逻辑规则)。随着ILP转30,我们提供了对该领域的新介绍。我们介绍了必要的逻辑符号和主要学习环境;描述ILP系统的构建块;比较几个维度的几个系统;描述四个系统(Aleph,Tilde,Aspal和Metagol);突出关键应用领域;最后,总结了未来研究的当前限制和方向。
translated by 谷歌翻译
程序中的魔术值是一个恒定的符号,对于执行程序至关重要,但对其选择没有明确的解释。对于现有的程序综合方法,很难学习具有魔法价值的学习程序。为了克服这一限制,我们引入了一种归纳逻辑编程方法,以有效地学习具有魔术价值的程序。我们对包括程序合成,药物设计和游戏玩法在内的各种领域的实验表明,我们的方法可以(i)在预测精度和学习时间方面优于现有方法,(ii)从无限领域中学习魔法价值观,例如PI的值和(iii)比例为具有数百万个恒定符号的域。
translated by 谷歌翻译
我们提出了目标定向答案集编程的新颖应用,该计划将模型飞机操作员对模型飞机(AMA)安全法规的合规性验证数字化。 《 AMA安全法》规定了AMA Flyers如何用于有限的娱乐目的,如何操作无人机(UAV)。飞机及其操作员在飞机运行之前和之后遵守各种规则,以确保安全飞行。在本文中,我们利用答案集编程来编码AMA安全代码并自动化合规性检查。要检查合规性,我们使用S(CASP),该S(CASP)是目标定向的ASP引擎。通过使用S(CASP),操作员可以轻松检查违规行为并获得理由树,以解释以人类可读的自然语言侵犯的原因。此外,我们实施了一种算法,以帮助操作员获得最小的条件集,以通过合规性检查。我们开发了一个接受各种条件的前端问卷接口,并使用后端S(CASP)发动机评估条件是否遵守法规。我们还利用了SWI-Prolog中实施的S(CASP),SWI-Promog将S(CASP)的推理能力公开为REST服务。据我们所知,这是ASP在AMA和航空电子合规性和认证空间中的第一个应用。
translated by 谷歌翻译
我们介绍了一种感应逻辑编程方法,将经典的鸿沟和征服搜索结合使用现代约束驱动搜索。我们的任何时间方法都可以学习最佳,递归和大程序并支持谓词发明。我们对三个领域的实验(分类,归纳,普通游戏和计划综合)表明,我们的方法可以提高预测准确性和降低学习时间。
translated by 谷歌翻译
归纳逻辑编程(ILP)的目标是学习解释一组示例的程序。直到最近,大多数关于ILP的研究有针对性的学习药品计划。 ELASP系统改为了解回答设置程序(ASP)。学习这种表达计划大大扩大了ILP的适用性;例如,启用偏好学习,学习常识知识,包括默认和例外,以及学习非确定性理论。 ILASP的早期版本可以考虑Meta-Level ILP方法,该方法将学习任务作为逻辑程序编码,并将搜索委派给ASP求解器。最近,ILASP已经向一种新的方法转移,这是由冲突驱动的SAT和ASP求解器的启发。该方法的基本思想称为冲突驱动的ILP(CDILP),用于迭代地对假设的搜索进行交互,所述约束的产生,所述约束的产生,其解释了当前假设不包括特定示例的原因。这些覆盖约束允许ilasp不仅仅排除当前假设,而是整整类的假设,不满足覆盖约束。本文正规规范了CDILP方法,并介绍了CDILP的ILASP3和ILASP4系统,该系统被证明比以前的ILASP系统更可扩展,特别是在存在噪声的情况下。逻辑编程理论与实践的考虑(TPLP)。
translated by 谷歌翻译
电子表格广泛用于桌面操作和演示。这些表的风格格式是演示和分析的重要属性。结果,流行的电子表格软件(例如Excel)支持基于数据依赖性规则的自动格式表。不幸的是,编写这些格式规则对于用户来说可能是具有挑战性的,因为这需要了解基础规则语言和数据逻辑。在本文中,我们提出了Cornet,这是一种神经符号系统,该系统解决了从格式化细胞的用户示例中自动学习此类格式规则的新问题。 Cornet从归纳计划的合成中汲取灵感,并根据半监督聚类和迭代决策树学习结合了符号规则,并与神经排名者一起产生条件格式的规则。为了激励和评估我们的方法,我们从超过40k真实电子​​表格的语料库中提取了表格的表格。使用这些数据,我们将短号与各种符号和神经基线进行了比较。我们的结果表明,与这些基线相比,Cornet可以在不同条件下更准确地学习规则。除了从用户示例中学习规则外,我们还提出了两个案例研究,以激发Cornet的其他用途:简化用户条件格式规则并恢复规则,即使用户可能手动格式化了其数据。
translated by 谷歌翻译
通过归纳逻辑编程(ILP)学习复杂程序仍然是一个强大的挑战。现有的高阶启用的ILP系统显示出改善的准确性和学习性能,但仍然受到潜在学习机制的局限性的局限性。实验结果表明,我们通过高阶定义从失败范式的多功能学习的延伸显着提高了现有系统所需的繁重人类指导的学习表现。此外,我们提供了一个理论框架,捕获我们的扩展名处理的高阶定义类。
translated by 谷歌翻译
通过归纳逻辑编程(ILP)综合大型逻辑程序通常需要中间定义。但是,用强化谓词混乱假设空间通常会降低性能。相比之下,梯度下降提供了一种有效的方法来在此类高维空间中找到溶液。到目前为止,神经符号ILP方法尚未完全利用这一点。我们提出了一种基于ILP的合成方法,该方法受益于大规模谓词发明,利用了高维梯度下降的功效。我们发现包含十个辅助定义以上的符号解决方案。这超出了现有的神经符号ILP系统的成就,因此构成了该领域的里程碑。
translated by 谷歌翻译
我们提出了答案设置的程序,该程序指定和计算在分类模型上输入的实体的反事实干预。关于模型的结果,生成的反事实作为定义和计算分类所在实体的特征值的基于因果的解释分数的基础,即“责任分数”。方法和程序可以应用于黑盒式模型,也可以使用可以指定为逻辑程序的模型,例如基于规则的分类器。这项工作的主要重点是“最佳”反事实体的规范和计算,即导致最大责任分数的人。从它们中可以从原始实体中读取解释作为最大责任特征值。我们还扩展程序以引入图片语义或域知识。我们展示如何通过概率方法扩展方法,以及如何通过使用约束来修改潜在的概率分布。示出了在DLV ASP-Solver的语法中写入的若干程序,并与其运行。
translated by 谷歌翻译
We introduce a new rule-based optimization method for classification with constraints. The proposed method takes advantage of linear programming and column generation, and hence, is scalable to large datasets. Moreover, the method returns a set of rules along with their optimal weights indicating the importance of each rule for learning. Through assigning cost coefficients to the rules and introducing additional constraints, we show that one can also consider interpretability and fairness of the results. We test the performance of the proposed method on a collection of datasets and present two case studies to elaborate its different aspects. Our results show that a good compromise between interpretability and fairness on the one side, and accuracy on the other side, can be obtained by the proposed rule-based learning method.
translated by 谷歌翻译
本文提出了一种基于答案设置编程(ASP)的方法,用于代表自然语言文本生成的知识。文本中的知识是使用Neo Davidsonian的形式主义建模的,然后将其表示为答案集计划。相关的致辞知识另外导入Wordnet等资源,并在ASP中表示。然后可以使用所产生的知识库来在ASP系统的帮助下执行推理。这种方法可以促进许多自然语言任务,如自动问题应答,文本摘要和自动化问题。基于ASP的技术表示,例如默认推理,分层知识组织,默认值等的首选项,用于模拟完成这些任务所需的致辞推理方法。在本文中,我们描述了我们开发的CaspR系统,以自动解决在给出英语文本时回答自然语言问题的任务。 CASPR可以被视为一个系统,通过“了解”文本并已在队列数据集上进行了测试,具有有希望的结果。
translated by 谷歌翻译
复杂的推理问题是使用逻辑规则最清楚,很容易指定的,但是需要具有汇总的递归规则,例如计数和总和用于实际应用。不幸的是,此类规则的含义是一个重大挑战,导致许多不同的语义分歧。本文介绍了与汇总的递归规则的统一语义,扩展了统一的基础语义和约束语义,以否定为递归规则。关键思想是支持对不同语义基础的不同假设的简单表达,并正交使用其简单的含义来解释聚合操作。我们介绍了语义的形式定义,证明了语义的重要特性,并与先前的语义相比。特别是,我们提出了对聚集的有效推断,该推论为我们从文献中研究的所有示例提供了精确的答案。我们还将语义应用于各种挑战的示例,并表明我们的语义很简单,并且在所有情况下都与所需的结果相匹配。最后,我们描述了最具挑战性的示例实验,当他们可以计算正确的答案时,表现出与知名系统相比出现的出色性能。
translated by 谷歌翻译
Probabilistic Law Discovery (PLD) is a logic based Machine Learning method, which implements a variant of probabilistic rule learning. In several aspects, PLD is close to Decision Tree/Random Forest methods, but it differs significantly in how relevant rules are defined. The learning procedure of PLD solves the optimization problem related to the search for rules (called probabilistic laws), which have a minimal length and relatively high probability. At inference, ensembles of these rules are used for prediction. Probabilistic laws are human-readable and PLD based models are transparent and inherently interpretable. Applications of PLD include classification/clusterization/regression tasks, as well as time series analysis/anomaly detection and adaptive (robotic) control. In this paper, we outline the main principles of PLD, highlight its benefits and limitations and provide some application guidelines.
translated by 谷歌翻译
In this paper, we present a modular methodology that combines state-of-the-art methods in (stochastic) machine learning with traditional methods in rule learning to provide efficient and scalable algorithms for the classification of vast data sets, while remaining explainable. Apart from evaluating our approach on the common large scale data sets MNIST, Fashion-MNIST and IMDB, we present novel results on explainable classifications of dental bills. The latter case study stems from an industrial collaboration with Allianz Private Krankenversicherungs-Aktiengesellschaft which is an insurance company offering diverse services in Germany.
translated by 谷歌翻译
归纳逻辑编程是一种机器学习,其中从示例中了解了哪些逻辑程序。该学习通常相对于作为逻辑程序提供的一些背景知识发生。本文介绍了底部预处理,一种在ILP系统上生成初始约束的方法必须考虑。底部预处理将思想应用于逆征集到现代ILP系统。逆存在是一种有影响力的早期ILP方法,促进了progol。本文还提供$ \ Bot $ -popper,这是现代ILP系统Popper的底部预处理的实施。实验显示,底部预处理可以降低ILP系统的难题的学习时间。当问题中的背景知识量大时,这种减少可能是特别重要的。
translated by 谷歌翻译
我们提出了一种有效的可解释的神经象征模型来解决感应逻辑编程(ILP)问题。在该模型中,该模型是由在分层结构中组织的一组元规则构建的,通过学习嵌入来匹配元规则的事实和身体谓词来发明一阶规则。为了实例化它,我们专门设计了一种表现型通用元规则集,并证明了它们产生的喇叭条件的片段。在培训期间,我们注入了控制的\ PW {gumbel}噪声以避免本地最佳,并采用可解释性 - 正则化术语来进一步指导融合到可解释规则。我们在针对几种最先进的方法上证明我们对各种任务(ILP,视觉基因组,强化学习)的模型进行了验证。
translated by 谷歌翻译