在专着“强大的人工智能。关于超级智能的方法”中包含通用人工智能(AGI)的概述。作为拟人化研究领域,它包括大脑原理编程(BPP) - 大脑的普遍机制(原理)的形式化,并在神经组织组织的各个层面上实施。该专着在类别理论方面包含了这些原则的形式化。但是,这种形式化不足以开发用于使用信息的算法。在本文中,对于BPP的描述和建模,建议采用较早开发的数学模型和算法,该模型和算法对认知功能进行了建模,并基于众所周知的生理,心理和其他自然科学理论。本文使用以下理论的数学模型和算法:P.K.Anokhin功能性脑系统理论,Eleanor Rosch原型分类理论,Bob Rehder因果模型和“自然”分类。结果,获得了BPP的形式化,并提供了证明算法运行的计算机实验。
translated by 谷歌翻译
我们介绍了一种称为编程拼图的新型编程挑战,作为方案合成的客观和全面评估,并释放Python编程拼图的开源数据集(P3)。每个拼图由短Python程序$ F $定义,目标是找到一个使$ F $返回true的输入。谜题是目的,因为每个人都由其验证者$ F $的源代码完全指定,因此评估为测试候选解决方案所需的$ F $。它们不需要答案密钥或输入/输出示例,也不依赖于自然语言理解。该数据集是全面的,因为它跨越一系列困难和域的问题,从琐碎的字符串操纵问题,经典编程谜题(例如,河内塔),用于采访/竞争编程问题(例如,动态编程),在算法和数学中的长期开放问题(例如,因子)。我们开发基准枚举程序合成,GPT-3和能够解决难题的食盒求解器 - 即使没有访问任何参考解决方案 - 通过从他们自己的过去的解决方案中学习。 Codex表现最佳,解决高达18%的397个测试问题的测试问题,每次尝试和80%的问题占1,000个问题。在一个小的用户学习中,我们发现拼图解决性能和编码体验之间的正相关性,以及人类和AI求解器的难题难度之间。因此,P3的进一步改进可能对许多程序合成区域产生重大影响。
translated by 谷歌翻译
在科学和工程领域中,搜索优化问题是很多。长期以来,人工智能为搜索算法和旨在解决和建模搜索优化问题的宣言编程语言的发展做出了贡献。自动推理和知识表示是AI的子场,这些子场尤其归属这些发展。许多受欢迎的自动推理范式为用户提供支持优化语句的语言:MAXSAT或答案集编程,仅举几例。这些范式的语言以及它们在计算解决方案上表达质量条件的方式差异很大。在这里,我们提出了一个所谓权重系统的统一框架,该框架消除了范式之间的句法区别,并使我们能够看到范式提供的优化语句之间的基本相似之处和差异。这种统一的前景在自动推理和知识表示的优化和模块化研究中具有重要的简化和解释潜力,从而为弥合不同的形式主义和开发翻译求解器提供了技术手段。在逻辑编程(TPLP)的理论和实践中考虑的考虑因素。
translated by 谷歌翻译
如今,我们生活在一个极端的异质性时代。尽管传统的CPU架构种类繁多,但GPU和FPGA等加速器设备也出现在前景中,爆炸了可用解决方案池以执行应用程序。但是,由于硬件和软件之间的抽象关系,每个应用程序需求选择适当的设备是一项极具挑战性的任务。需要准确的自动优化算法才能应对当前硬件和软件的复杂性和多样性。最佳执行始终依赖于耗时的试验和错误方法。在过去的十年中,机器学习(ML)和自然语言处理(NLP)蓬勃发展,研究重点是深度建筑。在这种情况下,使用自然语言处理技术来源代码以进行自动调整任务是一个新兴的研究领域。在本文中,我们扩展了Cummins等人的工作,即DeepTune,该工作解决了加速OpenCL内核的最佳设备选择(CPU或GPU)的问题。我们确定了DeepTune的三个主要局限性,并基于这些局限性,我们提出了四个不同的DNN模型,可提供增强的源代码上下文信息。实验结果表明,我们提出的方法超过了康明斯等人的方法。工作,预测准确性最多可提高4%。
translated by 谷歌翻译
在多代理路径查找(MAPF)中,任务是从其初始位置找到多个代理的非冲突路径,以给定单个目标位置。 MAPF表示经常通过启发式搜索解决的古典人工智能问题。基于搜索的技术的重要替代方案是将MAPF编译为不同的形式主义,例如布尔满足性(SAT)。基于SAT的基于SAT的方法将SAT求解器视为外部工具,其任务是返回输入MAPF的布尔模型的所有决策变量的分配。我们在本短文中存在一种名为DPLL(MAPF)的新型编译方案,其中相对于MAPF规则的判定变量的部分分配的一致性检查直接集成到SAT求解器中。该方案允许在SAT求解器和一致性检查程序同时协同工作以创建布尔模型并搜索其令人满意的分配来进行更远的自动编译。
translated by 谷歌翻译
在本文中,我们提出了一种识别相同商品的方法。在电子商务方案中,通常通过图像和文本来描述商品。根据定义,相同的商品是具有相同关键属性并且认知与消费者相同的商品。有两个主要挑战:1)多模式表示的提取和融合。 2)通过比较阈值的表示之间的距离来验证两种商品是否相同的能力。为了解决上述问题,我们提出了一种基于自适应阈值的端到端相同的商品验证方法。我们使用双流网络分别提取商品嵌入和阈值嵌入,然后将它们串联以获得商品表示。我们的方法能够根据不同的商品获得不同的阈值,同时保持整个商品表示的索引性。我们在实验中验证了多模式特征融合的有效性和自适应阈值的优势。此外,我们的方法达到了0.8936的F1分数,并在排行榜上排名第三,完成了CCKS-2022知识图评估数字商务竞赛的第二项任务。代码和预估计的模型可在https://github.com/hanchenchen/ccks2022-track2-solution上找到。
translated by 谷歌翻译
神经网络越来越依赖于复杂安全系统(例如自动驾驶汽车)的组成部分。对在更大的验证周期中嵌入神经网络验证的工具和方法的需求很高。但是,由于关注的广泛验证属性,很难进行神经网络验证,通常每个验证属性仅适用于专用求解器中的验证。在本文中,我们展示了最初设计用于验证,验证和仿真金融基础架构的功能编程语言的Imandra如何为神经网络验证提供整体基础架构。我们开发了一个新颖的图书馆Checkinn,该图书馆在Imandra的神经网络上形式化,并涵盖了神经网络验证的不同重要方面。
translated by 谷歌翻译
A statistical ensemble of neural networks can be described in terms of a quantum field theory (NN-QFT correspondence). The infinite-width limit is mapped to a free field theory, while finite N corrections are mapped to interactions. After reviewing the correspondence, we will describe how to implement renormalization in this context and discuss preliminary numerical results for translation-invariant kernels. A major outcome is that changing the standard deviation of the neural network weight distribution corresponds to a renormalization flow in the space of networks.
translated by 谷歌翻译
调查变压器模型的推理能力,并为他们发现新的具有挑战性的任务,这是一个非常感兴趣的主题。最近的研究发现这些模型在表演自然语言表达的正式逻辑理论上表现出令人惊讶的强烈。然而,这些研究的缺点是他们没有考虑到逻辑理论,当随机均匀抽样时,不一定导致硬实例。我们提出了一种新的方法,用于创建挑战算法推理数据集,其专注于自然语言可满足性(NLSAT)问题。关键的想法是利用良好命题SAT问题的经验采样以及语言的复杂性学习的洞察力。这种方法允许我们轻松地从硬实例区分,并系统地提高Ruletaker等现有推理基准的复杂性。我们发现,鉴于足够的训练数据,当前的变压器令人惊讶地稳健地解决了产生的NLSAT基本上增加的难度问题。它们还表现出一定程度的规模不变性 - 概括到更大尺寸和范围的问题的能力。然而,我们的结果也揭示了重要的局限性:仔细的培训数据采样对于建立更大问题的模型来说至关重要,变压器模型的“有限的规模不变性”表明他们远非学习强大的演绎推理算法。
translated by 谷歌翻译
在贝叶斯网络(BNS)中,边缘方向对于因果推理和推理至关重要。然而,马尔可夫等价类考虑因素意味着它并不总是可以建立边缘方向,这就是许多BN结构学习算法不能从纯粹观察数据定向所有边缘的原因。此外,潜在的混乱会导致假阳性边缘。已经提出了相对较少的方法来解决这些问题。在这项工作中,我们介绍了从涉及观察数据集的离散数据和一个或多个介入数据集的离散数据的结构学习的混合MFGS-BS(Meance规则和快速贪婪等价搜索)算法。该算法假设存在潜在变量的因果不足,并产生部分祖先图形(PAG)。结构学习依赖于混合方法和新的贝叶斯评分范式,用于计算添加到学习图表的每个定向边缘的后验概率。基于众所周知的网络的实验结果高达109个变量和10K样本大小表明,MFGS-BS相对于最先进的结构提高了结构学习准确性,并且它是计算效率的。
translated by 谷歌翻译
Cohn and Umans proposed a framework for developing fast matrix multiplication algorithms based on the embedding computation in certain groups algebras. In subsequent work with Kleinberg and Szegedy, they connected this to the search for combinatorial objects called strong uniquely solvable puzzles (strong USPs). We begin a systematic computer-aided search for these objects. We develop and implement constraint-based algorithms build on reductions to $\mathrm{SAT}$ and $\mathrm{IP}$ to verify that puzzles are strong USPs, and to search for large strong USPs. We produce tight bounds on the maximum size of a strong USP for width $k \le 5$, construct puzzles of small width that are larger than previous work, and improve the upper bounds on strong USP size for $k \le 12$. Although our work only deals with puzzles of small-constant width, the strong USPs we find imply matrix multiplication algorithms that run in $O(n^\omega)$ time with exponent $\omega \le 2.66$. While our algorithms do not beat the fastest algorithms, our work provides evidence and, perhaps, a path to finding families of strong USPs that imply matrix multiplication algorithms that are more efficient than those currently known.
translated by 谷歌翻译
代表SAT实例的图表的视觉布局可以突出显示SAT实例的社区结构。SAT实例的社区结构与实例硬度和已知条款质量启发式方法有关。我们的工具SATVIZ使用可变交互图和强制定向的布局算法可视化CNF公式。借助SATVIZ,可以对条款证明进行动画,以连续突出最近学习子句的移动窗口中发生的变量。如果需要,Satviz还可以使用调整后的边缘权重创建可变交互图的新布局。在本文中,我们描述了Satviz的结构和特征集。我们还提出了一些使用Satviz创建的有趣的可视化。
translated by 谷歌翻译
我们考虑在以$ s $状态的地平线$ h $和$ a $ ACTIVE的偶发性,有限的,依赖于阶段的马尔可夫决策过程的环境中进行强化学习。代理商的性能是在与环境互动以$ t $插件互动后的遗憾来衡量的。我们提出了一种乐观的后验抽样算法(OPSRL),这是一种简单的后验抽样变体,仅需要许多后样品对数,$ h $,$ s $,$ a $和$ t $ a $ h $ s $ s $ a $ a $和$ t $一对。对于OPSRL,我们保证最多可容纳订单的高概率遗憾,$ \ wideTilde {\ mathcal {o}}}(\ sqrt {h^3sat})$忽略$ \ text {poly} \ log(hsat)$项。新型的新型技术成分是线性形式的新型抗浓缩不等式,可能具有独立感兴趣。具体而言,我们将Alfers and Dinges [1984]的Beta分布的基于正常近似的下限扩展到Dirichlet分布。我们的界限匹配订单$ \ omega(\ sqrt {h^3sat})$的下限,从而回答了Agrawal和Jia [2017b]在情节环境中提出的空旷问题。
translated by 谷歌翻译
本质语言允许用户在上述抽象级别指定约束问题,在该抽象级别进行约束建模决策。 Essence规范通过魅力自动建模工具精制到约束模型,该工具采用了一套细化规则。但是,本质是一种丰富的语言,其中有许多等同的方法来指定给定的问题。因此,用户可以省略域属性或抽象类型的使用,从而产生更少的细化规则,因此可以从中选择的减少的输出模型集。本文解决了在输入精华规范的变化面前自动恢复此信息以增加输出约束模型质量的稳健性。我们提出了可以更改决策变量的类型或添加缩小其域的属性的重构规则。我们展示了这种方法在模型的数量和质量方面的功效可以与原版相比,从转化的规格中产生。
translated by 谷歌翻译
用于解决众所周知的布尔满意度问题(SAT)的计算机程序,所谓的求解器已有数十年的改善。在解决方案过程中,这些求解器如此之快的原因之一是对求解过程中公式结构属性的隐含用法。这样的结构指标之一是所谓的树宽,它试图测量公式实例与变得容易的距离(类似树)。这项工作着重于基于逻辑的问题和基于树宽的方法和解决方案的工具。这些问题中的许多也与知识表示和推理(KR)以及人工智能(AI)有关。我们提出了一种新型的问题,这是由分解引导(DG)提到的。这种还原类型构成了解决自2004年以来一直开放的有界树宽的量化布尔公式(QBFS)问题的基础。该问题的解决方案随后产生了一种新方法,以证明精确的下限范围用于一系列进一步的形式主义在逻辑,KR和AI中。尽管已建立的下限,但我们还是通过直接使用树宽来实现一种算法来有效地求解SAT的扩展。我们的实施是基于查找实例的抽象,然后在此过程中逐步完善。因此,我们的观察结果证实,树宽是现代求解器设计中应考虑的重要措施。
translated by 谷歌翻译
Generating diverse solutions to the Boolean Satisfiability Problem (SAT) is a hard computational problem with practical applications for testing and functional verification of software and hardware designs. We explore the way to generate such solutions using Denoising Diffusion coupled with a Graph Neural Network to implement the denoising function. We find that the obtained accuracy is similar to the currently best purely neural method and the produced SAT solutions are highly diverse, even if the system is trained with non-random solutions from a standard solver.
translated by 谷歌翻译
在机器学习(ML)算法自动化或提供有关人员的后果决策的环境中,通常会激励个人决策主题以战略性地修改其可观察的属性以获得更有利的预测。结果,对评估规则进行培训的分布可能与其部署中运营的规则不同。尽管这种分配的变化通常可以阻碍准确的预测,但我们的工作确定了由于战略反应而引起的转变相关的独特机会:我们表明我们可以有效地利用战略反应来恢复可观察到的特征与我们希望预测的可观察到的因果关系,即使在没有观察到的混杂变量的情况下。具体而言,我们的工作通过观察到部署模型的序列可以看作是影响代理可观察到的特征但不会直接影响其结果的工具,从而建立了对ML模型的战略响应与仪器变量(IV)回归之间的新颖联系。我们表明,我们的因果恢复方法可用于改善几个重要标准的决策:个人公平,代理结果和预测风险。特别是,我们表明,如果决策主体在修改非毒物属性的能力上有所不同,那么与因果系数偏离的任何决策规则都可能导致(潜在无限)个体级别的不公平性。
translated by 谷歌翻译
We propose a framework for learning a fragment of probabilistic computation tree logic (pCTL) formulae from a set of states that are labeled as safe or unsafe. We work in a relational setting and combine ideas from relational Markov Decision Processes with pCTL model-checking. More specifically, we assume that there is an unknown relational pCTL target formula that is satisfied by only safe states, and has a horizon of maximum $k$ steps and a threshold probability $\alpha$. The task then consists of learning this unknown formula from states that are labeled as safe or unsafe by a domain expert. We apply principles of relational learning to induce a pCTL formula that is satisfied by all safe states and none of the unsafe ones. This formula can then be used as a safety specification for this domain, so that the system can avoid getting into dangerous situations in future. Following relational learning principles, we introduce a candidate formula generation process, as well as a method for deciding which candidate formula is a satisfactory specification for the given labeled states. The cases where the expert knows and does not know the system policy are treated, however, much of the learning process is the same for both cases. We evaluate our approach on a synthetic relational domain.
translated by 谷歌翻译
变压器架构最近在图表表示学习中引起了人们的注意,因为它自然地克服了图神经网络(GNN)的几个局限性,避免了它们严格的结构电感偏置,而仅通过位置编码来编码图形结构。在这里,我们表明,具有位置编码的变压器生成的节点表示不一定捕获它们之间的结构相似性。为了解决这个问题,我们提出了结构感知的变压器,这是一类简单而灵活的图形变压器,建立在新的自我发项机制的基础上。这一新的自我注意力通过在计算注意力之前提取植根于每个节点的子图表来结合结构信息。我们提出了几种自动生成子图表表示的方法,并从理论上说明结果表示至少与子图表一样表现力。从经验上讲,我们的方法在五个图预测基准上实现了最先进的性能。我们的结构感知框架可以利用任何现有的GNN提取子图表表示,我们表明它系统地改善了相对于基本GNN模型的性能,成功地结合了GNN和变形金刚的优势。我们的代码可在https://github.com/borgwardtlab/sat上找到。
translated by 谷歌翻译
可控图像标题(CIC)任务旨在在指定的控制信号上生成条件。提出了几种与结构相关的控制信号来控制句子的语义结构,例如句子长度和语音标签序列。然而,由于基于精度的奖励主要针对内容而不是语义结构,因此现有的增强培训方法不适用于结构相关的CIC模型。缺乏加固训练导致偏差和优化功能和评估度量之间的不一致。在本文中,我们提出了一种用于结构相关控制信号的新型加固训练方法:自注释培训(SAT),提高CIC模型的准确性和可控性。在SAT中,设计递归注释机制(RAM)以强制输入控制信号以匹配实际输出句子。此外,我们提出了额外的对准奖励来Finetune在SAT方法后培训的CIC模型,这进一步提高了模型的可控性。在MSCOCO基准测试中,我们对不同结构相关的控制信号和不同基线模型进行广泛的实验,结果表明了我们方法的有效性和普遍性。
translated by 谷歌翻译