智能论文笔记

Probabilistic modeling of rational communication with conditionals

Britta Grusdt , Daniel Lassiter , Michael Franke

分类：自然语言处理

2021-05-12

尽管大量的工作已经审查了条件句子的含义，但对其务实使用和解释的正式模型的关注要少得多。在这里，我们采用一种概率方法来实用务实的推理，以灵活地整合有关富有结构化世界国家的梯度信念。我们基于关于说话者的话语生产方案的假设，对听众对他们先前关于世界因果结构的信念以及随之而来的前身的共同概率进行了建模。我们表明，当提供自然上下文假设时，我们的模型统一地解释了文献中的许多推论，包括认识论推断，条件完美以及对条件和条件的依赖性。我们认为，这种方法还有助于解释杜文（Douven，2012）引入的三个难题有关有条件的更新：取决于话语背景，听众对先决条件的信念可能会增加，减少或保持不变。

translated by 谷歌翻译

On the Optimality of Vagueness: "Around", "Between", and the Gricean Maxims

Paul Egré , Benjamin Spector , Adèle Mortier , Steven Verheyen

分类：自然语言处理

2020-08-26

为什么普通语言模糊不清？我们认为，在合作扬声器没有完全了解世界的情况下，使用模糊表达可以在真实性（Gricean质量）和信息性之间提供最佳权衡（Gricean数量）。专注于诸如“周围”的近似的表达，这表明他们允许扬声器传达间接概率信息，这种信息可以使听众更准确地表示发言者可用的信息的信息。更精确的表达将是（之间的间隔“）。也就是说，模糊的句子可以比他们精确的对应物更有信息。我们对“周围”解释的概率处理，并提供了解释和使用“围绕” - 理性语音法（RSA）框架的典范。在我们的账户中，扬声器分配事项的形状不是由RSA框架标准用于模糊谓词的词汇不确定性模型的方式预测。我们利用我们的方法绘制关于模糊表达的语义灵活性的进一步教训及其对更精确的含义的不可缩短。

translated by 谷歌翻译

From partners to populations: A hierarchical Bayesian account of coordination and convention

Robert D. Hawkins , Michael Franke , Michael C. Frank , Adele E. Goldberg , Kenny Smith , Thomas L. Griffiths , Noah D. Goodman

分类：自然语言处理 | 人工智能

2021-04-12

语言是协调问题的强大解决方案：他们提供了稳定的，有关我们所说的单词如何对应于我们头脑中的信仰和意图的共同期望。然而，在变量和非静止社会环境中的语言使用需要语言表征来灵活：旧词在飞行中获取新的临时或合作伙伴特定含义。在本文中，我们介绍了柴（通过推理的连续分层适应），一个分层贝叶斯的协调理论和会议组织，旨在在这两个基本观察之间调和长期张力。我们认为，沟通的中央计算问题不仅仅是传输，如在经典配方中，而是在多个时间尺度上持续学习和适应。合作伙伴特定的共同点迅速出现在数型互动中的社会推论中，而社群范围内的社会公约是稳定的前锋，这些前锋已经抽象出与多个合作伙伴的互动。我们展示了新的实证数据，展示了我们的模型为多个现象提供了对先前账户挑战的计算基础：（1）与同一合作伙伴的重复互动的更有效的参考表达的融合（2）将合作伙伴特定的共同基础转移到陌生人，并（3）交际范围的影响最终会形成。

translated by 谷歌翻译

Explanation in Artificial Intelligence: Insights from the Social Sciences

Tim Miller

分类：

2017-06-22

There has been a recent resurgence in the area of explainable artificial intelligence as researchers and practitioners seek to make their algorithms more understandable. Much of this research is focused on explicitly explaining decisions or actions to a human observer, and it should not be controversial to say that looking at how humans explain to each other can serve as a useful starting point for explanation in artificial intelligence. However, it is fair to say that most work in explainable artificial intelligence uses only the researchers' intuition of what constitutes a 'good' explanation. There exists vast and valuable bodies of research in philosophy, psychology, and cognitive science of how people define, generate, select, evaluate, and present explanations, which argues that people employ certain cognitive biases and social expectations towards the explanation process. This paper argues that the field of explainable artificial intelligence should build on this existing research, and reviews relevant papers from philosophy, cognitive psychology/science, and social psychology, which study these topics. It draws out some important findings, and discusses ways that these can be infused with work on explainable artificial intelligence.

translated by 谷歌翻译

Certain and Uncertain Inference with Trivalent Conditionals

Paul Égré , Lorenzo Rossi , Jan Sprenger

分类：人工智能

2022-07-17

对指示性有条件的研究通常旨在确定其真实条件，或者解释我们应该如何与他们进行推理以及何时可以主张它们。本文通过阐明指示性有条件的三价，真实功能的真理条件来整合这些语义和认识论项目。基于此框架，我们提供了有条件概率的非经典说明，以及有条件推理的两个逻辑：（i）从某些前提中推断的逻辑C，可以推断推断推理；（ii）从不确定前提中推断的逻辑U，概括了不诚实的推理。两种逻辑在其领域都非常有吸引力。它们为有条件推理提供了一个统一的框架，概括了现有理论（例如，亚当斯的“合理推论”逻辑），并对有关Modus Ponens，Import-Export和其他条件逻辑原理的争议进行了深入的分析。

translated by 谷歌翻译

A pragmatic account of the weak evidence effect

Samuel A. Barnett , Robert D. Hawkins , Thomas L. Griffiths

分类：自然语言处理

2021-12-07

语言不仅用于通知。我们经常寻求通过争论赞成特定观点来说服。说服提出了许多对信仰更新的古典账户的挑战，因为信息不能以面值采取。在包含新信息时，应如何占发言者的“隐藏议程”？在这里，我们延长了最近的递归社会推理概率模型，以便有说服力的目标，并表明我们的模型为什么为什么弱良好的争论可能反馈，这是一种称为弱证据效应的现象。批判性地，我们的模型预测了信仰更新和演讲者期望之间的关系：当时扬声器在有说服力的目标下行动时，弱的证据应该只有反馈，这意味着没有更强的证据。我们介绍了一个简单的实验范式，称为棍棒竞赛，以衡量弱证据效应取决于发言者期望的程度，并表明务实的侦听器模型占经验数据比替代模型更好。我们的研究结果表明了社会推理的理性模型的潜在途径，以进一步照亮决策现象。

translated by 谷歌翻译

Aleatoric and Epistemic Uncertainty in Machine Learning: An Introduction to Concepts and Methods

Eyke Hüllermeier , Willem Waegeman

分类：

2019-10-21

The notion of uncertainty is of major importance in machine learning and constitutes a key element of machine learning methodology. In line with the statistical tradition, uncertainty has long been perceived as almost synonymous with standard probability and probabilistic predictions. Yet, due to the steadily increasing relevance of machine learning for practical applications and related issues such as safety requirements, new problems and challenges have recently been identified by machine learning scholars, and these problems may call for new methodological developments. In particular, this includes the importance of distinguishing between (at least) two different types of uncertainty, often referred to as aleatoric and epistemic. In this paper, we provide an introduction to the topic of uncertainty in machine learning as well as an overview of attempts so far at handling uncertainty in general and formalizing this distinction in particular.

translated by 谷歌翻译

How to marry a star: probabilistic constraints for meaning in context

Katrin Erk , Aurelie Herbelot

分类：自然语言处理

2020-09-16

在本文中，我们得出了“上下文中的单词含义”的概念，将其描述为强化和概念。我们介绍了一个框架，用于在上下文中指定对单词含义的局部和全局约束以及它们的相互作用，从而建模在话语解释中观察到的各种词汇转移和歧义。我们将句子表示为“情况描述系统”，这是一种概率模型，它将话语理解是一种对自己描述一种或多种情况描述的心理过程，该过程将解释观察到的话语。我们展示了如何在实践中实现该系统，并将其应用于包含各种背景化现象的示例。

translated by 谷歌翻译

Assessing Confidence with Assurance 2.0

John Rushby , Robin Bloomfield

分类：人工智能

2022-05-03

保证案件旨在为其最高主张的真理提供合理的信心，这通常涉及安全或保障。那么一个自然的问题是，案件提供了“多少”信心？我们认为，置信度不能简化为单个属性或测量。取而代之的是，我们建议它应该基于以三种不同观点的属性为基础：正面，消极和残留疑问。积极的观点考虑了该案件的证据和总体论点结合起来的程度，以表明其主张的信念是正当的。我们为理由设置了一个高标准，要求它是不可行的。对此的主要积极度量是健全性，它将论点解释为逻辑证明。对证据的信心可以概率地表达，我们使用确认措施来确保证据的“权重”跨越了一定的阈值。此外，可以通过使用概率逻辑的参数步骤从证据中汇总概率，以产生我们所谓的索赔概率估值。负面观点记录了对案件的怀疑和挑战，通常表示为叛逆者及其探索和解决。保证开发商必须防止确认偏见，并应在制定案件时大力探索潜在的叛逆者，并应记录下来及其解决方案，以避免返工并帮助审阅者。残留疑问：世界不确定，因此并非所有潜在的叛逆者都可以解决。我们探索风险，可能认为它们是可以接受或不可避免的。但是，至关重要的是，这些判断是有意识的判断，并且在保证案例中记录下来。本报告详细介绍了这些观点，并指示了我们的保证2.0的原型工具集如何协助他们的评估。

translated by 谷歌翻译

In conversation with Artificial Intelligence: aligning language models with human values

Atoosa Kasirzadeh , Iason Gabriel

分类：自然语言处理

2022-09-01

大规模的语言技术越来越多地用于与人类在不同情况下的各种形式的交流中。这些技术的一种特殊用例是对话剂，它会根据提示和查询输出自然语言文本。这种参与方式提出了许多社会和道德问题。例如，将对话剂与人类规范或价值观相结合意味着什么？它们应该与哪些规范或价值观保持一致？如何实现这一目标？在本文中，我们提出了许多步骤来帮助回答这些问题。我们首先要对对话代理人和人类对话者之间语言交流的基础进行哲学分析。然后，我们使用此分析来识别和制定理想的对话规范，这些规范可以控制人类与对话代理之间的成功语言交流。此外，我们探讨了如何使用这些规范来使对话剂与在一系列不同的话语领域中的人类价值相结合。最后，我们讨论了我们对与这些规范和价值观一致的对话代理设计的建议的实际含义。

translated by 谷歌翻译

Inductive Biases for Deep Learning of Higher-Level Cognition

Anirudh Goyal , Yoshua Bengio

分类：机器学习 | 人工智能 | (统计)机器学习

2020-11-30

一个令人着迷的假设是，人类和动物的智力可以通过一些原则（而不是启发式方法的百科全书清单）来解释。如果这个假设是正确的，我们可以更容易地理解自己的智能并建造智能机器。就像物理学一样，原理本身不足以预测大脑等复杂系统的行为，并且可能需要大量计算来模拟人类式的智力。这一假设将表明，研究人类和动物所剥削的归纳偏见可以帮助阐明这些原则，并为AI研究和神经科学理论提供灵感。深度学习已经利用了几种关键的归纳偏见，这项工作考虑了更大的清单，重点是关注高级和顺序有意识的处理的工作。阐明这些特定原则的目的是，它们有可能帮助我们建立从人类的能力中受益于灵活分布和系统概括的能力的AI系统，目前，这是一个领域艺术机器学习和人类智力。

translated by 谷歌翻译

Is it possible not to cheat on the Turing Test: Exploring the potential and challenges for true natural language 'understanding' by computers

Lize Alberts

分类：自然语言处理 | 人工智能

2022-06-29

最近围绕语言处理模型的复杂性的最新炒作使人们对机器获得了类似人类自然语言的指挥的乐观情绪。人工智能中自然语言理解的领域声称在这一领域取得了长足的进步，但是，在这方面和其他学科中使用“理解”的概念性清晰，使我们很难辨别我们实际上有多近的距离。目前的方法和剩余挑战的全面，跨学科的概述尚待进行。除了语言知识之外，这还需要考虑我们特定于物种的能力，以对，记忆，标签和传达我们（足够相似的）体现和位置经验。此外，测量实际约束需要严格分析当前模型的技术能力，以及对理论可能性和局限性的更深入的哲学反思。在本文中，我将所有这些观点（哲学，认知语言和技术）团结在一起，以揭开达到真实（人类般的）语言理解所涉及的挑战。通过解开当前方法固有的理论假设，我希望说明我们距离实现这一目标的实际程度，如果确实是目标。

translated by 谷歌翻译

Causal Fairness Analysis

Drago Plecko , Elias Bareinboim

分类：人工智能 | 机器学习 | (统计)机器学习

2022-07-23

基于AI和机器学习的决策系统已在各种现实世界中都使用，包括医疗保健，执法，教育和金融。不再是牵强的，即设想一个未来，自治系统将推动整个业务决策，并且更广泛地支持大规模决策基础设施以解决社会最具挑战性的问题。当人类做出决定时，不公平和歧视的问题普遍存在，并且当使用几乎没有透明度，问责制和公平性的机器做出决定时（或可能会放大）。在本文中，我们介绍了\ textit {Causal公平分析}的框架，目的是填补此差距，即理解，建模，并可能解决决策设置中的公平性问题。我们方法的主要见解是将观察到数据中存在的差异的量化与基本且通常是未观察到的因果机制收集的因果机制的收集，这些机制首先会产生差异，挑战我们称之为因果公平的基本问题分析（FPCFA）。为了解决FPCFA，我们研究了分解差异和公平性的经验度量的问题，将这种变化归因于结构机制和人群的不同单位。我们的努力最终达到了公平地图，这是组织和解释文献中不同标准之间关系的首次系统尝试。最后，我们研究了进行因果公平分析并提出一本公平食谱的最低因果假设，该假设使数据科学家能够评估不同影响和不同治疗的存在。

translated by 谷歌翻译

Causal versions of Maximum Entropy and Principle of Insufficient Reason

Dominik Janzing

分类： (统计)机器学习 | 机器学习

2021-02-07

由于没有理由更喜欢另一个，因此原因不足（PIR）的原则为随机实验的每种替代方案分配相同的概率。最大熵原理（MaxEnt）将PIR推广到给出期望等预期的统计信息。众所周知，这两种原则都会导致矛盾的概率更新，用于导致和效果的联合分布。这是因为在条件p（效果）上的约束导致p（原因）的变化为导致的原因的值较高的概率，这些值为效果提供更多选项，表明“有意行为”。因此，早期的工作根据因果秩序顺序地最大化（条件）熵，但除了玩具例子的合理性之外，没有进一步的理由。我们通过将限制分离为从原因产生效果的机制的原因和限制的限制来证明PIR和Maxent的因果修改。我们进一步描绘了原因PIR的原因也需要“信息几何因果推理”。我们简要讨论了概括最大值的原因版本到任意因果表达的问题。

translated by 谷歌翻译

A Tutorial on Learning With Bayesian Networks

David Heckerman

分类：机器学习 | 人工智能 | (统计)机器学习

2020-02-01

贝叶斯网络是一种图形模型，用于编码感兴趣的变量之间的概率关系。当与统计技术结合使用时，图形模型对数据分析具有几个优点。一个，因为模型对所有变量中的依赖性进行编码，因此它易于处理缺少某些数据条目的情况。二，贝叶斯网络可以用于学习因果关系，因此可以用来获得关于问题域的理解并预测干预的后果。三，因为该模型具有因果和概率语义，因此是结合先前知识（通常出现因果形式）和数据的理想表示。四，贝叶斯网络与贝叶斯网络的统计方法提供了一种有效和原则的方法，可以避免数据过剩。在本文中，我们讨论了从先前知识构建贝叶斯网络的方法，总结了使用数据来改善这些模型的贝叶斯统计方法。关于后一项任务，我们描述了学习贝叶斯网络的参数和结构的方法，包括使用不完整数据学习的技术。此外，我们还联系了贝叶斯网络方法，以学习监督和无监督学习的技术。我们说明了使用真实案例研究的图形建模方法。

translated by 谷歌翻译

Online Handbook of Argumentation for AI: Volume 3

Lars Bengel , Elfia Bezou-Vrakatseli , Lydia Blümel , Federico Castagna , Giulia D'Agostino , Daphne Odekerken , Minal Suresh Patil , Jordan Robinson , Hao Wu , Andreas Xydis

分类：人工智能

2022-12-15

This volume contains revised versions of the papers selected for the third volume of the Online Handbook of Argumentation for AI (OHAAI). Previously, formal theories of argument and argument interaction have been proposed and studied, and this has led to the more recent study of computational models of argument. Argumentation, as a field within artificial intelligence (AI), is highly relevant for researchers interested in symbolic representations of knowledge and defeasible reasoning. The purpose of this handbook is to provide an open access and curated anthology for the argumentation research community. OHAAI is designed to serve as a research hub to keep track of the latest and upcoming PhD-driven research on the theory and application of argumentation in all areas related to AI.

translated by 谷歌翻译

Dimensional Modeling of Emotions in Text with Appraisal Theories: Corpus Creation, Annotation Reliability, and Prediction

Enrica Troiano , Laura Oberländer , Roman Klinger

分类：自然语言处理

2022-06-10

情绪分析中最突出的任务是为文本分配情绪，并了解情绪如何在语言中表现出来。自然语言处理的一个重要观察结果是，即使没有明确提及情感名称，也可以通过单独参考事件来隐式传达情绪。在心理学中，被称为评估理论的情感理论类别旨在解释事件与情感之间的联系。评估可以被形式化为变量，通过他们认为相关的事件的人们的认知评估来衡量认知评估。其中包括评估事件是否是新颖的，如果该人认为自己负责，是否与自己的目标以及许多其他人保持一致。这样的评估解释了哪些情绪是基于事件开发的，例如，新颖的情况会引起惊喜或不确定后果的人可能引起恐惧。我们在文本中分析了评估理论对情绪分析的适用性，目的是理解注释者是否可以可靠地重建评估概念，如果可以通过文本分类器预测，以及评估概念是否有助于识别情感类别。为了实现这一目标，我们通过要求人们发短信描述触发特定情绪并披露其评估的事件来编译语料库。然后，我们要求读者重建文本中的情感和评估。这种设置使我们能够衡量是否可以纯粹从文本中恢复情绪和评估，并为判断模型的绩效指标提供人体基准。我们将文本分类方法与人类注释者的比较表明，两者都可以可靠地检测出具有相似性能的情绪和评估。我们进一步表明，评估概念改善了文本中情绪的分类。

translated by 谷歌翻译

Interpreting Dynamical Systems as Bayesian Reasoners

Nathaniel Virgo , Martin Biehl , Simon McGregor

分类：人工智能

2021-12-27

积极推论的中央概念是，物理系统参数概率的内部状态在外部世界的状态下衡量。这些可以被视为代理人的信仰，以贝叶斯先前或后部表示。在这里，我们开始发展一般理论，这将告诉我们何时适合将国家解释为以这种方式代表信仰。我们专注于系统可以被解释为执行贝叶斯滤波或贝叶斯推断的情况。我们使用类别理论的技术提供对存在这种解释的方法的形式定义。

translated by 谷歌翻译

Building Machines That Learn and Think Like People

Brenden M. Lake , Tomer D. Ullman , Joshua B. Tenenbaum , Samuel J. Gershman

分类：

2016-04-01

Recent progress in artificial intelligence (AI) has renewed interest in building systems that learn and think like people. Many advances have come from using deep neural networks trained end-to-end in tasks such as object recognition, video games, and board games, achieving performance that equals or even beats humans in some respects. Despite their biological inspiration and performance achievements, these systems differ from human intelligence in crucial ways. We review progress in cognitive science suggesting that truly human-like learning and thinking machines will have to reach beyond current engineering trends in both what they learn, and how they learn it. Specifically, we argue that these machines should (a) build causal models of the world that support explanation and understanding, rather than merely solving pattern recognition problems; (b) ground learning in intuitive theories of physics and psychology, to support and enrich the knowledge that is learned; and (c) harness compositionality and learning-to-learn to rapidly acquire and generalize knowledge to new tasks and situations. We suggest concrete challenges and promising routes towards these goals that can combine the strengths of recent neural network advances with more structured cognitive models.

translated by 谷歌翻译

Descriptive vs. inferential community detection: pitfalls, myths and half-truths

Tiago P. Peixoto

分类： (统计)机器学习

2021-11-30

社区检测是网络科学中最重要的方法领域之一，在过去的几十年里引起了大量关注的方法之一。该区域处理网络的自动部门到基础构建块中，目的是提供其大规模结构的概要。尽管它的重要性和广泛的采用普及，所谓的最先进和实际在各种领域实际使用的方法之间存在明显的差距。在这里，我们试图通过根据是否具有“描述性”或“推论”目标来划分现有方法来解决这种差异。虽然描述性方法在基于社区结构的直观概念的网络中找到模式的模式，但是推理方法阐述了精确的生成模型，并尝试将其符合数据。通过这种方式，他们能够为网络形成机制提供见解，并以统计证据支持的方式与随机性的单独结构。我们审查如何使用推论目标采用描述性方法被陷入困境和误导性答案，因此应该一般而言。我们认为推理方法更通常与更清晰的科学问题一致，产生更强大的结果，并且应该是一般的首选。我们试图消除一些神话和半真半假在实践中使用社区检测时，努力改善这些方法的使用以及对结果的解释。

translated by 谷歌翻译