智能论文笔记

A Model of Anaphoric Ambiguities using Sheaf Theoretic Quantum-like Contextuality and BERT

Kin Ian Lo , Mehrnoosh Sadrzadeh , Shane Mansfield

分类：自然语言处理 | 人工智能 | 机器学习 | 神经与进化计算

2022-08-11

自然语言的歧义并不能阻止我们使用它，而环境有助于跨越想法。尽管如此，它们还是对合格机器的开发构成了一个关键挑战，以理解自然语言并像人类一样使用它。情境性是量子力学中无与伦比的现象，在其中提出了不同的数学形式主义来理解和推理。在本文中，我们为表现出类似量子的上下文性的放置歧义构建了一个模式。我们使用最近开发的捆绑理论背景性标准，该标准适用于信号模型。然后，我们利用神经词嵌入引擎bert将模式实例化为自然语言示例，并为实例提取概率分布。结果，在Bert Corpora使用的自然语言中发现了大量的捆绑示例。我们的希望是，这些示例将为将来的研究铺平道路，并找到将量子计算应用程序扩展到自然语言处理的方法。

translated by 谷歌翻译

The Causal Structure of Semantic Ambiguities

Daphne Wang , Mehrnoosh Sadrzadeh

分类：自然语言处理 | 人工智能

2022-06-14

歧义是一种自然语言现象，发生在不同级别的语法，语义和语用学水平。它经过广泛的研究；例如，在心理语言学中，我们对人类的歧义过程进行了各种竞争性研究。这些研究是经验性的，并且基于眼影测量。在这里，我们迈出了对这些过程进行正式化的语义歧义的第一步，在该过程中我们确定了两个特征的存在：（1）不同可能解释的联合合理性度，（2）因果结构，根据某些单词在过程中在过程中起着更为重要的作用。 Gogioso和Pinzani在QPL 2021中开发的确定因果关系的新型横扫理论模型提供了建模和理由的工具。我们将该理论应用于从心理语言学文献中提取的模棱两可短语的数据集，以及我们使用亚马逊机械Turk发动机收集的人类合理性判断。我们测量了短语中不同歧义顺序的因果分数，并发现了两个突出的顺序：从主语动词中从主语到动词，从对象到动词对象短语中的动词。我们还发现了延迟歧义多义与同义动词的证据，再次与心理语言发现兼容。

translated by 谷歌翻译

Quantum Mathematics in Artificial Intelligence

Dominic Widdows , Kirsty Kitto , Trevor Cohen

分类：人工智能 | 自然语言处理

2021-01-12

十年自2010年以来，人工智能成功一直处于计算机科学和技术的最前沿，传染媒介空间模型已经巩固了人工智能最前沿的位置。与此同时，量子计算机已经变得更加强大，主要进步的公告经常在新闻中。这些区域的基础的数学技术比有时意识到更多的共同之处。传染媒介空间在20世纪30年代的量子力学的公理心脏上采取了位置，这一采用是从矢量空间的线性几何形状推导逻辑和概率的关键动机。粒子之间的量子相互作用是使用张量产品进行建模的，其也用于表达人工神经网络中的物体和操作。本文介绍了这些常见的数学区域中的一些，包括如何在人工智能（AI）中使用的示例，特别是在自动推理和自然语言处理（NLP）中。讨论的技术包括矢量空间，标量产品，子空间和含义，正交投影和否定，双向矩阵，密度矩阵，正算子和张量产品。应用领域包括信息检索，分类和含义，建模字传感和歧义，知识库的推断和语义构成。其中一些方法可能会在量子硬件上实现。该实施中的许多实际步骤都处于早期阶段，其中一些已经实现了。解释一些常见的数学工具可以帮助AI和量子计算中的研究人员进一步利用这些重叠，识别和沿途探索新方向。

translated by 谷歌翻译

A Quantum Natural Language Processing Approach to Pronoun Resolution

Hadi Wazni , Kin Ian Lo , Lachlan McPheat , Mehrnoosh Sadrzadeh

分类：自然语言处理

2022-08-10

我们使用具有软次指数模式的兰贝克微积分来建模和理由，例如Anaphora和Ellipsis。该逻辑的语义是通过使用截短的Fock空间获得的，这是我们以前的工作中开发的。我们通过新的字符串图描述了这些语义计算。Fock Space语义的优势是，使用机器学习可以从大量数据中学到其术语，并且可以在主流自然语言任务上进行实验。此外，由于从向量空间到量子电路的现有翻译，我们还可以在量子计算机及其模拟器（例如IBMQ范围）上学习这些术语。我们将现有的翻译扩展到Fock空间，并为话语关系开发量子电路语义。然后，我们在确定的代词分辨率任务中对这些电路的IBMQ进行了模拟，其中在解析过度时，模型记录了最高精度。

translated by 谷歌翻译

Language Modeling with Reduced Densities

Tai-Danae Bradley , Yiannis Vlassopoulos

分类：自然语言处理 | 机器学习

2020-07-08

这项工作起源于观察到，今天的最先进的统计语言模型不仅符合他们的性能，而且非常重要 - 因为它们完全从非结构化文本数据中的相关性建立。后一种观察会提示一个基本的问题在于本文的核心：非结构化文本数据中存在的数学结构是什么？我们提出了丰富的类别理论作为自然答案。我们展示了来自有限字母表的符号序列，例如在文本语料库中发现的那些，形成富含概率的类别。然后，我们解决了第二个基本问题：如何以保留分类结构的方式存储和建模此信息？我们通过从我们丰富的文本类别构建一个归力来回答这一点，以对特定的丰富的密度运营商类别。后者利用了积极的Semidefinite运算符上的Loewner订单，这可以进一步解释为一个有关的玩具例子。

translated by 谷歌翻译

Characterizing Idioms: Conventionality and Contingency

Michaela Socolof , Jackie Chi Kit Cheung , Michael Wagner , Timothy J. O'Donnell

分类：自然语言处理

2021-04-17

成语与大多数短语不同。首先，成语中的单词具有非规范含义。其次，习语中单词的非传统含义取决于习惯中其他单词的存在。语言理论在这些特性是否相互依赖，以及是否需要特殊的理论机制来容纳成语方面有所不同。我们定义了与上述属性相对应的两个度量，并使用BERT（Devlin等，2019）和XLNet实施它们（Yang等，2019）。我们表明，成语落在两个维度的预期交集处，但是尺寸本身并不相关。我们的结果表明，处理习语的特殊机械可能不保证。

translated by 谷歌翻译

A Quantum Natural Language Processing Approach to Musical Intelligence

Eduardo Reck Miranda , Richie Yeung , Anna Pearson , Konstantinos Meichanetzidis , Bob Coecke

分类：人工智能

2021-11-10

用于音乐的人工智能（AI）的巨大进展，特别是对于音乐作品和访问大型数据库来通过互联网进行商业化。我们有兴趣进一步推进这一领域，专注于构成。与目前的黑盒AI方法相比，我们正在为生成音乐系统支持可解释的组成前景。特别是，我们正在从分布组成分类（Discocat）建模框架中导入方法，用于自然语言处理（NLP），由音乐语法激励。量子计算是一种新生的技术，它很可能及时影响音乐行业。因此，我们正在开创Quantum自然语言处理（QNLP）方法来开发新一代智能音乐系统。这项工作从Quantum Hardware上的孤立语言模型的先前实验实施中。在Quanthoven，曾经构建的第一概念证明，（a）表明可以编程量子计算机来学习对传送不同含义和（b）的音乐来说明这种能力如何可能会利用开发一个系统来组成有意义的音乐。在讨论当前对音乐的理解作为通信介质及其与自然语言的关系之后，本章侧重于开发的技术（a）编码音乐组合物作为量子电路，（b）设计量子分类器。章节以与系统创建的组合物的演示结束。

translated by 谷歌翻译

Integrating Linguistic Theory and Neural Language Models

Bai Li

分类：自然语言处理

2022-07-20

基于变压器的语言模型最近在许多自然语言任务中取得了显着的结果。但是，通常通过利用大量培训数据来实现排行榜的性能，并且很少通过将明确的语言知识编码为神经模型。这使许多人质疑语言学对现代自然语言处理的相关性。在本文中，我介绍了几个案例研究，以说明理论语言学和神经语言模型仍然相互关联。首先，语言模型通过提供一个客观的工具来测量语义距离，这对语言学家很有用，语义距离很难使用传统方法。另一方面，语言理论通过提供框架和数据源来探究我们的语言模型，以了解语言理解的特定方面，从而有助于语言建模研究。本论文贡献了三项研究，探讨了语言模型中语法 - 听觉界面的不同方面。在论文的第一部分中，我将语言模型应用于单词类灵活性的问题。我将Mbert作为语义距离测量的来源，我提供了有利于将单词类灵活性分析为方向过程的证据。在论文的第二部分中，我提出了一种方法来测量语言模型中间层的惊奇方法。我的实验表明，包含形态句法异常的句子触发了语言模型早期的惊喜，而不是语义和常识异常。最后，在论文的第三部分中，我适应了一些心理语言学研究，以表明语言模型包含了论证结构结构的知识。总而言之，我的论文在自然语言处理，语言理论和心理语言学之间建立了新的联系，以为语言模型的解释提供新的观点。

translated by 谷歌翻译

The Defeat of the Winograd Schema Challenge

Vid Kocijan , Ernest Davis , Thomas Lukasiewicz , Gary Marcus , Leora Morgenstern

分类：自然语言处理

2022-01-07

Winograd架构挑战 - 一套涉及代词参考消歧的双句话，似乎需要使用致辞知识 - 是由2011年的赫克托勒维克斯提出的。到2019年，基于大型预先训练的变压器的一些AI系统基于语言模型和微调这些问题，精度优于90％。在本文中，我们审查了Winograd架构挑战的历史并评估了其重要性。

translated by 谷歌翻译

An Introduction to Quantum Machine Learning for Engineers

Osvaldo Simeone

分类：机器学习

2022-05-11

在当前的嘈杂中间尺度量子（NISQ）时代，量子机学习正在成为基于程序门的量子计算机的主要范式。在量子机学习中，对量子电路的门进行了参数化，并且参数是根据数据和电路输出的测量来通过经典优化来调整的。参数化的量子电路（PQC）可以有效地解决组合优化问题，实施概率生成模型并进行推理（分类和回归）。该专着为具有概率和线性代数背景的工程师的观众提供了量子机学习的独立介绍。它首先描述了描述量子操作和测量所必需的必要背景，概念和工具。然后，它涵盖了参数化的量子电路，变异量子本质层以及无监督和监督的量子机学习公式。

translated by 谷歌翻译

How to marry a star: probabilistic constraints for meaning in context

Katrin Erk , Aurelie Herbelot

分类：自然语言处理

2020-09-16

在本文中，我们得出了“上下文中的单词含义”的概念，将其描述为强化和概念。我们介绍了一个框架，用于在上下文中指定对单词含义的局部和全局约束以及它们的相互作用，从而建模在话语解释中观察到的各种词汇转移和歧义。我们将句子表示为“情况描述系统”，这是一种概率模型，它将话语理解是一种对自己描述一种或多种情况描述的心理过程，该过程将解释观察到的话语。我们展示了如何在实践中实现该系统，并将其应用于包含各种背景化现象的示例。

translated by 谷歌翻译

Topos and Stacks of Deep Neural Networks

Jean-Claude Belfiore , Daniel Bennequin

分类：人工智能

2021-06-28

每个已知的人工深神经网络（DNN）都对应于规范Grothendieck的拓扑中的一个物体。它的学习动态对应于此拓扑中的形态流动。层中的不变结构（例如CNNS或LSTMS）对应于Giraud的堆栈。这种不变性应该是对概括属性的原因，即从约束下的学习数据中推断出来。纤维代表语义前类别（Culioli，Thom），在该类别上定义了人工语言，内部逻辑，直觉主义者，古典或线性（Girard）。网络的语义功能是其能够用这种语言表达理论的能力，以回答输出数据中有关输出的问题。语义信息的数量和空间是通过类比与2015年香农和D.Bennequin的Shannon熵的同源解释来定义的。他们概括了Carnap和Bar-Hillel（1952）发现的措施。令人惊讶的是，上述语义结构通过封闭模型类别的几何纤维对象进行了分类，然后它们产生了DNNS及其语义功能的同位不变。故意类型的理论（Martin-Loef）组织了这些物体和它们之间的纤维。 Grothendieck的导数分析了信息内容和交流。

translated by 谷歌翻译

GLUE: A Multi-Task Benchmark and Analysis Platform for Natural Language Understanding

Alex Wang , Amanpreet Singh , Julian Michael , Felix Hill , Omer Levy , Samuel R. Bowman

分类：

2018-04-20

For natural language understanding (NLU) technology to be maximally useful, it must be able to process language in a way that is not exclusive to a single task, genre, or dataset. In pursuit of this objective, we introduce the General Language Understanding Evaluation (GLUE) benchmark, a collection of tools for evaluating the performance of models across a diverse set of existing NLU tasks. By including tasks with limited training data, GLUE is designed to favor and encourage models that share general linguistic knowledge across tasks. GLUE also includes a hand-crafted diagnostic test suite that enables detailed linguistic analysis of models. We evaluate baselines based on current methods for transfer and representation learning and find that multi-task training on all tasks performs better than training a separate model per task. However, the low absolute performance of our best model indicates the need for improved general NLU systems.

translated by 谷歌翻译

Language models in word sense disambiguation for Polish

Agnieszka Mykowiecka , Agnieszka A. Mykowiecka , Piotr Rychlik

分类：自然语言处理 | 人工智能

2021-11-27

在论文中，我们测试了两个不同的方法，以获得波兰语的{令人难过的}词感人歧义任务。在这两种方法中，我们使用神经语言模型来预测与消歧的词语类似，并且在这些词的基础上，我们以不同的方式预测单词感官的分区。在第一种方法中，我们群集选定类似的单词，而在第二个中，我们群集代表其子集的群集向量。评估是在用PLONDNET感应注释的文本上进行的，并提供了相对良好的结果（对于所有模糊单词F1 = 0.68）。结果明显优于\ Cite {WAW：MYK：17：Sense}的神经模型的无人监督方法所获得的结果，并且处于在那里提供的监督方法的水平。所提出的方法可以是解决缺乏有义注释数据的语言的词语感义歧消声问题的方式。

translated by 谷歌翻译

Vector Space Semantics for Lambek Calculus with Soft Subexponentials

Lachlan McPheat , Hadi Wazni , Mehrnoosh Sadrzadeh

分类：自然语言处理

2021-11-22

我们开发了具有软子凸起的Lambek微积分的向量空间语义，应用微积分以构建寄生间隙名词短语和话语单位的组成载体解释，以及用APAPHORA和省略的话语，并在分布句相似性任务中进行构建。与以前的工作相反，其中使用具有相关方式的Lambek微积分本文中使用的微积分使用界限版本的模态，并且是可解除的。这种新模型的矢量空间语义允许我们将收缩与投影有意义地定义，并在我们以前只能通过非线性映射实现的内容之后提供线性理论。

translated by 谷歌翻译

Are Words the Quanta of Human Language? Extending the Domain of Quantum Cognition

Diederik Aerts , Lester Beltran

分类：自然语言处理

2021-10-10

在以前的研究中，我们展示了“讲故事”的文本展示了不是Maxwell-Boltzmann但Bose-Einstein的统计结构。我们的解释是，这是由于在人类语言中存在“无法区分”，因此故事的不同部分中的相同词语彼此无法区分。在目前的文章中，我们开始为此Bose-Einstein统计提供解释。我们表明，在“故事”中存在“意义”，这导致了Bose-eInstein的独立特征，并提供了确凿的证据，即“言语可以被认为是人类语言”，结构类似于如何“光子是光的量子”。使用若干关于我们布鲁塞尔研究组的纠缠研究，我们还表明它也是在文本中存在“含义”，这使得von Neumann熵相对于组成它的单词熵的总文本更小。我们解释了本文的新见解如何与称为“量子认知”的研究领域适合，其中量子概率模型和量子矢量空间用于人类认知，并且也与使用量子结构在信息检索和自然中的使用相关语言处理，以及它们如何将“量化”和“Bose-Einstein统计数据”引入那里的相关量子效应。灵感来自量子力学的概念性解释，并依靠新的见解，我们提出了关于物理现实性质的假设。在这样做时，我们注意到这种新的熵减少以及其解释，对量子热力学的发展可能是重要的。我们同样注意到它也可以引起行星地球表面上的物理现实性质的原始解释图片，其中人类文化随着养护的延续而出现。

translated by 谷歌翻译

Is it possible not to cheat on the Turing Test: Exploring the potential and challenges for true natural language 'understanding' by computers

Lize Alberts

分类：自然语言处理 | 人工智能

2022-06-29

最近围绕语言处理模型的复杂性的最新炒作使人们对机器获得了类似人类自然语言的指挥的乐观情绪。人工智能中自然语言理解的领域声称在这一领域取得了长足的进步，但是，在这方面和其他学科中使用“理解”的概念性清晰，使我们很难辨别我们实际上有多近的距离。目前的方法和剩余挑战的全面，跨学科的概述尚待进行。除了语言知识之外，这还需要考虑我们特定于物种的能力，以对，记忆，标签和传达我们（足够相似的）体现和位置经验。此外，测量实际约束需要严格分析当前模型的技术能力，以及对理论可能性和局限性的更深入的哲学反思。在本文中，我将所有这些观点（哲学，认知语言和技术）团结在一起，以揭开达到真实（人类般的）语言理解所涉及的挑战。通过解开当前方法固有的理论假设，我希望说明我们距离实现这一目标的实际程度，如果确实是目标。

translated by 谷歌翻译

Towards Faithful Model Explanation in NLP: A Survey

Qing Lyu , Marianna Apidianaki , Chris Callison-Burch

分类：自然语言处理

2022-09-22

众所周知，端到端的神经NLP体系结构很难理解，这引起了近年来为解释性建模的许多努力。模型解释的基本原则是忠诚，即，解释应准确地代表模型预测背后的推理过程。这项调查首先讨论了忠诚的定义和评估及其对解释性的意义。然后，我们通过将方法分为五类来介绍忠实解释的最新进展：相似性方法，模型内部结构的分析，基于反向传播的方法，反事实干预和自我解释模型。每个类别将通过其代表性研究，优势和缺点来说明。最后，我们从它们的共同美德和局限性方面讨论了上述所有方法，并反思未来的工作方向忠实的解释性。对于有兴趣研究可解释性的研究人员，这项调查将为该领域提供可访问且全面的概述，为进一步探索提供基础。对于希望更好地了解自己的模型的用户，该调查将是一项介绍性手册，帮助选择最合适的解释方法。

translated by 谷歌翻译

A Survey on Gender Bias in Natural Language Processing

Karolina Stanczak , Isabelle Augenstein

分类：自然语言处理

2021-12-28

语言可以用作再现和执行有害刻板印象和偏差的手段，并被分析在许多研究中。在本文中，我们对自然语言处理中的性别偏见进行了304篇论文。我们分析了社会科学中性别及其类别的定义，并将其连接到NLP研究中性别偏见的正式定义。我们调查了在对性别偏见的研究中应用的Lexica和数据集，然后比较和对比方法来检测和减轻性别偏见。我们发现对性别偏见的研究遭受了四个核心限制。 1）大多数研究将性别视为忽视其流动性和连续性的二元变量。 2）大部分工作都在单机设置中进行英语或其他高资源语言进行。 3）尽管在NLP方法中对性别偏见进行了无数的论文，但我们发现大多数新开发的算法都没有测试他们的偏见模型，并无视他们的工作的伦理考虑。 4）最后，在这一研究线上发展的方法基本缺陷涵盖性别偏差的非常有限的定义，缺乏评估基线和管道。我们建议建议克服这些限制作为未来研究的指导。

translated by 谷歌翻译

Representation Learning of Image Schema

Fajrian Yunus , Chloé Clavel , Catherine Pelachaud

分类：人工智能 | 自然语言处理 | 机器学习

2022-07-17

图像架构是一个反复的推理模式，其中一个实体被映射到另一个实体。图像模式类似于概念上的隐喻，也与隐喻性手势有关。我们的主要目标是为体现的对话代理产生隐喻性手势。我们提出了一种学习图像模式的矢量表示的技术。据我们所知，这是解决该问题的第一项工作。我们的技术使用Ravenet等人的算法来计算文本输入中的图像模式，以及Bert和Sensebert，我们将其用作基本单词嵌入技术来计算图像架构的最终矢量表示。我们的表示学习技术通过聚类来起作用：属于同一图像架构的单词嵌入向量应相对彼此相对近，从而形成一个群集。使用图像模式可表示为向量，也有可能有一个观念，即某些图像模式比彼此更接近或更相似，因为向量之间的距离是相应图像模式之间的相似性的代理。因此，在获得图像模式的矢量表示后，我们计算了这些向量之间的距离。基于这些，我们创建可视化以说明不同图像模式之间的相对距离。

translated by 谷歌翻译