智能论文笔记

Improved Ackermannian lower bound for the Petri nets reachability problem

Sławomir Lasota

分类：自然语言处理

2021-05-18

培养的网站，等效地作为具有状态的矢量加法系统，是具有广泛应用程序的建立的并发模型。到达性问题，在我们询问是否从给定的初始配置中存在一系列达到给定最终配置的有效执行步骤，是该模型的中央算法问题。问题的复杂性仍然存在，直到最近，验证并发系统中最困难的开放问题之一。仅在2015年由LEROUX和SCHMITZ提供的第一个上限，然后由同一位作者提炼于2019年的非原始递归Ackermannian上限。在1976年，Lipton所示的指数空间下限仍然是唯一已知的40多年来，在2019年Czerwi {\'n}滑雪道，Lasota，Lazic，Leroux和Mazowiecki的突破性非基本下限。最后，今年由Czerwi {}滑雪和orlikowski宣布了一个匹配的Ackermannian下限，独立于Leroux，建立了问题的复杂性。我们的主要贡献是对前建筑的改进，使其概念上更简单，更直接。在我们的方式，改善了与固定维度（或等效的Petri网）的载体添加系统的下限：虽然Czerwi {\'n} Ski和Orlikowski证明$ f_k $ -hardness（硬度$ k $ th水平在grzegorczyk层次结构中）在维度$ 6k $ 6k $，我们的简化施工会收益超过$ 3k + 2 $的$ f_k $ -hardness。

translated by 谷歌翻译

Solvability of orbit-finite systems of linear equations

Arka Ghosh , Piotr Hofman , Sławomir Lasota

分类：自然语言处理

2022-01-22

我们在用原子的集合设置线性方程的轨道限制系统。我们的主要贡献是此类系统解决性的决策程序。该过程适用于温和有效性假设下的每个字段（甚至是交换环），并将给定的轨道限制系统降低到许多有限的系统：总体上许多有限的系统，但是当输入系统的原子尺寸固定时，多一项是多项式的。为了获得该过程，我们进一步推动了轨道限制集合产生的向量空间理论，并表明每个这样的向量空间都允许轨道限制。这种基本财产是我们开发的关键工具，但也应该引起更广泛的兴趣。

translated by 谷歌翻译

How to Approximate Ontology-Mediated Queries

Anneke Haga , Carsten Lutz , Leif Sabellek , Frank Wolter

分类：人工智能

2021-07-12

我们根据描述逻辑ALC和ALCI介绍并研究了本体论介导的查询的几个近似概念。我们的近似值有两种：我们可以（1）用一种以易访问的本体语言为例，例如ELI或某些TGD，以及（2）用可拖动类的一个替换数据库，例如其treewidth的数据库，由常数界定。我们确定所得近似值的计算复杂性和相对完整性。（几乎）所有这些都将数据复杂性从Conp-Complete降低到Ptime，在某些情况下甚至是固定参数可拖动和线性时间。虽然种类（1）的近似也降低了综合复杂性，但这种近似（2）往往并非如此。在某些情况下，联合复杂性甚至会增加。

translated by 谷歌翻译

On Classifying Continuous Constraint Satisfaction Problems

Tillmann Miltzow , Reinier F. Schmiermann

分类：自然语言处理

2021-06-04

连续约束满意度问题（CCSP）是一个约束满意度问题（CSP），其间隔域$ u \ subset \ mathbb {r} $。我们进行了一项系统的研究，以对CCSP进行分类，这些CCSP已完成现实的存在理论，即ER完整。为了定义该类别，我们首先考虑ETR问题，该问题也代表了真实的存在理论。在此问题的情况下，我们给出了$ \ compant x_1，\ ldots，x_n \ in \ mathbb {r}的某个句子：\ phi（x_1，\ ldots，x_n）$，其中$ \ phi $ is由符号$ \ {0、1， +，\ cdot，\ geq，>，\ wedge，\ vee，\ neg \} $组成的符号符号的公式正确。。现在，ER是所有问题的家族，这些家族允许多项式时间降低到ETR。众所周知，np $ \ subseteq $ er $ \ subseteq $ pspace。我们将注意力限制在CCSP上，并具有附加限制（$ x + y = z $）和其他一些轻度的技术状况。以前，已经显示出乘法约束（$ x \ cdot y = z $），平方约束（$ x^2 = y $）或反转约束（$ x \ cdot y = 1 $）足以建立ER-完整性。如下所示，我们以最大的平等约束来扩展这一点。我们表明，CCSP（具有附加限制和其他轻度技术状况）具有任何一个表现良好的弯曲平等约束（$ f（x，y）= 0 $）的CCSP是ER的曲线限制（$ F（x，y）= 0 $）。我们将结果进一步扩展到不平等约束。我们表明，任何行为良好的凸出弯曲且行为良好的凹陷弯曲的不平等约束（$ f（x，y）\ geq 0 $ and $ g（x，x，y）\ geq 0 $）暗示着班级的ER完整性这种CCSP。

translated by 谷歌翻译

A Strongly Polynomial Algorithm for Approximate Forster Transforms and its Application to Halfspace Learning

Ilias Diakonikolas , Christos Tzamos , Daniel M. Kane

分类：机器学习 | (统计)机器学习

2022-12-06

The Forster transform is a method of regularizing a dataset by placing it in {\em radial isotropic position} while maintaining some of its essential properties. Forster transforms have played a key role in a diverse range of settings spanning computer science and functional analysis. Prior work had given {\em weakly} polynomial time algorithms for computing Forster transforms, when they exist. Our main result is the first {\em strongly polynomial time} algorithm to compute an approximate Forster transform of a given dataset or certify that no such transformation exists. By leveraging our strongly polynomial Forster algorithm, we obtain the first strongly polynomial time algorithm for {\em distribution-free} PAC learning of halfspaces. This learning result is surprising because {\em proper} PAC learning of halfspaces is {\em equivalent} to linear programming. Our learning approach extends to give a strongly polynomial halfspace learner in the presence of random classification noise and, more generally, Massart noise.

translated by 谷歌翻译

Quantum learning algorithms imply circuit lower bounds

Srinivasan Arunachalam , Alex B. Grilo , Tom Gur , Igor C. Oliveira , Aarthi Sundaram

分类：机器学习

2020-12-03

我们建立了量子算法设计与电路下限之间的第一一般连接。具体来说，让$ \ mathfrak {c} $是一类多项式大小概念，假设$ \ mathfrak {c} $可以在统一分布下的成员查询，错误$ 1/2 - \ gamma $通过时间$ t $量子算法。我们证明如果$ \ gamma ^ 2 \ cdot t \ ll 2 ^ n / n $，则$ \ mathsf {bqe} \ nsubseteq \ mathfrak {c} $，其中$ \ mathsf {bqe} = \ mathsf {bque} [2 ^ {o（n）}] $是$ \ mathsf {bqp} $的指数时间模拟。在$ \ gamma $和$ t $中，此结果是最佳的，因为它不难学习（经典）时间$ t = 2 ^ n $（没有错误），或在Quantum Time $ t = \ mathsf {poly}（n）$以傅立叶采样为单位为1/2美元（2 ^ { - n / 2}）$。换句话说，即使对这些通用学习算法的边际改善也会导致复杂性理论的主要后果。我们的证明在学习理论，伪随机性和计算复杂性的几个作品上构建，并且至关重要地，在非凡的经典学习算法与由Oliveira和Santhanam建立的电路下限之间的联系（CCC 2017）。扩展他们对量子学习算法的方法，结果产生了重大挑战。为此，我们展示了伪随机发电机如何以通用方式意味着学习到较低的连接，构建针对均匀量子计算的第一个条件伪随机发生器，并扩展了Impagliazzo，JaiSwal的本地列表解码算法。，Kabanets和Wigderson（Sicomp 2010）通过微妙的分析到量子电路。我们认为，这些贡献是独立的兴趣，可能会发现其他申请。

translated by 谷歌翻译

Õptimal Differentially Private Learning of Thresholds and Quasi-Concave Optimization

Edith Cohen , Xin Lyu , Jelani Nelson , Tamás Sarlós , Uri Stemmer

分类：机器学习

2022-11-11

The problem of learning threshold functions is a fundamental one in machine learning. Classical learning theory implies sample complexity of $O(\xi^{-1} \log(1/\beta))$ (for generalization error $\xi$ with confidence $1-\beta$). The private version of the problem, however, is more challenging and in particular, the sample complexity must depend on the size $|X|$ of the domain. Progress on quantifying this dependence, via lower and upper bounds, was made in a line of works over the past decade. In this paper, we finally close the gap for approximate-DP and provide a nearly tight upper bound of $\tilde{O}(\log^* |X|)$, which matches a lower bound by Alon et al (that applies even with improper learning) and improves over a prior upper bound of $\tilde{O}((\log^* |X|)^{1.5})$ by Kaplan et al. We also provide matching upper and lower bounds of $\tilde{\Theta}(2^{\log^*|X|})$ for the additive error of private quasi-concave optimization (a related and more general problem). Our improvement is achieved via the novel Reorder-Slice-Compute paradigm for private data analysis which we believe will have further applications.

translated by 谷歌翻译

Towards Lower Bounds on the Depth of ReLU Neural Networks

Christoph Hertrich , Amitabh Basu , Marco Di Summa , Martin Skutella

分类：机器学习 | 神经与进化计算 | (统计)机器学习

2021-05-31

我们有助于更好地理解由具有Relu激活和给定架构的神经网络表示的功能。使用来自混合整数优化，多面体理论和热带几何的技术，我们为普遍近似定理提供了数学逆向，这表明单个隐藏层足以用于学习任务。特别是，我们调查完全可增值功能是否完全可以通过添加更多层（没有限制大小）来严格增加。由于它为神经假设类别代表的函数类提供给算法和统计方面，这个问题对算法和统计方面具有潜在的影响。然而，据我们所知，这个问题尚未在神经网络文学中调查。我们还在这些神经假设类别中代表功能所需的神经网络的大小上存在上限。

translated by 谷歌翻译

Smoothness Analysis for Probabilistic Programs with Application to Optimised Variational Inference

Wonyeol Lee , Xavier Rival , Hongseok Yang

分类：机器学习

2022-08-22

我们提供了静态分析，用于发现给定概率程序的可区分或更普遍的平滑部分，并展示如何使用分析来改善路径梯度估计器，这是后验推理和模型学习的最流行方法之一。我们的改进将估计器的范围从可区分模型到非差异性模型的范围，而无需用户手动干预；改进的估计器会使用我们的静态分析自动识别给定概率程序的可区分部分，并将路径梯度估计器应用于已识别的零件，同时使用程序的其余部分使用更通用但效率较低的估计器（称为得分估计器）。我们的分析具有令人惊讶的微妙的声音论点，部分原因是从程序分析设计师的角度看待某些目标平滑性属性的不当行为。例如，某些平滑度属性不能通过函数组成保留，这使得在不牺牲精度的情况下很难分析顺序组成。我们在目标平滑度属性上制定了五个假设，证明了我们在这些假设下的分析的健全性，并表明我们的主要示例满足了这些假设。我们还表明，通过使用分析中的信息，我们的改进梯度估计器满足了重要的可不同性要求，因此，在轻度的规律性条件下，平均计算正确的估计值，即，它返回无偏见的估计值。我们在Pyro语言中使用代表性概率程序进行的实验表明，我们的静态分析能够准确地识别这些程序的平滑部分，并使我们改进的路径梯度估计器利用这些程序中的所有高性能机会。

translated by 谷歌翻译

Robust Sparse Mean Estimation via Sum of Squares

Ilias Diakonikolas , Daniel M. Kane , Sushrut Karmalkar , Ankit Pensia , Thanasis Pittas

分类：机器学习 | (统计)机器学习

2022-06-07

我们研究了在存在$ \ epsilon $ - 对抗异常值的高维稀疏平均值估计的问题。先前的工作为此任务获得了该任务的样本和计算有效算法，用于辅助性Subgaussian分布。在这项工作中，我们开发了第一个有效的算法，用于强大的稀疏平均值估计，而没有对协方差的先验知识。对于$ \ Mathbb r^d $上的分布，带有“认证有限”的$ t $ tum-矩和足够轻的尾巴，我们的算法达到了$ o（\ epsilon^{1-1/t}）$带有样品复杂性$的错误（\ epsilon^{1-1/t}） m =（k \ log（d））^{o（t）}/\ epsilon^{2-2/t} $。对于高斯分布的特殊情况，我们的算法达到了$ \ tilde o（\ epsilon）$的接近最佳错误，带有样品复杂性$ m = o（k^4 \ mathrm {polylog}（d）（d））/\ epsilon^^ 2 $。我们的算法遵循基于方形的总和，对算法方法的证明。我们通过统计查询和低度多项式测试的下限来补充上限，提供了证据，表明我们算法实现的样本时间 - 错误权衡在质量上是最好的。

translated by 谷歌翻译

Wasserstein barycenters are NP-hard to compute

Jason M. Altschuler , Enric Boix-Adsera

分类：机器学习

2021-01-04

计算Wassersein BaryCenters（A.K.A.最佳运输重构）是由于数据科学的许多应用，最近引起了相当大的关注的几何问题。虽然存在任何固定维度的多项式时间算法，但所有已知的运行时间都在维度中呈指数级。这是一个开放的问题，无论是这种指数依赖性是否可改进到多项式依赖性。本文证明，除非P = NP，答案是否定的。这揭示了Wassersein的BaryCenter计算的“维度诅咒”，其不会发生最佳运输计算。此外，我们对计算Wassersein的硬度结果延伸到近似计算，看似简单的问题案例，以及在其他最佳运输指标中平均概率分布。

translated by 谷歌翻译

Conjunctive Queries: Unique Characterizations and Exact Learnability

Balder ten Cate , Victor Dalmau

分类：人工智能

2020-08-16

我们回答以下问题，哪些结合性查询以多种方式上的许多正和负面示例以及如何有效地构建此类示例的特征。结果，我们为一类连接的查询获得了一种新的有效的精确学习算法。我们的贡献的核心是两种新的多项式时间算法，用于在有限结构的同态晶格中构建前沿。我们还讨论了模式映射和描述逻辑概念的独特特征性和可学习性的影响。

translated by 谷歌翻译

Active Sampling for Linear Regression Beyond the $\ell_2$ Norm

Cameron Musco , Christopher Musco , David P. Woodruff , Taisuke Yasuda

分类：机器学习 | (统计)机器学习

2021-11-09

我们研究了用于线性回归的主动采样算法，该算法仅旨在查询目标向量$ b \ in \ mathbb {r} ^ n $的少量条目，并将近最低限度输出到$ \ min_ {x \ In \ mathbb {r} ^ d} \ | ax-b \ | $，其中$ a \ in \ mathbb {r} ^ {n \ times d} $是一个设计矩阵和$ \ | \ cdot \ | $是一些损失函数。对于$ \ ell_p $ norm回归的任何$ 0 <p <\ idty $，我们提供了一种基于Lewis权重采样的算法，其使用只需$ \ tilde {o}输出$（1+ \ epsilon）$近似解决方案（d ^ {\ max（1，{p / 2}）} / \ mathrm {poly}（\ epsilon））$查询到$ b $。我们表明，这一依赖于$ D $是最佳的，直到对数因素。我们的结果解决了陈和Derezi的最近开放问题，陈和Derezi \'{n} Ski，他们为$ \ ell_1 $ norm提供了附近的最佳界限，以及$ p \中的$ \ ell_p $回归的次优界限（1,2） $。我们还提供了$ O的第一个总灵敏度上限（D ^ {\ max \ {1，p / 2 \} \ log ^ 2 n）$以满足最多的$ p $多项式增长。这改善了Tukan，Maalouf和Feldman的最新结果。通过将此与我们的技术组合起来的$ \ ell_p $回归结果，我们获得了一个使$ \ tilde o的活动回归算法（d ^ {1+ \ max \ {1，p / 2 \}} / \ mathrm {poly}。（\ epsilon））$疑问，回答陈和德里兹的另一个打开问题{n}滑雪。对于Huber损失的重要特殊情况，我们进一步改善了我们对$ \ tilde o的主动样本复杂性的绑定（d ^ {（1+ \ sqrt2）/ 2} / \ epsilon ^ c）$和非活跃$ \ tilde o的样本复杂性（d ^ {4-2 \ sqrt 2} / \ epsilon ^ c）$，由于克拉克森和伍德拉夫而改善了Huber回归的以前的D ^ 4 $。我们的敏感性界限具有进一步的影响，使用灵敏度采样改善了各种先前的结果，包括orlicz规范子空间嵌入和鲁棒子空间近似。最后，我们的主动采样结果为每种$ \ ell_p $ norm提供的第一个Sublinear时间算法。

translated by 谷歌翻译

Identity Testing for High-Dimensional Distributions via Entropy Tensorization

Antonio Blanca , Zongchen Chen , Daniel Štefankovič , Eric Vigoda

分类：机器学习

2022-07-19

我们提出了改进的算法，并为身份测试$ n $维分布的问题提供了统计和计算下限。在身份测试问题中，我们将作为输入作为显式分发$ \ mu $，$ \ varepsilon> 0 $，并访问对隐藏分布$ \ pi $的采样甲骨文。目标是区分两个分布$ \ mu $和$ \ pi $是相同的还是至少$ \ varepsilon $ -far分开。当仅从隐藏分布$ \ pi $中访问完整样本时，众所周知，可能需要许多样本，因此以前的作品已经研究了身份测试，并额外访问了各种有条件采样牙齿。我们在这里考虑一个明显弱的条件采样甲骨文，称为坐标Oracle，并在此新模型中提供了身份测试问题的相当完整的计算和统计表征。我们证明，如果一个称为熵的分析属性为可见分布$ \ mu $保留，那么对于任何使用$ \ tilde {o}（n/\ tilde {o}），有一个有效的身份测试算法Varepsilon）$查询坐标Oracle。熵的近似张力是一种经典的工具，用于证明马尔可夫链的最佳混合时间边界用于高维分布，并且最近通过光谱独立性为许多分布族建立了最佳的混合时间。我们将算法结果与匹配的$ \ omega（n/\ varepsilon）$统计下键进行匹配的算法结果补充，以供坐标Oracle下的查询数量。我们还证明了一个计算相变：对于$ \ {+1，-1，-1 \}^n $以上的稀疏抗抗铁磁性模型，在熵失败的近似张力失败的状态下，除非RP = np，否则没有有效的身份测试算法。

translated by 谷歌翻译

Reachability In Simple Neural Networks

Marco Sälzer , Martin Lange

分类：机器学习

2022-03-15

我们研究了（深）神经网络的可及性问题的复杂性：它是否计算出有效输入的有效输出？最近有人声称，对于一般神经网络的问题，该问题是通用神经网络的NP算法，并且在线性不等式的结合给出的输入/输出维度上的规格是NP的。我们概括了证明并修复原始上和下限证明中的一些缺陷。在总体结果的激励下，我们表明NP硬度已经适用于限制的简单规格和神经网络。允许仅一个隐藏层和一个单个的输出维度以及仅一个负，零和一个正重或偏置的神经网络，足以确保NP硬度。此外，我们为有关神经网络验证的这一研究方向进行了详尽的讨论和可能的扩展。

translated by 谷歌翻译

On the Foundations of Grounding in Answer Set Programming

Roland Kaminski , Torsten Schaub

分类：人工智能

2021-08-10

我们在答案集编程（ASP）中，提供了全面的可变实例化或接地的理论基础。在ASP的建模语言的语义上构建，我们在（固定点）运营商方面介绍了接地算法的正式表征。专用良好的运营商扮演了一个主要作用，其相关模型提供了划定接地结果以及随机简化的语义指导。我们地址呈现出一种竞技级逻辑程序，该程序包含递归聚合，从而达到现有ASP建模语言的范围。这伴随着一个普通算法框架，详细说明递归聚集体的接地。给定的算法基本上对应于ASP接地器Gringo中使用的算法。

translated by 谷歌翻译

Adapting $k$-means algorithms for outliers

Christoph Grunau , Václav Rozhoň

分类：机器学习

2020-07-02

本文展示了如何适应$ k $ -MEANS问题的几种简单和经典的基于采样的算法，以使用离群值设置。最近，Bhaskara等人。（Neurips 2019）展示了如何将古典$ K $ -MEANS ++算法适应与异常值的设置。但是，他们的算法需要输出$ o（\ log（k）\ cdot z）$ outiers，其中$ z $是true Outliers的数量，以匹配$ o（\ log k）$ - 近似值的$ k的近似保证$ -Means ++。在本文中，我们以他们的想法为基础，并展示了如何适应几个顺序和分布式的$ k $ - 均值算法，但使用离群值来设置，但具有更强的理论保证：我们的算法输出$（1+ \ VAREPSILON）z $ OUTLIERS Z $ OUTLIERS在实现$ o（1 / \ varepsilon）$ - 近似目标函数的同时。在顺序世界中，我们通过改编Lattanzi和Sohler的最新算法来实现这一目标（ICML 2019）。在分布式设置中，我们适应了Guha等人的简单算法。（IEEE Trans。知道和数据工程2003）以及Bahmani等人的流行$ K $ -Means $ \ | $。（PVLDB 2012）。我们技术的理论应用是一种具有运行时间$ \ tilde {o}（nk^2/z）$的算法，假设$ k \ ll z \ ll n $。这与Omacle模型中此问题的$ \ Omega（NK^2/z）$的匹配下限相互补。

translated by 谷歌翻译

Robust recovery for stochastic block models

Jingqiu Ding , Tommaso d'Orsi , Rajai Nasser , David Steurer

分类：机器学习 | (统计)机器学习

2021-11-16

我们开发了一种高效的随机块模型中的弱恢复算法。该算法与随机块模型的Vanilla版本的最佳已知算法的统计保证匹配。从这个意义上讲，我们的结果表明，随机块模型没有稳健性。我们的工作受到最近的银行，Mohanty和Raghavendra（SODA 2021）的工作，为相应的区别问题提供了高效的算法。我们的算法及其分析显着脱离了以前的恢复。关键挑战是我们算法的特殊优化景观：种植的分区可能远非最佳意义，即完全不相关的解决方案可以实现相同的客观值。这种现象与PCA的BBP相转变的推出效应有关。据我们所知，我们的算法是第一个在非渐近设置中存在这种推出效果的鲁棒恢复。我们的算法是基于凸优化的框架的实例化（与平方和不同的不同），这对于其他鲁棒矩阵估计问题可能是有用的。我们的分析的副产物是一种通用技术，其提高了任意强大的弱恢复算法的成功（输入的随机性）从恒定（或缓慢消失）概率以指数高概率。

translated by 谷歌翻译

Adaptive Clustering Using Kernel Density Estimators

Ingo Steinwart , Bharath K. Sriperumbudur , Philipp Thomann

分类： (统计)机器学习

2017-08-17

我们派生并分析了一种用于估计有限簇树中的所有分裂的通用，递归算法以及相应的群集。我们进一步研究了从内核密度估计器接收级别设置估计时该通用聚类算法的统计特性。特别是，我们推出了有限的样本保证，一致性，收敛率以及用于选择内核带宽的自适应数据驱动策略。对于这些结果，我们不需要与H \“{o}连续性等密度的连续性假设，而是仅需要非参数性质的直观几何假设。

translated by 谷歌翻译

Logical Separability of Labeled Data Examples under Ontologies

Jean Christoph Jung , Carsten Lutz , Hadrien Pulcini , Frank Wolter

分类：人工智能

2020-07-03

在概念学习，数据库查询的反向工程，生成参考表达式以及知识图中的实体比较之类的应用中，找到以标记数据项形式分开的逻辑公式，该公式分开以标记数据项形式给出的正面和负面示例。在本文中，我们研究了存在本体论的数据的分离公式的存在。对于本体语言和分离语言，我们都专注于一阶逻辑及其以下重要片段：描述逻辑$ \ Mathcal {alci} $，受保护的片段，两变量的片段和受保护的否定片段。为了分离，我们还考虑（工会）连接性查询。我们考虑了几种可分离性，这些可分离性在负面示例的治疗中有所不同，以及他们是否承认使用其他辅助符号来实现分离。我们的主要结果是（所有变体）可分离性，不同语言的分离能力的比较以及确定可分离性的计算复杂性的研究。

translated by 谷歌翻译