在基于图形的应用程序中,一个常见的任务是查明(指示或无向)图中最重要或最重要的“中央”顶点,或根据图形的重要性对图表进行排名。为此,文献中已经提出了许多所谓的中心度度量,以评估图中哪些顶点是最重要的。里弗罗斯(Riveros)和萨拉斯(Salas)在ICDT 2020论文中提出了基于以下直觉原理的中心度度量:图中顶点的重要性是相对于``相关''连接的子读数的数量,称为子图基序,称为子图基序,周围。我们将上述原理得出的措施称为子图基措施。人们令人信服地认为,亚图主题措施非常适合图形数据库应用程序。尽管ICDT论文研究了子图案措施所享有的几种有利的特性,但它们的绝对表现力仍然很大程度上没有探索。这项工作的目的是精确表征子图主题措施家族的绝对表现力。
translated by 谷歌翻译
我们发现了亲近的中心地位和冷静性原则之间的新关系。我们将图形中的CondorCet获奖者定义为节点,与任何其他节点相比更接近更多节点。换句话说,如果我们假设节点对较近候选的节点投票,则CondorCet获奖者将在多个投票中对任何其他节点赢得两个候选选举。我们展示了亲密的中心地理及其随机步行版,随机步行闭合中心,是唯一的露天电池在树上一致的经典中心措施,即,如果强奸冠军存在,他们首先排名。虽然它们不是一般图一致的Condorcet,但我们表明接近中心地满足了髁架比较特性,这些属性使得从两个相邻节点中排出,由更多节点的优选具有更高的中心。我们展示了亲密的中心,是唯一具有这种财产的常规距离中心。
translated by 谷歌翻译
我们根据计算一个扎根于每个顶点的某个加权树的家族而构成的相似性得分提出了一种有效的图形匹配算法。对于两个erd \ h {o} s-r \'enyi图$ \ mathcal {g}(n,q)$,其边缘通过潜在顶点通信相关联,我们表明该算法正确地匹配了所有范围的范围,除了所有的vertices分数外,有了很高的概率,前提是$ nq \ to \ infty $,而边缘相关系数$ \ rho $满足$ \ rho^2> \ alpha \ ailpha \大约0.338 $,其中$ \ alpha $是Otter的树木计数常数。此外,在理论上是必需的额外条件下,可以精确地匹配。这是第一个以显式常数相关性成功的多项式图匹配算法,并适用于稀疏和密集图。相比之下,以前的方法要么需要$ \ rho = 1-o(1)$,要么仅限于稀疏图。该算法的症结是一个经过精心策划的植根树的家族,称为吊灯,它可以有效地从同一树的计数中提取图形相关性,同时抑制不同树木之间的不良相关性。
translated by 谷歌翻译
许多复杂网络的结构包括其拓扑顶部的边缘方向性和权重。可以无缝考虑这些属性组合的网络分析是可取的。在本文中,我们研究了两个重要的这样的网络分析技术,即中心和聚类。采用信息流基于集群的模型,该模型本身就是在计算中心的信息定理措施时构建。我们的主要捐款包括马尔可夫熵中心的广义模型,灵活地调整节点度,边缘权重和方向的重要性,具有闭合形式的渐近分析。它导致一种新颖的两级图形聚类算法。中心分析有助于推理我们对给定图形的方法的适用性,并确定探索当地社区结构的“查询”节点,从而导致群集聚类机制。熵中心计算由我们的聚类算法摊销,使其计算得高效:与使用马尔可夫熵中心为聚类的先前方法相比,我们的实验表明了多个速度的速度。我们的聚类算法自然地继承了适应边缘方向性的灵活性,以及​​边缘权重和节点度之间的不同解释和相互作用。总的来说,本文不仅具有显着的理论和概念贡献,还转化为实际相关性的文物,产生新的,有效和可扩展的中心计算和图形聚类算法,其有效通过广泛的基准测试进行了验证。
translated by 谷歌翻译
在观察性研究中,经常遇到有关存在或缺乏因果边缘和路径的因果背景知识。由于背景知识而导致的马尔可夫等效dag的子类共享的指向边缘和链接可以由因果关系最大部分定向的无循环图(MPDAG)表示。在本文中,我们首先提供了因果MPDAG的声音和完整的图形表征,并提供了因果MPDAG的最小表示。然后,我们介绍了一种名为Direct Causal子句(DCC)的新颖表示,以统一形式表示所有类型的因果背景知识。使用DCC,我们研究因果背景知识的一致性和等效性,并表明任何因果背景知识集都可以等效地分解为因果MPDAG,以及最小的残留DCC。还提供了多项式时间算法,以检查一致性,等效性并找到分解的MPDAG和残留DCC。最后,有了因果背景知识,我们证明了一个足够且必要的条件来识别因果关系,并且出人意料地发现因果效应的可识别性仅取决于分解的MPDAG。我们还开发了局部IDA型算法,以估计无法识别效应的可能值。模拟表明因果背景知识可以显着提高因果影响的识别性。
translated by 谷歌翻译
我们回答以下问题,哪些结合性查询以多种方式上的许多正和负面示例以及如何有效地构建此类示例的特征。结果,我们为一类连接的查询获得了一种新的有效的精确学习算法。我们的贡献的核心是两种新的多项式时间算法,用于在有限结构的同态晶格中构建前沿。我们还讨论了模式映射和描述逻辑概念的独特特征性和可学习性的影响。
translated by 谷歌翻译
在原因指导的非循环图(DAG)的结构学习问题中出现的良好研究挑战是,使用观测数据,一个人只能将图形到“马尔可夫等价类”(MEC)。剩余的无向边缘必须使用干预率定向,这可以在应用中执行昂贵。因此,最小化了全面定向MEC所需的干预次数的问题已经得到了很多最近的关注,并且也是这项工作的重点。我们证明了两个主要结果。第一个是一种新的通用下限,在任何算法(无论是主动或被动)需要执行的原子干预次数,以便定向给定的MEC。我们的第二个结果表明,这一界限实际上是可以定位MEC的最小原子干预措施的两个大小的因素。我们的下限比以前已知的下限更好。我们的下限证明是基于CBSP订购的新概念,这是没有V-Surructure的DAG的拓扑排序,并满足某些特殊属性。此外,在综合图上使用模拟,并通过赋予特殊图家庭的示例,我们表明我们的界限往往明显更好。
translated by 谷歌翻译
几个概念学习问题可以被视为在有限的地面集合中抽象封闭系统中半空间分离的特殊情况。对于典型的情况,即通过闭合操作员隐式给出了闭合系统,我们表明半空间分离问题​​是NP完整的。作为克服这一负面结果的第一种方法,我们放宽了最大封闭设置分离的问题,通过线性闭合操作员的调用给出了一种通用的贪婪算法来解决此问题,并证明该界限很清晰。对于第二个方向,我们考虑了kakutani闭合系统,并证明它们是通过贪婪算法来表征的。作为一般问题设置的第一个特殊情况,我们考虑了kakutani封闭系统,并在禁止的图形未成年人方面为这种封闭系统提供了足够的条件。对于第二种特殊情况,我们将重点放在有限晶格上的封闭系统上,对通用贪婪算法进行改进的适应性,并介绍有关集合晶格的应用程序。
translated by 谷歌翻译
我们研究在大型增长网络中找到根顶点的问题。我们证明,可以构建大小的置信集,而不是网络中包含root顶点的顶点的数量,在各种随机网络的各种模型中都具有很高的概率。这些模型包括均匀的随机递归dag和统一的库珀 - 弗里兹随机图。
translated by 谷歌翻译
我们通过定义节点的某些局部特征和矢量表示,然后使用它们来通过深层神经网络来学习全球定义的指标和属性,从而提出了用于图形机器学习和网络分析的局部到全球策略。通过通过呼吸优先搜索扩展节点的程度的概念,定义了{\ bf参数中心函数}的一般家族,可以揭示节点的重要性。我们将{\ bf邻居学位频率(NDF)}引入,作为无向图的节点的局部定义嵌入到欧几里得空间中。这引起了节点的矢量标记,该标记编码了节点局部邻域的结构,可用于图同构测试。我们为构造增加了灵活性,以便它也可以处理动态图。之后,广度优先搜索用于将NDF矢量表示形式扩展到两个不同的节点的矩阵表示,其中包含有关节点社区的高阶信息。我们的节点的矩阵表示为我们提供了一种新的方式,可视化节点的形状。此外,我们使用这些矩阵表示来获取特征向量,该特征向量适用于典型的深度学习算法。为了证明这些节点嵌入实际上包含有关节点的一些信息,在一系列示例中,我们表明可以通过将深度学习应用于这些本地特征来学习Pagerank和紧密的中心性。我们的构造足够灵活,可以处理不断发展的图。最后,我们解释了如何适应有向图的构造。
translated by 谷歌翻译
图形神经网络(GNNS)具有有限的表现力量,无法正确代表许多图形类。虽然更具表现力的图表表示学习(GRL)替代方案可以区分其中一些类,但它们明显难以实现,可能不会很好地扩展,并且尚未显示在现实世界任务中优于经过良好调整的GNN。因此,设计简单,可扩展和表现力的GRL架构,也实现了现实世界的改进仍然是一个开放的挑战。在这项工作中,我们展示了图形重建的程度 - 从其子图重建图形 - 可以减轻GRL架构目前面临的理论和实际问题。首先,我们利用图形重建来构建两个新的表达图表表示。其次,我们展示了图形重建如何提升任何GNN架构的表现力,同时是一个(可证明的)强大的归纳偏见,用于侵略性的侵略性。凭经验,我们展示了重建如何提高GNN的表现力 - 同时保持其与顶点的排列的不变性 - 通过解决原始GNN的七个图形属性任务而无法解决。此外,我们展示了如何在九世界基准数据集中提升最先进的GNN性能。
translated by 谷歌翻译
在概念学习,数据库查询的反向工程,生成参考表达式以及知识图中的实体比较之类的应用中,找到以标记数据项形式分开的逻辑公式,该公式分开以标记数据项形式给出的正面和负面示例。在本文中,我们研究了存在本体论的数据的分离公式的存在。对于本体语言和分离语言,我们都专注于一阶逻辑及其以下重要片段:描述逻辑$ \ Mathcal {alci} $,受保护的片段,两变量的片段和受保护的否定片段。为了分离,我们还考虑(工会)连接性查询。我们考虑了几种可分离性,这些可分离性在负面示例的治疗中有所不同,以及他们是否承认使用其他辅助符号来实现分离。我们的主要结果是(所有变体)可分离性,不同语言的分离能力的比较以及确定可分离性的计算复杂性的研究。
translated by 谷歌翻译
我们考虑从数据学习树结构ising模型的问题,使得使用模型计算的后续预测是准确的。具体而言,我们的目标是学习一个模型,使得小组变量$ S $的后海报$ p(x_i | x_s)$。自推出超过50年以来,有效计算最大似然树的Chow-Liu算法一直是学习树结构图形模型的基准算法。 [BK19]示出了关于以预测的局部总变化损耗的CHOW-LIU算法的样本复杂性的界限。虽然这些结果表明,即使在恢复真正的基础图中也可以学习有用的模型是不可能的,它们的绑定取决于相互作用的最大强度,因此不会达到信息理论的最佳选择。在本文中,我们介绍了一种新的算法,仔细结合了Chow-Liu算法的元素,以便在预测的损失下有效地和最佳地学习树ising模型。我们的算法对模型拼写和对抗损坏具有鲁棒性。相比之下,我们表明庆祝的Chow-Liu算法可以任意次优。
translated by 谷歌翻译
随机块模型(SBM)是一个随机图模型,其连接不同的顶点组不同。它被广泛用作研究聚类和社区检测的规范模型,并提供了肥沃的基础来研究组合统计和更普遍的数据科学中出现的信息理论和计算权衡。该专着调查了最近在SBM中建立社区检测的基本限制的最新发展,无论是在信息理论和计算方案方面,以及各种恢复要求,例如精确,部分和弱恢复。讨论的主要结果是在Chernoff-Hellinger阈值中进行精确恢复的相转换,Kesten-Stigum阈值弱恢复的相变,最佳的SNR - 单位信息折衷的部分恢复以及信息理论和信息理论之间的差距计算阈值。该专着给出了在寻求限制时开发的主要算法的原则推导,特别是通过绘制绘制,半定义编程,(线性化)信念传播,经典/非背带频谱和图形供电。还讨论了其他块模型的扩展,例如几何模型和一些开放问题。
translated by 谷歌翻译
为了追求基于本体本体的查询的通用标准,我们介绍了存在规则的“有限 - 局限性集合”(FCS),这是一种模型定义的规则集类别,灵感来自图形理论的cliquewidth措施。通过一个通用参数,我们表明FCS确保对相当一类的查询类(称为“ Damsoqs”)的必要性进行可决定性,这些查询均包含结合性查询(CQS)。 FCS类适当地概括了有限扩展集(FES)的类别,并且最多可以介绍2个Arity的签名,即有界树的类别(BTS)。对于较高的ARIT,BTS仅由FC通过重新化而间接汇总。尽管FCS的普遍性,但我们提供了一个规则集,该规则集具有可决定的CQ符号(由于一阶 - 剥离性),因此落在FC之外,从而证明了FCS的无与伦比和有限合并集(FUS)的无效性。尽管如此,我们还是表明,如果我们将自己限制在最多2的单头规则设置上,那么FCS属于FUS。
translated by 谷歌翻译
结构分解方法,例如普遍的高树木分解,已成功用于解决约束满意度问题(CSP)。由于可以重复使用分解以求解具有相同约束范围的CSP,因此即使计算本身很难,将资源投资于计算良好的分解是有益的。不幸的是,即使示波器仅略有变化,当前方法也需要计算全新的分解。在本文中,我们迈出了解决CSP $ P $分解的问题的第一步,以使其成为由$ P $修改产生的新CSP $ P'$的有效分解。即使从理论上讲问题很难,我们还是提出并实施了一个有效更新GHD的框架。我们算法的实验评估强烈提出了实际适用性。
translated by 谷歌翻译
也称为(非参数)结构方程模型(SEMS)的结构因果模型(SCM)被广泛用于因果建模目的。特别是,也称为递归SEM的无循环SCMS,形成了一个研究的SCM的良好的子类,概括了因果贝叶斯网络来允许潜在混淆。在本文中,我们调查了更多普通环境中的SCM,允许存在潜在混杂器和周期。我们展示在存在周期中,无循环SCM的许多方便的性质通常不会持有:它们并不总是有解决方案;它们并不总是诱导独特的观察,介入和反事实分布;边缘化并不总是存在,如果存在边缘模型并不总是尊重潜在的投影;他们并不总是满足马尔可夫财产;他们的图表并不总是与他们的因果语义一致。我们证明,对于SCM一般,这些属性中的每一个都在某些可加工条件下保持。我们的工作概括了SCM的结果,迄今为止仅针对某些特殊情况所知的周期。我们介绍了将循环循环设置扩展到循环设置的简单SCM的类,同时保留了许多方便的无环SCM的性能。用本文,我们的目标是为SCM提供统计因果建模的一般理论的基础。
translated by 谷歌翻译
Pearl's Do Colculus是一种完整的公理方法,可以从观察数据中学习可识别的因果效应。如果无法识别这种效果,则有必要在系统中执行经常昂贵的干预措施以学习因果效应。在这项工作中,我们考虑了设计干预措施以最低成本来确定所需效果的问题。首先,我们证明了这个问题是NP-HARD,随后提出了一种可以找到最佳解或对数因子近似值的算法。这是通过在我们的问题和最小击球设置问题之间建立联系来完成的。此外,我们提出了几种多项式启发式算法来解决问题的计算复杂性。尽管这些算法可能会偶然发现亚最佳解决方案,但我们的模拟表明它们在随机图上产生了小的遗憾。
translated by 谷歌翻译
$ N $ -Quens配置是$ N \ Times N $ Chessboard的$ N $相互非攻击座位的位置。Nauck在1850年介绍的$ N $ -Queens完井问题是决定是否可以将给定的部分配置完成为$ N $ -Queens配置。在本文中,我们研究了这个问题的极端方面,即:部分配置必须小心,以便完成完成?我们表明,可以完成任何最多$ N / 60 $相互非攻击Queens的展示。我们还提供了大约N / 4 $ Queens的部分配置,不能完成,并制定一些有趣的问题。我们的证据将Queens问题与二角形图中的彩虹匹配连接,并使用概率参数以及线性编程二元性。
translated by 谷歌翻译
图形神经网络(GNNS)是关于图形机器学习问题的深度学习架构。最近已经表明,GNN的富有效力可以精确地由组合Weisfeiler-Leman算法和有限可变计数逻辑来表征。该对应关系甚至导致了对应于更高维度的WL算法的新的高阶GNN。本文的目的是解释GNN的这些描述性特征。
translated by 谷歌翻译