智能论文笔记

Beyond Conjugacy for Chain Event Graph Model Selection

Aditi Shenvi , Silvia Liverani

分类： (统计)机器学习

2022-11-07

Chain event graphs are a family of probabilistic graphical models that generalise Bayesian networks and have been successfully applied to a wide range of domains. Unlike Bayesian networks, these models can encode context-specific conditional independencies as well as asymmetric developments within the evolution of a process. More recently, new model classes belonging to the chain event graph family have been developed for modelling time-to-event data to study the temporal dynamics of a process. However, existing model selection algorithms for chain event graphs and its variants rely on all parameters having conjugate priors. This is unrealistic for many real-world applications. In this paper, we propose a mixture modelling approach to model selection in chain event graphs that does not rely on conjugacy. Moreover, we also show that this methodology is more amenable to being robustly scaled than the existing model selection algorithms used for this family. We demonstrate our techniques on simulated datasets.

translated by 谷歌翻译

Constructing a Chain Event Graph from a Staged Tree

Aditi Shenvi , Jim Q. Smith

分类： (统计)机器学习 | 机器学习

2020-06-29

链事件图（CEGS）是最近的概率图形模型 - 贝叶斯网络的概括 - 在图形拓扑中提供了结构零，结构缺失值和上下文的条件独立性的显式表示。通过从事件树的顶点的着色开始以识别一步转变对称的变换，从事件树构成CEG。这个彩色的事件树，也称为阶段树是用于这个家庭的学习算法的输出。令人惊讶的是，尚未设计一般算法，它会自动将任何分阶段的树转换为CEG表示。在本文中，我们为该转换提供了一种简单的迭代反向算法。此外，我们表明，没有任何信息从将阶段的树转换成CEG。最后，我们证明，通过最佳停止标准，我们的算法比Silander和Leong（2013）中出现的特殊情况的概率更有效。我们还提供使用此算法的Python代码从任何暂存树中获取CEG以及使用采样零添加边缘的功能。

translated by 谷歌翻译

Clustering of longitudinal data: A tutorial on a variety of approaches

Niek Den Teuling , Steffen Pauws , Edwin van den Heuvel

分类：机器学习 | (统计)机器学习

2021-11-10

在过去二十年中，识别具有不同纵向数据趋势的群体的方法已经成为跨越许多研究领域的兴趣。为了支持研究人员，我们总结了文献关于纵向聚类的指导。此外，我们提供了一种纵向聚类方法，包括基于基团的轨迹建模（GBTM），生长混合模拟（GMM）和纵向K平均值（KML）。该方法在基本级别引入，并列出了强度，限制和模型扩展。在最近数据收集的发展之后，将注意这些方法的适用性赋予密集的纵向数据（ILD）。我们展示了使用R.中可用的包在合成数据集上的应用程序的应用。

translated by 谷歌翻译

Bayesian nonparametric mixture inconsistency for the number of components: How worried should we be in practice?

Yannis Chaumeny , Johan van der Molen Moris , Anthony C. Davison , Paul D. W. Kirk

分类： (统计)机器学习

2022-07-29

我们考虑有限混合物（MFM）和Dirichlet工艺混合物（DPM）模型的贝叶斯混合物。最近的渐近理论已经确定，DPM高估了大型样本的聚类数量，并且两类模型的估计量对于不指定的群集的数量不一致，但是对有限样本分析的含义尚不清楚。拟合这些模型后的最终报告的估计通常是使用MCMC摘要技术获得的单个代表性聚类，但是尚不清楚这样的摘要估计簇的数量。在这里，我们通过模拟和对基因表达数据的应用进行了研究，发现（i）DPM甚至在有限样本中高估了簇数的数量，但仅在有限的程度上可以使用适当的摘要来纠正，并且（ii）（ii））错误指定会导致对DPM和MFM中集群数量的高估，但是结果通常仍然可以解释。我们提供了有关MCMC摘要的建议，并建议尽管MFM的渐近性能更具吸引力，这提供了强大的动力来偏爱它们，但使用MFMS和DPMS获得的结果通常在实践中非常相似。

translated by 谷歌翻译

Community Detection in Weighted Multilayer Networks with Ambient Noise

Mark He , Dylan Lu , Jason Xu , Rose Mary Xavier

分类： (统计)机器学习

2021-02-24

我们介绍了一个新型的多层加权网络模型，该模型除了本地信号外，还考虑了全局噪声。该模型类似于多层随机块模型（SBM），但关键区别在于，跨层之间的块之间的相互作用在整个系统中是常见的，我们称之为环境噪声。单个块还以这些固定的环境参数为特征，以表示不属于其他任何地方的成员。这种方法允许将块同时聚类和类型化到信号或噪声中，以便更好地理解其在整个系统中的作用，而现有块模型未考虑。我们采用了分层变异推断的新颖应用来共同检测和区分块类型。我们称此模型为多层加权网络称为随机块（具有）环境噪声模型（SBANM），并开发了相关的社区检测算法。我们将此方法应用于费城神经发育队列中的受试者，以发现与精神病有关的具有共同心理病理学的受试者社区。

translated by 谷歌翻译

Model-based Clustering with Missing Not At Random Data

Aude Sportisse , Christophe Biernacki , Claire Boyer , Julie Josse , Matthieu Marbac Lourdelle , Gilles Celeux , Fabien Laporte

分类： (统计)机器学习 | 机器学习

2021-12-20

近几十年来，技术进步使得可以收集大数据集。在这种情况下，基于模型的群集是一种非常流行的，灵活和可解释的方法，用于在明确定义的统计框架中进行数据探索。大型数据集的增加之一是缺失值更频繁。但是，传统方式（由于丢弃具有缺失的值或估算方法的观察）不是为聚类目的而设计的。此外，它们很少适用于常规情况，虽然在实践中频繁地缺失，但是当缺失取决于未观察到的数据值时，缺失就缺失（mnar）值，而且可能在观察到的数据值上。本文的目标是通过直接在基于模型的聚类算法内嵌入MNAR数据来提出一种新的方法。我们为数据和缺失数据指示器的联合分布进行了选择模型。它对应于数据分布的混合模型和缺失数据机制的一般Mnar模型，其可以取决于底层类（未知）和/或缺失变量本身的值。导出大量有意义的MNAR子模型，对每个子模型研究了参数的可识别性，这通常是任何MNAR提案的关键问题。考虑EM和随机EM算法估计。最后，我们对合成数据的提议子模型进行了实证评估，我们说明了我们的方法对医疗寄存器的方法，创伤者（R）数据集。

translated by 谷歌翻译

A Tutorial on Learning With Bayesian Networks

David Heckerman

分类：机器学习 | 人工智能 | (统计)机器学习

2020-02-01

贝叶斯网络是一种图形模型，用于编码感兴趣的变量之间的概率关系。当与统计技术结合使用时，图形模型对数据分析具有几个优点。一个，因为模型对所有变量中的依赖性进行编码，因此它易于处理缺少某些数据条目的情况。二，贝叶斯网络可以用于学习因果关系，因此可以用来获得关于问题域的理解并预测干预的后果。三，因为该模型具有因果和概率语义，因此是结合先前知识（通常出现因果形式）和数据的理想表示。四，贝叶斯网络与贝叶斯网络的统计方法提供了一种有效和原则的方法，可以避免数据过剩。在本文中，我们讨论了从先前知识构建贝叶斯网络的方法，总结了使用数据来改善这些模型的贝叶斯统计方法。关于后一项任务，我们描述了学习贝叶斯网络的参数和结构的方法，包括使用不完整数据学习的技术。此外，我们还联系了贝叶斯网络方法，以学习监督和无监督学习的技术。我们说明了使用真实案例研究的图形建模方法。

translated by 谷歌翻译

Representation of Context-Specific Causal Models with Observational and Interventional Data

Eliana Duarte , Liam Solus

分类： (统计)机器学习

2021-01-22

我们考虑代表代理模型的问题，该模型使用我们称之为CSTREES的阶段树模型的适当子类对离散数据编码离散数据的原因模型。我们表明，可以通过集合表达CSTREE编码的上下文专用信息。由于并非所有阶段树模型都承认此属性，CSTREES是一个子类，可提供特定于上下文的因果信息的透明，直观和紧凑的表示。我们证明了CSTREEES承认全球性马尔可夫属性，它产生了模型等价的图形标准，概括了Verma和珍珠的DAG模型。这些结果延伸到一般介入模型设置，使CSTREES第一族的上下文专用模型允许介入模型等价的特征。我们还为CSTREE的最大似然估计器提供了一种封闭式公式，并使用它来表示贝叶斯信息标准是该模型类的本地一致的分数函数。在模拟和实际数据上分析了CSTHEELE的性能，在那里我们看到与CSTREELE而不是一般上演树的建模不会导致预测精度的显着损失，同时提供了特定于上下文的因果信息的DAG表示。

translated by 谷歌翻译

A new class of generative classifiers based on staged tree models

Federico Carli , Manuele Leonelli , Gherardo Varando

分类：人工智能 | 机器学习 | (统计)机器学习

2020-12-26

分类的生成模型使用类变量的联合概率分布和功能来构建决策规则。在生成模型中，贝叶斯网络和天真的贝叶斯分类器是最常用的，并提供了所有变量之间关系的明确图形表示。但是，这些具有高度限制可能存在的关系类型的缺点，而不允许特定于上下文的独立性。在这里，我们介绍了一种新的生成分类器类别，称为“分阶性树分类器”，该分类器正式解释了特定于上下文的独立性。它们是通过对事件树的顶点的分区进行构建的，可以正式读取条件独立性。还定义了天真的阶段树分类器，它扩展了经典的天真贝叶斯分类器，同时保持相同的复杂性。一项广泛的仿真研究表明，分级树分类器的分类精度与最先进的分类器的分类精度具有竞争力，并且一个示例展示了它们在实践中的使用。

translated by 谷歌翻译

Cluster-Specific Predictions with Multi-Task Gaussian Processes

Arthur Leroy , Pierre Latouche , Benjamin Guedj , Servane Gey

分类：机器学习 | (统计)机器学习

2020-11-16

引入了涉及高斯流程（GPS）的模型，以同时处理多个功能数据的多任务学习，聚类和预测。该过程充当了功能数据的基于模型的聚类方法，也是对新任务进行后续预测的学习步骤。该模型是将多任务GPS与常见平均过程的混合物实例化。得出了一种用于处理超参数的优化以及超构件对潜在变量和过程的估计的优化。我们建立了明确的公式，用于将平均过程和潜在聚类变量整合到预测分布中，这是两个方面的不确定性。该分布定义为集群特异性GP预测的混合物，在处理组结构数据时，可以增强性能。该模型处理观察的不规则网格，并提供了关于协方差结构的不同假设，用于在任务之间共享其他信息。聚类和预测任务上的性能将通过各种模拟方案和真实数据集进行评估。总体算法称为magmaclust，可公开作为R包。

translated by 谷歌翻译

On the safe use of prior densities for Bayesian model selection

F. Llorente , L. Martino , E. Curbelo , J. Lopez-Santiago , D. Delgado

分类： (统计)机器学习

2022-06-10

如今，贝叶斯推论的应用非常流行。在此框架中，通过其边际可能性或其商（称为贝叶斯因素）进行比较模型。但是，边际可能性取决于先前的选择。对于模型选择，与参数估计问题不同，即使是分散的先验也可能非常有用。此外，当先验不当时，相应模型的边际可能性就不确定。在这项工作中，我们讨论了边际可能性及其在模型选择中的作用的先验敏感性问题。我们还评论了使用非信息性先验，这在实践中是非常普遍的选择。讨论了一些实际建议，并描述了文献中提出的许多可能的解决方案，以设计用于模型选择的客观先验。其中一些还允许使用不当先验。还提出了边际似然方法与众所周知的信息标准之间的联系。我们通过说明性的数值示例描述了主要问题和可能的解决方案，还提供了一些相关的代码。其中之一涉及外球星的现实应用。

translated by 谷歌翻译

A generalized regionalization framework for geographical modelling and its application in spatial regression

Hao Guo , Andre Python , Yu Liu

分类：机器学习

2022-06-19

在存在空间异质性的情况下，应用于地理数据的模型面临着产生一般结果和捕获局部变化之间的权衡。在区域尺度上进行建模可以识别优化准确性和通用性的解决方案。但是，大多数当前的区域化算法在划分区域的属性中都假定同质性，而无需考虑生成属性的过程。在本文中，我们提出了一个基于两项目标函数的广义区域化框架，该框架有利于最高的总体精度解决方案，同时最大程度地减少区域数量。我们介绍了三种区域化算法，该算法扩展了以前的方法来解释空间约束的聚类。在模拟和真实数据的回归实验中检查了提出的框架的有效性。结果表明，使用自动后处理过程扩展的空间隐式算法优于空间显式方法。我们建议的框架有助于更好地捕获与空间异质性相关的过程，并在广泛的地理模型中使用潜在的应用。

translated by 谷歌翻译

Adjusted chi-square test for degree-corrected block models

Linfan Zhang , Arash A. Amini

分类： (统计)机器学习

2020-12-30

我们提出了对学度校正随机块模型（DCSBM）的合适性测试。该测试基于调整后的卡方统计量，用于测量$ n $多项式分布的组之间的平等性，该分布具有$ d_1，\ dots，d_n $观测值。在网络模型的背景下，多项式的数量（$ n $）的数量比观测值数量（$ d_i $）快得多，与节点$ i $的度相对应，因此设置偏离了经典的渐近学。我们表明，只要$ \ {d_i \} $的谐波平均值生长到无穷大，就可以使统计量在NULL下分配。顺序应用时，该测试也可以用于确定社区数量。该测试在邻接矩阵的压缩版本上进行操作，因此在学位上有条件，因此对大型稀疏网络具有高度可扩展性。我们结合了一个新颖的想法，即在测试$ K $社区时根据$（k+1）$ - 社区分配来压缩行。这种方法在不牺牲计算效率的情况下增加了顺序应用中的力量，我们证明了它在恢复社区数量方面的一致性。由于测试统计量不依赖于特定的替代方案，因此其效用超出了顺序测试，可用于同时测试DCSBM家族以外的各种替代方案。特别是，我们证明该测试与具有社区结构的潜在可变性网络模型的一般家庭一致。

translated by 谷歌翻译

A Bayesian decision support system for counteracting activities of terrorist groups

Aditi Shenvi , F. Oliver Bunnin , Jim Q. Smith

分类： (统计)机器学习

2020-07-08

恐怖群体的活动对公众的安全和福祉带来了严重的威胁。反恐当局旨在在投入行动之前识别和挫败恐怖群体的计划。虽然恐怖群体的活动可能被隐藏和伪装，但这些群体的成员需要沟通和协调组织他们的活动。当局可以利用这种可观察行为和通信数据来估计恐怖组织构成的威胁。然而，为了可信，任何此类统计模型需要折叠在本集团的每个成员构成的威胁水平。与其他良性形式的社交网络不同，考虑到恐怖主义群体作为可更换的成员，给出了该集团造成伤害的综合能力的不完整图片。在这里，我们开发了一个贝叶斯集成决策支持系统，可以将与恐怖主义组的每个成员相关的信息以及集团的组合活动。

translated by 谷歌翻译

Causal Structure Learning: a Combinatorial Perspective

Chandler Squires , Caroline Uhler

分类：机器学习

2022-06-02

In this review, we discuss approaches for learning causal structure from data, also called causal discovery. In particular, we focus on approaches for learning directed acyclic graphs (DAGs) and various generalizations which allow for some variables to be unobserved in the available data. We devote special attention to two fundamental combinatorial aspects of causal structure learning. First, we discuss the structure of the search space over causal graphs. Second, we discuss the structure of equivalence classes over causal graphs, i.e., sets of graphs which represent what can be learned from observational data alone, and how these equivalence classes can be refined by adding interventional data.

translated by 谷歌翻译

A Two-step Metropolis Hastings Method for Bayesian Empirical Likelihood Computation with Application to Bayesian Model Selection

Sanjay Chaudhuri , Teng Yin

分类： (统计)机器学习

2022-09-02

最近，经验可能性已在贝叶斯框架下广泛应用。马尔可夫链蒙特卡洛（MCMC）方法经常用于从感兴趣参数的后验分布中采样。然而，可能性支持的复杂性，尤其是非凸性的性质，在选择适当的MCMC算法时建立了巨大的障碍。这种困难限制了在许多应用中基于贝叶斯的经验可能性（贝叶赛）方法的使用。在本文中，我们提出了一个两步的大都会黑斯廷斯算法，以从贝耶斯后期进行采样。我们的建议是在层次上指定的，其中确定经验可能性的估计方程用于根据其余参数的建议值提出一组参数的值。此外，我们使用经验可能性讨论贝叶斯模型的选择，并将我们的两步大都会黑斯廷斯算法扩展到可逆的跳跃马尔可夫链蒙特卡洛手术程序，以便从最终的后验中采样。最后，提出了我们提出的方法的几种应用。

translated by 谷歌翻译

Learning non-stationary and discontinuous functions using clustering, classification and Gaussian process modelling

M. Moustapha , B. Sudret

分类： (统计)机器学习 | 机器学习

2022-11-30

Surrogate models have shown to be an extremely efficient aid in solving engineering problems that require repeated evaluations of an expensive computational model. They are built by sparsely evaluating the costly original model and have provided a way to solve otherwise intractable problems. A crucial aspect in surrogate modelling is the assumption of smoothness and regularity of the model to approximate. This assumption is however not always met in reality. For instance in civil or mechanical engineering, some models may present discontinuities or non-smoothness, e.g., in case of instability patterns such as buckling or snap-through. Building a single surrogate model capable of accounting for these fundamentally different behaviors or discontinuities is not an easy task. In this paper, we propose a three-stage approach for the approximation of non-smooth functions which combines clustering, classification and regression. The idea is to split the space following the localized behaviors or regimes of the system and build local surrogates that are eventually assembled. A sequence of well-known machine learning techniques are used: Dirichlet process mixtures models (DPMM), support vector machines and Gaussian process modelling. The approach is tested and validated on two analytical functions and a finite element model of a tensile membrane structure.

translated by 谷歌翻译

Mapping the Internet: Modelling Entity Interactions in Complex Heterogeneous Networks

Simon Mandlik , Tomas Pevny

分类：机器学习

2021-04-19

即使机器学习算法已经在数据科学中发挥了重要作用，但许多当前方法对输入数据提出了不现实的假设。由于不兼容的数据格式，或数据集中的异质，分层或完全缺少的数据片段，因此很难应用此类方法。作为解决方案，我们提出了一个用于样本表示，模型定义和培训的多功能，统一的框架，称为“ Hmill”。我们深入审查框架构建和扩展的机器学习的多个范围范式。从理论上讲，为HMILL的关键组件的设计合理，我们将通用近似定理的扩展显示到框架中实现的模型所实现的所有功能的集合。本文还包含有关我们实施中技术和绩效改进的详细讨论，该讨论将在MIT许可下发布供下载。该框架的主要资产是其灵活性，它可以通过相同的工具对不同的现实世界数据源进行建模。除了单独观察到每个对象的一组属性的标准设置外，我们解释了如何在框架中实现表示整个对象系统的图表中的消息推断。为了支持我们的主张，我们使用框架解决了网络安全域的三个不同问题。第一种用例涉及来自原始网络观察结果的IoT设备识别。在第二个问题中，我们研究了如何使用以有向图表示的操作系统的快照可以对恶意二进制文件进行分类。最后提供的示例是通过网络中实体之间建模域黑名单扩展的任务。在所有三个问题中，基于建议的框架的解决方案可实现与专业方法相当的性能。

translated by 谷歌翻译

Copulaboost: additive modeling with copula-based model components

Simon Boge Brant , Ingrid Hobæk Haff

分类： (统计)机器学习

2022-08-09

我们提出了一种基于配对构造的模型组件的广义添加剂模型，并以预测为主要目的。该模型组件的设计使我们的模型可以捕获响应协变量之间关系中潜在的复杂相互作用效应。此外，我们的模型不需要连续协变量的离散化，因此适用于许多此类协变量的问题。此外，我们设计了一种受梯度增强启发的拟合算法，以及通过对模型空间和近似值的限制来加快时间对比计算的限制，用于模型选择和模型选择的有效程序。除了我们的模型在更高维度中成为现实的选择绝对必要外，这些技术还可以作为设计有效模型选择算法的其他类型的Copula回归模型的基础。我们已经在模拟研究中探索了我们方法的特征，特别是将其与自然替代方案进行比较，例如逻辑回归，经典增强模型和受到惩罚的逻辑回归。我们还展示了我们在威斯康星州乳腺癌数据集和波士顿住房数据集上的方法。结果表明，即使离散协变量的比例很高，我们的方法的预测性能要么比其他方法更好或可比其他方法媲美。

translated by 谷歌翻译

clusterBMA: Bayesian model averaging for clustering

Owen Forbes , Edgar Santos-Fernandez , Paul Pao-Yen Wu , Hong-Bo Xie , Paul E. Schwenn , Jim Lagopoulos , Lia Mills , Dashiell D. Sacks , Daniel F. Hermens , Kerrie Mengersen

分类： (统计)机器学习

2022-09-09

已经开发了各种方法来结合多组结果的推理，以在集合和共识聚类文献中进行无监督的聚类。从几个候选聚类模型中的一个“最佳”模型报告结果的方法通常忽略了由模型选择产生的不确定性，并且导致对所选择的特定模型和参数敏感的推论，以及制作的假设，尤其是在小样本中所做的假设。尺寸或小簇尺寸。贝叶斯模型平均（BMA）是一种在多种模型中结合结果的流行方法，这些模型在这种情况下提供了一些有吸引力的好处，包括对组合集群结构的概率解释和基于模型的不确定性的量化。在这项工作中，我们介绍了ClusterBMA，该方法可以通过多种无监督聚类算法进行加权模型平均。我们将聚类内部验证标准的组合用作后验模型概率的新近似值，以加权每个模型的结果。从代表跨模型的聚类溶液的加权平均值的组合后相似性矩阵，我们应用对称的单纯形矩阵分解来计算最终的概率群集分配。此方法在随附的R软件包中实现。我们通过案例研究探索这种方法的性能，该案例研究旨在根据脑电图（EEG）数据识别个体的概率簇。我们还使用仿真数据集探索所提出的技术识别稳健的集成簇具有不同级别的集成簇，并在子组之间的分离水平变化，并且模型之间的簇数量变化。

translated by 谷歌翻译