由于其在线社交网络上的广泛应用,影响力最大化(IM)在过去几十年中引起了广泛关注。当前的IM研究缺乏对种子如何产生影响效应的人类理解的解释,从而降低了现有解决方案的可信度,尽管它们适用。由于IM的复杂性,目前的大多数研究都集中在估计一阶扩散能力上,并且经常考虑从不同种子分散的流量之间的相互作用。这项研究使用SOBOL指数,这是基于方差的灵敏度分析的基石,可以分解对单个种子及其相互作用的影响效果。 SOBOL指数是针对IM上下文量身定制的,通过将种子选择作为二进制变量进行建模。这种说明方法普遍适用于所有网络类型,IM技术和扩散模型。基于解释方法,提出了一个称为Sobolim的一般框架,以通过过度选择节点,然后是消除策略来提高IM研究的性能。关于合成和现实世界图的实验表明,对影响效应的解释可以可靠地识别各种网络和IM方法之间种子之间的关键高阶相互作用。在经验上,Sobolim在有效性和效率上具有优势。
translated by 谷歌翻译
Influence Maximization (IM) is a classical combinatorial optimization problem, which can be widely used in mobile networks, social computing, and recommendation systems. It aims at selecting a small number of users such that maximizing the influence spread across the online social network. Because of its potential commercial and academic value, there are a lot of researchers focusing on studying the IM problem from different perspectives. The main challenge comes from the NP-hardness of the IM problem and \#P-hardness of estimating the influence spread, thus traditional algorithms for overcoming them can be categorized into two classes: heuristic algorithms and approximation algorithms. However, there is no theoretical guarantee for heuristic algorithms, and the theoretical design is close to the limit. Therefore, it is almost impossible to further optimize and improve their performance. With the rapid development of artificial intelligence, the technology based on Machine Learning (ML) has achieved remarkable achievements in many fields. In view of this, in recent years, a number of new methods have emerged to solve combinatorial optimization problems by using ML-based techniques. These methods have the advantages of fast solving speed and strong generalization ability to unknown graphs, which provide a brand-new direction for solving combinatorial optimization problems. Therefore, we abandon the traditional algorithms based on iterative search and review the recent development of ML-based methods, especially Deep Reinforcement Learning, to solve the IM problem and other variants in social networks. We focus on summarizing the relevant background knowledge, basic principles, common methods, and applied research. Finally, the challenges that need to be solved urgently in future IM research are pointed out.
translated by 谷歌翻译
我们考虑了最大化的影响(IM)问题:'如果我们能说服社交网络中的一部分个人采用新产品或创新,目的是触发大量的进一步收养级联我们应该定位吗?正式地,这是在社交网络中选择$ K $种子节点的任务,以使网络中预期的影响节点(在某些影响下传播模型)最大化。在文献中已经广泛研究了这个问题,并提出了几种解决方案方法。但是,大多数基于模拟的方法涉及耗时的蒙特卡洛模拟,以计算种子节点在整个网络中的影响。这限制了这些方法在大型社交网络上的适用性。在本文中,我们有兴趣以时间效率的方式解决影响最大化的问题。我们提出了一种社区意识的分歧和纠纷策略,涉及(i)学习社交网络的固有社区结构,(ii)通过解决每个社区的影响最大化问题,以及(iii)选择最终的影响力来生成候选解决方案。使用新颖的渐进预算计划来自候选解决方案的个人。我们提供有关现实世界社交网络的实验,表明所提出的算法在经验运行时和启发式算法方面优于基于仿真的算法。我们还研究了社区结构对算法性能的影响。我们的实验表明,具有较高模块化的社区结构导致所提出的算法在运行时和影响方面表现更好。
translated by 谷歌翻译
社交网络(SN)是一个由代表它们之间相互作用的群体组成的社会结构。 SNS最近被广泛使用,随后已成为产品推广和信息扩散的合适平台。 SN中的人们直接影响彼此的利益和行为。 SNS中最重要的问题之一是,如果选择将它们作为网络扩散场景的种子节点选择,那么他们可以以级联的方式对网络中的其他节点产生最大影响。有影响力的扩散器是人们,如果他们被选为网络中出版问题中的种子,那么该网络将拥有最多了解该扩散实体的人。这是称为影响最大化(IM)问题的文献中的一个众所周知的问题。尽管已证明这是一个NP完整的问题,并且在多项式时间内没有解决方案,但有人认为它具有子模块化功能的属性,因此可以使用贪婪的算法来解决。提出改善这种复杂性的大多数方法都是基于以下假设:整个图都是可见的。但是,此假设不适合许多真实世界图。进行了这项研究,以扩展使用链接预测技术与伪可见性图的电流最大化方法。为此,将一种称为指数随机图模型(ERGM)的图生成方法用于链接预测。使用斯坦福大学SNAP数据集的数据对所提出的方法进行了测试。根据实验测试,所提出的方法在现实世界图上有效。
translated by 谷歌翻译
随着组合优化的机器学习领域,通过这种新的视角,传统问题重新敷设和重新进行了折叠。大多数文献中的绝大多数侧重于小的图形问题,而几个真实问题致力于大图。在这里,我们专注于两个这样的问题:影响估计,#p-coll counting问题,以及影响最大化,np-colly问题。我们开发Glie,一个图形神经网络(GNN),其固有地参数化影响估计的上限并在小模拟图上培训。实验表明,Glie为真正的图表提供了精确的影响,该估计比列车集大10倍。更重要的是,它可以用于对大大更大图的影响最大化,因为预测排名不受精度降低的影响。我们使用Glie制定一个Cely Optimization,而不是模拟的影响估计,超越了影响最大化的基准,尽管具有计算开销。为了平衡时间复杂性和影响质量,我们提出了两种不同的方法。第一个是Q-Network,学会使用Glie的预测顺序选择种子。第二种基于Glie的表示在构建种子集的同时,基于Glie的表示来定义一个可怕的子模块功能。后者提供了时间效率和影响的最佳组合,表现优于SOTA基准。
translated by 谷歌翻译
在社交网络中找到有影响力的用户是一个基本问题,具有许多可能的应用程序。将社交网络视为图形,可以通过位于网络中给定数量的跳数内的邻居的数量来测量一组用户的影响,其中每个跳标标记了影响扩散的步骤。在本文中,我们将IM的问题减少到预算受限的D-Hop主导集合问题(KDDSP)。我们提出了一个统一的机器学习(ML)框架,FastCover,通过以无人监督的方式学习高效的贪婪策略来解决KDDSP。作为框架的一个关键组成部分,我们设计了一种新颖的图形神经网络(GNN)架构,图反转关注网络(GRAT),其捕获邻居之间的扩散过程。与用于组合优化问题的大多数启发式算法和并发ML框架不同,FastCover确定从GNN的一个正向传播的节点的分数确定整个种子集,并且在图形大小中具有时间复杂性准线性。综合图和现实世界社交网络的实验表明,FastCover通过并发算法呈现的更好或相当的质量来找到解决方案,同时实现超过1000x的加速。
translated by 谷歌翻译
在影响最大化(IM)的现实世界应用中,网络结构通常是未知的。因此,我们可以通过仅探索基础网络的一部分来确定最有影响力的种子节点,但对于节点查询的预算很小。由于收集节点元数据比通过查询节点调查节点之间的关系更具成本效益,我们提出了IM-Meta,这是一种端到端的解决方案,这是通过从查询和节点中检索信息的网络中IM的端到端解决方案元数据。但是,由于元数据的嘈杂性质和连通性推断的不确定性,使用这种元数据来帮助IM过程并非没有风险。为了应对这些挑战,我们制定了一个新的IM问题,旨在找到种子节点和查询节点。在IM-META中,我们开发了一种有效的方法,该方法可以迭代执行三个步骤:1)我们通过暹罗神经网络模型学习了收集的元数据和边缘之间的关系,2)我们选择了许多推断的自信边缘来构建增强的图形, 3)我们通过使用我们的拓扑感知的排名策略来最大程度地提高推断影响扩展,以确定查询的下一个节点。通过查询仅5%的节点,IM-META达到了上限性能的93%。
translated by 谷歌翻译
影响最大化是挖掘社交网络深入信息的关键问题,该信息旨在选择从网络中选择种子以最大程度地增加受影响的节点的数量。为了评估种子套装的影响,现有的努力提出了拟议的代理模型(转换),以较低的计算成本来代替昂贵的蒙特卡洛模拟过程。这些基于网络先验知识的替代转换从各个角度引起具有相似特征的不同搜索行为。对于特定情况,用户很难先验确定合适的转换。在本文中,我们提出了一个多种转化的进化框架,以进行影响最大化(MTEFIM),并保证了融合保证,以利用替代转换的潜在相似性和独特的优势,并避免用户手动确定最合适的转换。在MTEFIM中,将多个转换同时优化为多个任务。每个转换均分配一个进化求解器。进行了MTEFIM的三个主要组成部分:1)根据不同人群的个人(种子集)重叠程度估算转化之间的潜在关系,2)根据转变关系,将个体转移到跨种群中,3)选择最终输出种子集,包含所有代理模型知识。 MTEFIM的有效性在基准和现实世界社交网络上得到了验证。实验结果表明,与几种流行的IM特异性方法相比,MTEFIM可以有效地利用跨多个转换的潜在转移知识,以实现高度竞争性能。可以在https://github.com/xiaofangxd/mtefim上访问MTEFIM的实现。
translated by 谷歌翻译
Models for the processes by which ideas and influence propagate through a social network have been studied in a number of domains, including the diffusion of medical and technological innovations, the sudden and widespread adoption of various strategies in game-theoretic settings, and the effects of "word of mouth" in the promotion of new products. Motivated by the design of viral marketing strategies, Domingos and Richardson posed a fundamental algorithmic problem for such social network processes: if we can try to convince a subset of individuals to adopt a new product or innovation, and the goal is to trigger a large cascade of further adoptions, which set of individuals should we target?We consider this problem in several of the most widely studied models in social network analysis. The optimization problem of selecting the most influential nodes is NP-hard here. The two conference papers upon which this article is based (KDD 2003 and ICALP 2005) provide the first provable approximation guarantees for efficient algorithms. Using an The present article is an expanded version of two conference papers [51,52], which appeared in KDD 2003 and ICALP 2005, respectively.
translated by 谷歌翻译
在网络中找到最有影响力的节点是一个计算困难的问题,其中有多种基于网络的问题的几个可能的应用程序。尽管已经提出了几种解决影响最大化问题(IM)问题的方法,但当网络大小增加时,它们的运行时间通常会缩放较差。在这里,我们提出了一种基于网络缩减的原始方法,该方法允许多目标进化算法(MOEA)在减少的比例网络上解决IM问题,同时保留原始网络的相关属性。然后使用基于中心度指标(例如Pagerank)的机制将缩小的解决方案升级到原始网络。我们在八个大型网络(包括$ \ sim $ 50k节点)上的结果证明了该方法的有效性,与原始网络所需的时间相比,运行时增益超过10倍,最高为82美元\%与CELF相比,$减少了时间。
translated by 谷歌翻译
对网络中的用户如何根据邻居的意见更新他们的意见的理解吸引了网络科学领域的极大兴趣,并且越来越多的文献认识到了这个问题的重要性。在这篇研究论文中,我们提出了有指导网络中意见形成的新动态模型。在此模型中,每个节点的意见被更新为邻居意见的加权平均值,而权重代表社会影响力。我们将一种新的中心度度量定义为基于影响和整合性的社会影响度量。我们使用两个意见形成模型来衡量这种新方法:(i)degroot模型和(ii)我们自己提出的模型。先前发表的研究没有考虑合格,并且仅考虑计算社会影响时节点的影响。在我们的定义中,与高度和较低程度的节点相关的较低度和高度的节点具有较高的中心性。作为这项研究的主要贡献,我们提出了一种算法,用于在社交网络中找到一小部分节点,该节点可能会对其他节点的观点产生重大影响。关于现实世界数据的实验表明,所提出的算法显着优于先前发布的最新方法。
translated by 谷歌翻译
从大量嘈杂的候选人中选择一小部分信息功能是一个充满挑战的问题,即机器学习和近似贝叶斯计算中的许多应用程序。在实践中,还需要考虑计算信息丰富功能的成本。这对于网络尤为重要,因为单个功能的计算成本可以跨越几个数量级。我们使用两种方法解决了网络模型选择问题的问题。首先,我们调整了九种功能选择方法来说明功能成本。我们为两类网络模型显示,可以通过两个数量级降低成本,而不会极大地影响分类精度(正确识别的模型的比例)。其次,我们使用具有较小网络的Pilot模拟选择了功能。这种方法将计算成本降低了50倍,而不会影响分类精度。为了证明我们的方法的实用性,我们将其应用于三个不同的酵母蛋白相互作用网络,并确定了最合适的重复差异模型。
translated by 谷歌翻译
社交媒体广泛用于当今世界。它有助于快速简便地分享信息,使其成为广告产品的良好媒介。由于其巨大的普及,社交媒体网络的影响因素提供了巨大的潜在客户群。但是,决定应该选择哪些影响因素,以便为能够产生低投资的高回报而选择哪些影响因素并不简单。在这项工作中,我们提出了一个基于代理的模型(ABM),可以模拟影响者在各种情景中广告活动的动态,并可以帮助发现最佳的影响者营销策略。我们的系统是一种基于概率的图形的模型,提供了额外的优势,可以将现实世界因素(如顾客对产品,客户行为,愿意支付,品牌的投资盖,影响因素扩散)的兴趣提供额外的优势。产品的性质被广告viz。奢侈品和非奢侈品。利用客户收购成本和转换率作为一个单位经济,我们通过改变产品的性质和客户兴趣来评估不同类型的影响因素的性能。我们的结果举例说明了影响者营销的环境依赖性,并提供了在各种情况下更好地策略的洞察力。例如,我们表明,随着产品的性质因奢侈品而异,名人的表现下降而纳米影响者的性能提高。在客户的兴趣方面,我们发现纳米影响者的表现随着客户利益的减少而下降,而名人的表现则改善。
translated by 谷歌翻译
Most real-world networks suffer from incompleteness or incorrectness, which is an inherent attribute to real-world datasets. As a consequence, those downstream machine learning tasks in complex network like community detection methods may yield less satisfactory results, i.e., a proper preprocessing measure is required here. To address this issue, in this paper, we design a new community attribute based link prediction strategy HAP and propose a two-step community enhancement algorithm with automatic evolution process based on HAP. This paper aims at providing a community enhancement measure through adding links to clarify ambiguous community structures. The HAP method takes the neighbourhood uncertainty and Shannon entropy to identify boundary nodes, and establishes links by considering the nodes' community attributes and community size at the same time. The experimental results on twelve real-world datasets with ground truth community indicate that the proposed link prediction method outperforms other baseline methods and the enhancement of community follows the expected evolution process.
translated by 谷歌翻译
考虑两个决策任务$ a $和$ b $,每个都希望计算给定\ textit {query} $ x $的有效\ textit {dekistion} $ y $,{我们可以解决任务$ b $通过使用$ a $的查询决定对$(x,y)$,而不知道潜在的决策模型吗?}此类问题,称为\ textit {用任务迁移的倒数决策},很感兴趣现实世界应用的随机性通常会阻止代理完全了解基础系统。在本文中,我们引入了正式配方的新问题,并提出了一个通用框架,用于解决社会传染管理中的决策任务。在理论方面,我们提出了一个概括分析,以证明我们的框架学习绩效。在经验研究中,我们进行理智检查,并将提出的方法与其他可能的基于学习的方法和基于图的方法进行比较。我们已经获得了有希望的实验结果,首次确认可以通过使用与另一个相关的解决方案来解决一项决策任务。
translated by 谷歌翻译
许多复杂网络的结构包括其拓扑顶部的边缘方向性和权重。可以无缝考虑这些属性组合的网络分析是可取的。在本文中,我们研究了两个重要的这样的网络分析技术,即中心和聚类。采用信息流基于集群的模型,该模型本身就是在计算中心的信息定理措施时构建。我们的主要捐款包括马尔可夫熵中心的广义模型,灵活地调整节点度,边缘权重和方向的重要性,具有闭合形式的渐近分析。它导致一种新颖的两级图形聚类算法。中心分析有助于推理我们对给定图形的方法的适用性,并确定探索当地社区结构的“查询”节点,从而导致群集聚类机制。熵中心计算由我们的聚类算法摊销,使其计算得高效:与使用马尔可夫熵中心为聚类的先前方法相比,我们的实验表明了多个速度的速度。我们的聚类算法自然地继承了适应边缘方向性的灵活性,以及​​边缘权重和节点度之间的不同解释和相互作用。总的来说,本文不仅具有显着的理论和概念贡献,还转化为实际相关性的文物,产生新的,有效和可扩展的中心计算和图形聚类算法,其有效通过广泛的基准测试进行了验证。
translated by 谷歌翻译
我们研究了社交网络中的在线影响最大化(OIM)问题,其中在多个回合中,学习者反复选择种子节点以产生级联,观察级联反馈,并逐渐学习产生最大级联的最佳种子。我们专注于本文的两个主要挑战。首先,我们使用节点级反馈而不是边缘级反馈。边缘级别反馈显示通过级联中通过信息的所有边,其中节点级反馈仅显示使用时间戳的激活节点。节点级反馈可以说是更逼真的,因为在实践中,观察到谁受到影响,而且很难观察来自哪个关系(边缘)的影响。其次,我们使用标准离线Oracle而不是脱机对 - Oracle。为了计算下一轮的良好种子集,离线对 - Oracle同时找到最佳种子集和置信区内的最佳参数,并且由于OIM问题的组合核心,这种Oracle难以计算。因此,我们专注于如何使用标准离线影响最大化Oracle,它找到了将边缘参数作为输入的最佳种子集。在本文中,我们解决了这两个最受欢迎的扩散模型,独立级联(IC)和线性阈值(LT)模型的这些挑战。对于IC模型,过去的研究只实现了边缘级反馈,而我们介绍了第一个$ \ widetilde {o}(\ sqrt {t})$ - 遗憾的节点级反馈算法。此外,算法仅调用标准离线oracles。对于LT模型,最近的一项研究仅提供了一个符合第一个挑战的OIM解决方案,但仍需要一对甲骨文。在本文中,我们应用类似于IC模型的类似技术,以用标准的Oracle替换一对Oracle,同时维持$ \ widetilde {o}(\ sqrt {t})$ - 后悔。
translated by 谷歌翻译
我们研究了图神经网络(GNN)的解释性,作为阐明其工作机制的一步。尽管大多数当前方法都集中在解释图节点,边缘或功能上,但我们认为,作为GNNS的固有功能机制,消息流对执行解释性更为自然。为此,我们在这里提出了一种新颖的方法,即FlowX,以通过识别重要的消息流来解释GNN。为了量化流量的重要性,我们建议遵循合作游戏理论中沙普利价值观的哲学。为了解决计算所有联盟边际贡献的复杂性,我们提出了一个近似方案,以计算类似沙普利的值,作为进一步再分配训练的初步评估。然后,我们提出一种学习算法来训练流量评分并提高解释性。关于合成和现实世界数据集的实验研究表明,我们提出的FlowX导致GNN的解释性提高。
translated by 谷歌翻译
在社交媒体上传播谣言对社会构成了重要威胁,因此最近提出了各种谣言检测技术。然而,现有的工作重点是\ emph {what}实体构成谣言,但几乎没有支持理解\ emph {为什么}实体已被归类为这样。这样可以防止对检测的谣言以及对策设计的有效评估。在这项工作中,我们认为,可以通过过去检测到的相关谣言的例子来给出检测到的谣言的解释。一系列类似的谣言有助于用户概括,即了解控制谣言的探测的特性。由于通常使用特征声明的图表对社交媒体的谣言传播通常是建模的,因此我们提出了一种逐个示例的方法,鉴于谣言图,它从过去的谣言中提取了$ k $最相似和最多的子图。挑战是所有计算都需要快速评估图之间的相似性。为了在流式设置中实现该方法的有效和适应性实现,我们提出了一种新颖的图表学习技术,并报告了实施注意事项。我们的评估实验表明,我们的方法在为各种谣言传播行为提供有意义的解释方面优于基线技术。
translated by 谷歌翻译
元学习用于通过组合数据和先验知识来有效地自动选择机器学习模型。由于传统的元学习技术缺乏解释性,并且在透明度和公平性方面存在缺点,因此实现元学习的解释性至关重要。本文提出了一个可解释的元学习框架,该框架不仅可以解释元学习算法选择的建议结果,而且还可以对建议算法在特定数据集中的性能和业务场景中更完整,更准确地解释。通过广泛的实验证明了该框架的有效性和正确性。
translated by 谷歌翻译