Information diffusion in Online Social Networks is a new and crucial problem in social network analysis field and requires significant research attention. Efficient diffusion of information are of critical importance in diverse situations such as; pandemic prevention, advertising, marketing etc. Although several mathematical models have been developed till date, but previous works lacked systematic analysis and exploration of the influence of neighborhood for information diffusion. In this paper, we have proposed Common Neighborhood Strategy (CNS) algorithm for information diffusion that demonstrates the role of common neighborhood in information propagation throughout the network. The performance of CNS algorithm is evaluated on several real-world datasets in terms of diffusion speed and diffusion outspread and compared with several widely used information diffusion models. Empirical results show CNS algorithm enables better information diffusion both in terms of diffusion speed and diffusion outspread.
translated by 谷歌翻译
Community detection in Social Networks is associated with finding and grouping the most similar nodes inherent in the network. These similar nodes are identified by computing tie strength. Stronger ties indicates higher proximity shared by connected node pairs. This work is motivated by Granovetter's argument that suggests that strong ties lies within densely connected nodes and the theory that community cores in real-world networks are densely connected. In this paper, we have introduced a novel method called \emph{Disjoint Community detection using Cascades (DCC)} which demonstrates the effectiveness of a new local density based tie strength measure on detecting communities. Here, tie strength is utilized to decide the paths followed for propagating information. The idea is to crawl through the tuple information of cascades towards the community core guided by increasing tie strength. Considering the cascade generation step, a novel preferential membership method has been developed to assign community labels to unassigned nodes. The efficacy of $DCC$ has been analyzed based on quality and accuracy on several real-world datasets and baseline community detection algorithms.
translated by 谷歌翻译
Online Social Networks have embarked on the importance of connection strength measures which has a broad array of applications such as, analyzing diffusion behaviors, community detection, link predictions, recommender systems. Though there are some existing connection strength measures, the density that a connection shares with it's neighbors and the directionality aspect has not received much attention. In this paper, we have proposed an asymmetric edge similarity measure namely, Neighborhood Density-based Edge Similarity (NDES) which provides a fundamental support to derive the strength of connection. The time complexity of NDES is $O(nk^2)$. An application of NDES for community detection in social network is shown. We have considered a similarity based community detection technique and substituted its similarity measure with NDES. The performance of NDES is evaluated on several small real-world datasets in terms of the effectiveness in detecting communities and compared with three widely used similarity measures. Empirical results show NDES enables detecting comparatively better communities both in terms of accuracy and quality.
translated by 谷歌翻译
社交网络(SN)是一个由代表它们之间相互作用的群体组成的社会结构。 SNS最近被广泛使用,随后已成为产品推广和信息扩散的合适平台。 SN中的人们直接影响彼此的利益和行为。 SNS中最重要的问题之一是,如果选择将它们作为网络扩散场景的种子节点选择,那么他们可以以级联的方式对网络中的其他节点产生最大影响。有影响力的扩散器是人们,如果他们被选为网络中出版问题中的种子,那么该网络将拥有最多了解该扩散实体的人。这是称为影响最大化(IM)问题的文献中的一个众所周知的问题。尽管已证明这是一个NP完整的问题,并且在多项式时间内没有解决方案,但有人认为它具有子模块化功能的属性,因此可以使用贪婪的算法来解决。提出改善这种复杂性的大多数方法都是基于以下假设:整个图都是可见的。但是,此假设不适合许多真实世界图。进行了这项研究,以扩展使用链接预测技术与伪可见性图的电流最大化方法。为此,将一种称为指数随机图模型(ERGM)的图生成方法用于链接预测。使用斯坦福大学SNAP数据集的数据对所提出的方法进行了测试。根据实验测试,所提出的方法在现实世界图上有效。
translated by 谷歌翻译
我们考虑了最大化的影响(IM)问题:'如果我们能说服社交网络中的一部分个人采用新产品或创新,目的是触发大量的进一步收养级联我们应该定位吗?正式地,这是在社交网络中选择$ K $种子节点的任务,以使网络中预期的影响节点(在某些影响下传播模型)最大化。在文献中已经广泛研究了这个问题,并提出了几种解决方案方法。但是,大多数基于模拟的方法涉及耗时的蒙特卡洛模拟,以计算种子节点在整个网络中的影响。这限制了这些方法在大型社交网络上的适用性。在本文中,我们有兴趣以时间效率的方式解决影响最大化的问题。我们提出了一种社区意识的分歧和纠纷策略,涉及(i)学习社交网络的固有社区结构,(ii)通过解决每个社区的影响最大化问题,以及(iii)选择最终的影响力来生成候选解决方案。使用新颖的渐进预算计划来自候选解决方案的个人。我们提供有关现实世界社交网络的实验,表明所提出的算法在经验运行时和启发式算法方面优于基于仿真的算法。我们还研究了社区结构对算法性能的影响。我们的实验表明,具有较高模块化的社区结构导致所提出的算法在运行时和影响方面表现更好。
translated by 谷歌翻译
信息扩散的预测在社交网络上具有良好的营销和舆论控制具有巨大实际意义。它旨在预测将可能在社交网络上发布消息的个人。一种类型的方法基于人口统计数据,复杂网络和其他先验知识,建立一个可解释的模型来模拟和预测传播过程,而另一种类型的方法是完全数据驱动的并且将节点映射到传播预测的潜空间。 。现有的潜在空间设计和嵌入方法缺乏用户之间的干预措施。在本文中,我们提出了一种独立的不对称嵌入方法来将每个人嵌入一个潜在影响空间和多个潜在敏感空间。基于信息扩散与热扩散现象之间的相似性,在我们的模型中利用了热扩散内核,并建立了嵌入规则。此外,我们的方法捕获级联中用户组合的共同发生调节,以提高计算效果。在现实世界数据集上进行的广泛实验结果验证了我们方法的预测准确性和成本效益。
translated by 谷歌翻译
影响最大化是挖掘社交网络深入信息的关键问题,该信息旨在选择从网络中选择种子以最大程度地增加受影响的节点的数量。为了评估种子套装的影响,现有的努力提出了拟议的代理模型(转换),以较低的计算成本来代替昂贵的蒙特卡洛模拟过程。这些基于网络先验知识的替代转换从各个角度引起具有相似特征的不同搜索行为。对于特定情况,用户很难先验确定合适的转换。在本文中,我们提出了一个多种转化的进化框架,以进行影响最大化(MTEFIM),并保证了融合保证,以利用替代转换的潜在相似性和独特的优势,并避免用户手动确定最合适的转换。在MTEFIM中,将多个转换同时优化为多个任务。每个转换均分配一个进化求解器。进行了MTEFIM的三个主要组成部分:1)根据不同人群的个人(种子集)重叠程度估算转化之间的潜在关系,2)根据转变关系,将个体转移到跨种群中,3)选择最终输出种子集,包含所有代理模型知识。 MTEFIM的有效性在基准和现实世界社交网络上得到了验证。实验结果表明,与几种流行的IM特异性方法相比,MTEFIM可以有效地利用跨多个转换的潜在转移知识,以实现高度竞争性能。可以在https://github.com/xiaofangxd/mtefim上访问MTEFIM的实现。
translated by 谷歌翻译
在影响最大化(IM)的现实世界应用中,网络结构通常是未知的。因此,我们可以通过仅探索基础网络的一部分来确定最有影响力的种子节点,但对于节点查询的预算很小。由于收集节点元数据比通过查询节点调查节点之间的关系更具成本效益,我们提出了IM-Meta,这是一种端到端的解决方案,这是通过从查询和节点中检索信息的网络中IM的端到端解决方案元数据。但是,由于元数据的嘈杂性质和连通性推断的不确定性,使用这种元数据来帮助IM过程并非没有风险。为了应对这些挑战,我们制定了一个新的IM问题,旨在找到种子节点和查询节点。在IM-META中,我们开发了一种有效的方法,该方法可以迭代执行三个步骤:1)我们通过暹罗神经网络模型学习了收集的元数据和边缘之间的关系,2)我们选择了许多推断的自信边缘来构建增强的图形, 3)我们通过使用我们的拓扑感知的排名策略来最大程度地提高推断影响扩展,以确定查询的下一个节点。通过查询仅5%的节点,IM-META达到了上限性能的93%。
translated by 谷歌翻译
通常,通过比较使用不同算法获得的社区的评估度量值来评估社区检测算法。用于衡量社区质量的评估指标结合了实体的拓扑信息,例如社区内部或外部节点的连接性。但是,在比较度量值的同时,它失去了社区拓扑信息在比较过程中的直接参与。在本文中,提出了一种直接比较方法,直接比较了两种算法获得的社区的拓扑信息。质量度量是基于社区拓扑信息的直接比较而设计的。考虑到新设计的质量度量,开发了两个排名方案。研究了八种广泛使用的现实世界数据集和六种社区检测算法的拟议质量指标以及排名方案的功效。
translated by 谷歌翻译
社交媒体广泛用于当今世界。它有助于快速简便地分享信息,使其成为广告产品的良好媒介。由于其巨大的普及,社交媒体网络的影响因素提供了巨大的潜在客户群。但是,决定应该选择哪些影响因素,以便为能够产生低投资的高回报而选择哪些影响因素并不简单。在这项工作中,我们提出了一个基于代理的模型(ABM),可以模拟影响者在各种情景中广告活动的动态,并可以帮助发现最佳的影响者营销策略。我们的系统是一种基于概率的图形的模型,提供了额外的优势,可以将现实世界因素(如顾客对产品,客户行为,愿意支付,品牌的投资盖,影响因素扩散)的兴趣提供额外的优势。产品的性质被广告viz。奢侈品和非奢侈品。利用客户收购成本和转换率作为一个单位经济,我们通过改变产品的性质和客户兴趣来评估不同类型的影响因素的性能。我们的结果举例说明了影响者营销的环境依赖性,并提供了在各种情况下更好地策略的洞察力。例如,我们表明,随着产品的性质因奢侈品而异,名人的表现下降而纳米影响者的性能提高。在客户的兴趣方面,我们发现纳米影响者的表现随着客户利益的减少而下降,而名人的表现则改善。
translated by 谷歌翻译
Models for the processes by which ideas and influence propagate through a social network have been studied in a number of domains, including the diffusion of medical and technological innovations, the sudden and widespread adoption of various strategies in game-theoretic settings, and the effects of "word of mouth" in the promotion of new products. Motivated by the design of viral marketing strategies, Domingos and Richardson posed a fundamental algorithmic problem for such social network processes: if we can try to convince a subset of individuals to adopt a new product or innovation, and the goal is to trigger a large cascade of further adoptions, which set of individuals should we target?We consider this problem in several of the most widely studied models in social network analysis. The optimization problem of selecting the most influential nodes is NP-hard here. The two conference papers upon which this article is based (KDD 2003 and ICALP 2005) provide the first provable approximation guarantees for efficient algorithms. Using an The present article is an expanded version of two conference papers [51,52], which appeared in KDD 2003 and ICALP 2005, respectively.
translated by 谷歌翻译
Influence Maximization (IM) is a classical combinatorial optimization problem, which can be widely used in mobile networks, social computing, and recommendation systems. It aims at selecting a small number of users such that maximizing the influence spread across the online social network. Because of its potential commercial and academic value, there are a lot of researchers focusing on studying the IM problem from different perspectives. The main challenge comes from the NP-hardness of the IM problem and \#P-hardness of estimating the influence spread, thus traditional algorithms for overcoming them can be categorized into two classes: heuristic algorithms and approximation algorithms. However, there is no theoretical guarantee for heuristic algorithms, and the theoretical design is close to the limit. Therefore, it is almost impossible to further optimize and improve their performance. With the rapid development of artificial intelligence, the technology based on Machine Learning (ML) has achieved remarkable achievements in many fields. In view of this, in recent years, a number of new methods have emerged to solve combinatorial optimization problems by using ML-based techniques. These methods have the advantages of fast solving speed and strong generalization ability to unknown graphs, which provide a brand-new direction for solving combinatorial optimization problems. Therefore, we abandon the traditional algorithms based on iterative search and review the recent development of ML-based methods, especially Deep Reinforcement Learning, to solve the IM problem and other variants in social networks. We focus on summarizing the relevant background knowledge, basic principles, common methods, and applied research. Finally, the challenges that need to be solved urgently in future IM research are pointed out.
translated by 谷歌翻译
在线社交平台,例如Twitter,Facebook,LinkedIn和微信在过去十年中的发展非常快,并且是人们互相交流和共享信息的最有效平台之一。由于“口口相传”的效果,信息通常可以在这些社交媒体平台上迅速传播。因此,重要的是研究推动信息扩散的机制并量化信息传播的后果。许多努力都集中在这个问题上,以帮助我们更好地理解并在病毒营销和广告中实现更高的性能。另一方面,在过去的几年中,神经网络的发展蓬勃发展,导致大量的图表学习(GRL)模型。与传统模型相比,GRL方法通常被证明更有效。在本文中,我们对现有作品进行了全面的审查,该综述使用GRL方法用于普及预测问题,并根据其主要使用的模型和技术将相关文献分为两个大类:基于嵌入的方法和深度学习方法。深度学习方法进一步分为六个小类:卷积神经网络,图形卷积网络,图形注意力网络,图形神经网络,复发性神经网络和增强学习。我们比较这些不同模型的性能,并讨论它们的优势和局限性。最后,我们概述了受欢迎程度预测问题的挑战和未来机会。
translated by 谷歌翻译
Nature-inspired optimization Algorithms (NIOAs) are nowadays a popular choice for community detection in social networks. Community detection problem in social network is treated as optimization problem, where the objective is to either maximize the connection within the community or minimize connections between the communities. To apply NIOAs, either of the two, or both objectives are explored. Since NIOAs mostly exploit randomness in their strategies, it is necessary to analyze their performance for specific applications. In this paper, NIOAs are analyzed on the community detection problem. A direct comparison approach is followed to perform pairwise comparison of NIOAs. The performance is measured in terms of five scores designed based on prasatul matrix and also with average isolability. Three widely used real-world social networks and four NIOAs are considered for analyzing the quality of communities generated by NIOAs.
translated by 谷歌翻译
将图形扩散现象的来源定位,例如错误信息传播,是一项重要但极具挑战性的任务。现有的源本地化模型通常在很大程度上取决于手工制作的规则。不幸的是,许多应用程序的图扩散过程的很大一部分仍然是人类未知的,因此拥有自动学习此类基础规则的表达模型很重要。本文旨在建立一个可逆图扩散模型的通用框架,用于在图上源定位,即可逆有效性感知图扩散(IVGD),以应对主要挑战,包括1)难以利用图形扩散模型中的知识来建模其反相反过程以端到端的方式,2)难以确保推断来源的有效性,3)源推理的效率和可扩展性。具体而言,首先,为了反向推断图形扩散源,我们提出了图形残差方案,以使现有的图形扩散模型具有理论保证。其次,我们开发了一种新颖的错误补偿机制,该机制学会抵消推断来源的错误。最后,为了确保推断资源的有效性,通过灵活地通过使用展开的优化技术来灵活地编码约束来,已经设计了一组新的有效性层层将推断为可行区域的源。提出了一种线性化技术来增强我们提出的层的效率。理论上证明了所提出的IVGD的收敛性。对九个现实世界数据集进行的广泛实验表明,我们提出的IVGD的表现明显优于最先进的比较方法。我们已经在https://github.com/xianggebenben/ivgd上发布了代码。
translated by 谷歌翻译
由于其在线社交网络上的广泛应用,影响力最大化(IM)在过去几十年中引起了广泛关注。当前的IM研究缺乏对种子如何产生影响效应的人类理解的解释,从而降低了现有解决方案的可信度,尽管它们适用。由于IM的复杂性,目前的大多数研究都集中在估计一阶扩散能力上,并且经常考虑从不同种子分散的流量之间的相互作用。这项研究使用SOBOL指数,这是基于方差的灵敏度分析的基石,可以分解对单个种子及其相互作用的影响效果。 SOBOL指数是针对IM上下文量身定制的,通过将种子选择作为二进制变量进行建模。这种说明方法普遍适用于所有网络类型,IM技术和扩散模型。基于解释方法,提出了一个称为Sobolim的一般框架,以通过过度选择节点,然后是消除策略来提高IM研究的性能。关于合成和现实世界图的实验表明,对影响效应的解释可以可靠地识别各种网络和IM方法之间种子之间的关键高阶相互作用。在经验上,Sobolim在有效性和效率上具有优势。
translated by 谷歌翻译
长期联系,桥梁不同社区的社会关系被广泛认为在社会网络中传播新颖信息中发挥关键作用。然而,一些现有的网络理论和预测模型表明,长圆圈可能会迅速溶解或最终变得多余,从而提出质疑长期长期的长期值。我们对现实世界动态网络的实证分析表明,与这种推理相反,长期关系比其他社会关系更有可能持续存在,而且它们中的许多人在不被嵌入在当地网络而不嵌入社会桥梁时不断起作用。使用新颖的成本效益分析模型与机器学习相结合,我们表明长期关系是非常有益的,这本能地激励人们花费额外的努力来维护它们。这部分解释了为什么长的关系比许多现有理论和模型所建议的更持久性。总体而言,我们的研究表明,需要促进长期关系的社会干预的必要性,例如混合各种背景的人。
translated by 谷歌翻译
图扩散问题,例如谣言,计算机病毒或智能电网故障的传播是无处不在的和社会的。因此,根据当前的图扩散观测值鉴定扩散源通常至关重要。尽管在实践中具有巨大的必要性和意义,但作为图扩散的逆问题,源定位是极具挑战性的,因为它的规模不足:不同的来源可能导致相同的图形扩散模式。与大多数传统的来源本地化方法不同,本文着重于概率方式,以说明不同候选来源的不确定性。这样的努力需要克服挑战,包括1)很难量化图形扩散源定位的不确定性; 2)图形扩散源的复杂模式很难被概率地表征; 3)很难强加任何潜在的扩散模式下的概括。为了解决上述挑战,本文提出了一个通用框架:用于在任意扩散模式下定位扩散源的源定位变异自动编码器(SL-VAE)。特别是,我们提出了一个概率模型,该模型利用正向扩散估计模型以及深生成模型来近似扩散源分布,以量化不确定性。 SL-VAE进一步利用了对源观察对的先验知识来表征通过学识渊博的生成性先验的扩散源的复杂模式。最后,一个集成正向扩散估计模型的统一目标被得出以强制执行模型以在任意扩散模式下概括。在7个现实世界数据集上进行了广泛的实验,以证明SL-VAE在重建扩散源的优势通过在AUC分数中平均20%来重建扩散源。
translated by 谷歌翻译
在社交网络中找到有影响力的用户是一个基本问题,具有许多可能的应用程序。将社交网络视为图形,可以通过位于网络中给定数量的跳数内的邻居的数量来测量一组用户的影响,其中每个跳标标记了影响扩散的步骤。在本文中,我们将IM的问题减少到预算受限的D-Hop主导集合问题(KDDSP)。我们提出了一个统一的机器学习(ML)框架,FastCover,通过以无人监督的方式学习高效的贪婪策略来解决KDDSP。作为框架的一个关键组成部分,我们设计了一种新颖的图形神经网络(GNN)架构,图反转关注网络(GRAT),其捕获邻居之间的扩散过程。与用于组合优化问题的大多数启发式算法和并发ML框架不同,FastCover确定从GNN的一个正向传播的节点的分数确定整个种子集,并且在图形大小中具有时间复杂性准线性。综合图和现实世界社交网络的实验表明,FastCover通过并发算法呈现的更好或相当的质量来找到解决方案,同时实现超过1000x的加速。
translated by 谷歌翻译
Analyzing the behavior of complex interdependent networks requires complete information about the network topology and the interdependent links across networks. For many applications such as critical infrastructure systems, understanding network interdependencies is crucial to anticipate cascading failures and plan for disruptions. However, data on the topology of individual networks are often publicly unavailable due to privacy and security concerns. Additionally, interdependent links are often only revealed in the aftermath of a disruption as a result of cascading failures. We propose a scalable nonparametric Bayesian approach to reconstruct the topology of interdependent infrastructure networks from observations of cascading failures. Metropolis-Hastings algorithm coupled with the infrastructure-dependent proposal are employed to increase the efficiency of sampling possible graphs. Results of reconstructing a synthetic system of interdependent infrastructure networks demonstrate that the proposed approach outperforms existing methods in both accuracy and computational time. We further apply this approach to reconstruct the topology of one synthetic and two real-world systems of interdependent infrastructure networks, including gas-power-water networks in Shelby County, TN, USA, and an interdependent system of power-water networks in Italy, to demonstrate the general applicability of the approach.
translated by 谷歌翻译