在20世纪下半叶,议会允许广播公司传播广播,并最终对选定委员会的辩论和会议进行电视报道。最近,为了进一步提高透明度和公民参与,英国议会开始发布这些辩论和会议本身的视频,并在发生辩论的细节上发布了辩论的细节。在本文中,我们试图通过使用超过两年的Google Analytics(分析)数据来表征人们如何参与议会辩论的视频数据。我们分析参与模式 - 它们如何登陆特定视频?他们如何听到此视频,即导致用户单击视频的(HTTP)推荐程序网站是什么?一旦用户降落在视频上,他们将如何互动?播放视频多长时间?下一个目的地是什么?等等。回答这些问题是了解人们为什么以及如何使用议会视频的重要第一步,因此,应如何适应和个性化视频交付平台满足该国公民的需求。从An,Kwak和Jansen(2017)汲取灵感,我们采用了非负矩阵分解(NMF)(Lee and Seung,1999)在视频视图矩阵上识别不同的用户原型,并识别原型。对我们发现的原型进行更深入的研究表明,它们主要是由它们降落在视频页面上的方式:搜索(即通过搜索引擎),推荐(即,来自其他议会网站),直接(即通过直接的)链接,嵌入在另一个网站上),社交(即,通过Facebook或Twitter等社交平台)等。
translated by 谷歌翻译
这项研究使用Tiktok(n = 8,173)来研究最近黑人生活问题运动中抗议范式的短形式视频平台。采用计算机介导的视觉分析,计算机视觉,以确定多媒体内容中的四个视觉抗议(RIOT,COMPRANTATION,COMPROTATION,COMPAINCALE和DEBATE)的存在。描述性统计和t检验的结果表明,在Tiktok上很少发现三个合法化框架 - 暴动,对抗和奇观 - 而辩论框架(赋予边缘化社区)的辩论框架占据了公共领域的主导。但是,尽管三个合法化框架获得了较低的社交媒体可见性,但按照观点,喜欢,分享,追随者和持续时间衡量,但合法化的要素,例如辩论框架,少数群体身份和非正式来源,通常不受Tiktok受众的青睐。 。这项研究得出的结论是,尽管简短的视频平台可能会挑战内容创作者方面的抗议范式,但社交媒体可见性衡量的受众偏爱仍可能与抗议范式相关。
translated by 谷歌翻译
短片已成为年轻一代使用的领先媒体之一,以便在线表达自己,从而塑造在线文化中的驱动力。在这方面,Tiktok已成为往往首先发布病毒视频的平台。在本文中,我们研究了在Tiktok上发布的短片内容有助于他们的病毒。我们应用一种混合方法方法来开发码本并识别重要的病毒功能。我们这样做是如此vis- \'a-vis三个研究假设;即:1)视频内容,2)Tiktok的推荐算法,以及3)视频创建者的普及有助于病毒性。我们收集并标记400个Tiktok视频和火车分类器的数据集,以帮助我们确定最多影响景象的功能。虽然追随者的数量是最强大的预测因子,但特写和中射尺度也起到重要作用。因此视频的寿命,文本的存在以及观点。我们的研究突出了与非病毒Tiktok视频区分病毒的特征,奠定了制定额外方法来创建更多聘用的在线内容,并主动地确定可能达到大量受众的风险内容。
translated by 谷歌翻译
在过去的十年中,视频通信一直在迅速增加,YouTube提供了一种媒介,用户可以在其中发布,发现,共享和反应视频。引用研究文章的视频数量也有所增加,尤其是因为学术会议需要进行视频提交已变得相对普遍。但是,研究文章与YouTube视频之间的关系尚不清楚,本文的目的是解决此问题。我们使用YouTube视频创建了新的数据集,并在各种在线平台上提到了研究文章。我们发现,视频中引用的大多数文章都与医学和生物化学有关。我们通过统计技术和可视化分析了这些数据集,并建立了机器学习模型,以预测(1)视频中是否引用了研究文章,(2)视频中引用的研究文章是否达到了一定程度的知名度,以及(3)引用研究文章的视频是否流行。最佳模型的F1得分在80%至94%之间。根据我们的结果,在更多推文和新闻报道中提到的研究文章有更高的机会接收视频引用。我们还发现,视频观点对于预测引用和增加研究文章的普及和公众参与科学很重要。
translated by 谷歌翻译
在过去的几十年里,互联网用户在网上举办了实时事件并与现场,互动受众分享经历的日益增长的需求。像抽搐一样的在线流媒体服务吸引了数百万用户来流并窥视。关于抽搐对流动性普及的预测有很少的研究。在本文中,我们看起来可能有助于娱乐的潜在因素。在4周时段期间,通过使用Twitch的API一致的跟踪收集娱乐数据。收集每个用户的流信息,例如当前观看者和追随者的数量,流类型等。从结果中,我们发现流媒体会话的频率,内容的类型和流的长度是确定在会话期间可以获得多少观众和订户的垃圾媒体。
translated by 谷歌翻译
社交媒体的回声室是一个重要的问题,可以引起许多负面后果,最近影响对Covid-19的响应。回声室促进病毒的阴谋理论,发现与疫苗犹豫不决,较少遵守面具授权,以及社会疏散的实践。此外,回声室的问题与政治极化等其他相关问题相连,以及误导的传播。回声室被定义为用户网络,用户只与支持其预先存在的信仰和意见的意见相互作用,并且他们排除和诋毁其他观点。本调查旨在从社会计算的角度检查社交媒体上的回声室现象,并为可能的解决方案提供蓝图。我们调查了相关文献,了解回声室的属性以及它们如何影响个人和社会。此外,我们展示了算法和心理的机制,这导致了回声室的形成。这些机制可以以两种形式表现出:(1)社交媒体推荐系统的偏见和(2)内部偏见,如确认偏见和精梳性。虽然减轻内部偏见是非常挑战的,但努力消除推荐系统的偏见。这些推荐系统利用我们自己的偏见来个性化内容建议,以使我们参与其中才能观看更多广告。因此,我们进一步研究了回声室检测和预防的不同计算方法,主要基于推荐系统。
translated by 谷歌翻译
少数群体一直在使用社交媒体来组织社会运动,从而产生深远的社会影响。黑人生活问题(BLM)和停止亚洲仇恨(SAH)是两个成功的社会运动,在Twitter上蔓延开来,促进了抗议活动和活动,反对种族主义,并提高公众对少数群体面临的其他社会挑战的认识。但是,以前的研究主要对与用户的推文或访谈进行了定性分析,这些推文或访谈可能无法全面和有效地代表所有推文。很少有研究以严格,量化和以数据为中心的方法探讨了BLM和SAH对话中的Twitter主题。因此,在这项研究中,我们采用了一种混合方法来全面分析BLM和SAH Twitter主题。我们实施了(1)潜在的DIRICHLET分配模型,以了解顶级高级单词和主题以及(2)开放编码分析,以确定整个推文中的特定主题。我们通过#BlackLivesMatter和#Stopasianhate主题标签收集了超过一百万条推文,并比较了它们的主题。我们的发现表明,这些推文在深度上讨论了各种有影响力的话题,社会正义,社会运动和情感情感都是两种运动的共同主题,尽管每个运动都有独特的子主题。我们的研究尤其是社交媒体平台上的社会运动的主题分析,以及有关AI,伦理和社会相互作用的文献。
translated by 谷歌翻译
电报是全球最常用的即时消息传递应用之一。其成功之所以在于提供高隐私保护和社交网络,如频道 - 虚拟房间,其中只有管理员可以发布和广播到所有订户的消息。然而,这些相同的功能促成了边界活动的出现,并且与在线社交网络一样常见,假账户的沉重存在。通过引入频道的验证和诈骗标记,电报开始解决这些问题。不幸的是,问题远未解决。在这项工作中,我们通过收集35,382个不同的渠道和超过130,000,000消息来进行大规模分析电报。我们研究电报标记为验证或骗局的渠道,突出显示类比和差异。然后,我们转到未标记的频道。在这里,我们发现一些臭名昭着的活动也存在于虚拟网络的隐私保存服务,例如梳理,共享非法成人和版权保护内容。此外,我们还确定并分析了另外两种类型的渠道:克隆和假货。克隆是发布另一个频道确切内容的频道,以获得订阅者和促进服务。相反,假货是试图冒充名人或知名服务的渠道。即使是最先进的用户甚至很难确定。要自动检测假频道,我们提出了一种机器学习模型,可以以86%的准确性识别它们。最后,我们研究了Sabmyk,这是一种阴谋理论,即利用假货和克隆在达到超过1000万用户的平台上迅速传播。
translated by 谷歌翻译
假新闻的迅速增加,这对社会造成重大损害,触发了许多假新闻相关研究,包括开发假新闻检测和事实验证技术。这些研究的资源主要是从Web数据中获取的公共数据集。我们通过三个观点调查了与假新闻研究相关的118个数据集:(1)假新闻检测,(2)事实验证,(3)其他任务;例如,假新闻和讽刺检测分析。我们还详细描述了他们的利用任务及其特征。最后,我们突出了假新闻数据集建设中的挑战以及解决这些挑战的一些研究机会。我们的调查通过帮助研究人员找到合适的数据集来促进假新闻研究,而无需重新发明轮子,从而提高了深度的假新闻研究。
translated by 谷歌翻译
在公共危机时期,寻求信息对于人们的自我保健和福祉至关重要。广泛的研究调查了经验理解和技术解决方案,以促进受影响地区的家庭公民寻求信息。但是,建立有限的知识是为了支持需要在其东道国发生危机的国际移民。当前的论文对居住在日本和美国(n = 14)的两名中国移民(n = 14)进行了访谈研究。参与者反思了他们在共同大流行期间寻求经验的信息。反思补充了两周的自我追踪,参与者保持了相关信息寻求实践的记录。我们的数据表明,参与者经常绕开语言绕道,或访问普通话资源以获取有关其东道国疫情爆发的信息。他们还进行了战略性利用普通话信息,以进行选择性阅读,交叉检查以及对日语或英语的共同信息的上下文化解释。尽管这种做法增强了参与者对共同相关信息收集和感官的有效性,但他们有时会通过有时认识的方式使人们处于不利地位。此外,参与者缺乏对审查以移民为导向的信息的认识或偏爱,尽管该信息可用,这些信息是由东道国公共当局发布的。在这些发现的基础上,我们讨论了改善国际移民在非本地语言和文化环境中寻求共同相关信息的解决方案。我们主张包容性危机基础设施,这些基础设施将吸引以当地语言流利程度,信息素养和利用公共服务的经验的不同水平的人们。
translated by 谷歌翻译
We study the problem of profiling news media on the Web with respect to their factuality of reporting and bias. This is an important but under-studied problem related to disinformation and "fake news" detection, but it addresses the issue at a coarser granularity compared to looking at an individual article or an individual claim. This is useful as it allows to profile entire media outlets in advance. Unlike previous work, which has focused primarily on text (e.g.,~on the text of the articles published by the target website, or on the textual description in their social media profiles or in Wikipedia), here our main focus is on modeling the similarity between media outlets based on the overlap of their audience. This is motivated by homophily considerations, i.e.,~the tendency of people to have connections to people with similar interests, which we extend to media, hypothesizing that similar types of media would be read by similar kinds of users. In particular, we propose GREENER (GRaph nEural nEtwork for News mEdia pRofiling), a model that builds a graph of inter-media connections based on their audience overlap, and then uses graph neural networks to represent each medium. We find that such representations are quite useful for predicting the factuality and the bias of news media outlets, yielding improvements over state-of-the-art results reported on two datasets. When augmented with conventionally used representations obtained from news articles, Twitter, YouTube, Facebook, and Wikipedia, prediction accuracy is found to improve by 2.5-27 macro-F1 points for the two tasks.
translated by 谷歌翻译
在网上进行的虚假信息广泛传播,包括错误信息和虚假信息已成为我们高度数字化和全球化社会的主要问题。已经进行了大量研究来更好地理解在线虚假信息的不同方面,例如不同参与者的行为和传播模式,以及使用技术和社会技术手段更好地检测和预防此类信息。在线检测和揭穿虚假信息的一种主要方法是使用人类事实检查器,这些事实检查器可以通过自动化工具来帮助。尽管进行了大量研究,但我们注意到缺乏描述虚假信息和事实检查的复杂生态系统的概念模型存在很大的差距。在本文中,我们报告了此类生态系统的第一批图形模型,这些模型重点介绍了在多种情况下在线的虚假信息,包括传统媒体和用户生成的内容。拟议的模型涵盖了广泛的实体类型和关系,可以成为研究人员和从业者在线研究虚假信息以及事实检查的效果的新工具。
translated by 谷歌翻译
在过去几年中,社交媒体上传播的错误消息激增,并导致了现实世界中的多种威胁。尽管有关于特定领域的虚假新闻(例如政治或医疗保健)的研究,但比较跨领域的虚假新闻几乎没有工作。在本文中,我们调查了2009年至2019年中国最大的Twitter式社交媒体平台的微博上的九个领域的虚假新闻。新收集的数据包含44,728个帖子,由40,215个用户发布,并重新发布了。 340万次。基于多域数据集的分布和传播,我们观察到,在诸如健康和医学之类的日常生活的领域中,虚假的消息比政治等其他领域的帖子更有效,但有效地传播的帖子较少,而政治虚假新闻具有最有效的扩散能力。关于微博上广泛散布的虚假新闻帖子与某些类型的用户(按性别,年龄等。此外,这些帖子都引起了重新播放的强烈情绪,并随着False-News启动器的积极参与而进一步扩散。我们的发现有可能在可疑新闻发现,真实性预测以及显示和解释中帮助设计错误的新闻检测系统。微博上的发现与现有作品的发现表明了细微的模式,这表明需要对来自不同平台,国家或语言的数据进行更多研究,以解决全球错误新闻。代码和新的匿名数据集可在https://github.com/ictmcg/characterizing-weibo-multi-domain-false-news上找到。
translated by 谷歌翻译
在这项研究中,我们从新的全面角度处理了疫苗辩论的复杂性。为了关注意大利环境,我们研究了两个来源在2016 - 2021年期间产生的所有在线信息,这些信息符合误解的声誉,而没有声誉。尽管可靠的消息来源可以依靠更大的新闻编辑室,并涵盖更多的新闻,但对相应时间序列的转移熵分析表明,前者并不总是在疫苗主题上向后者占据主导地位。的确,流行前时期认为,即使是因果关系,错误的信息也使自己成为过程的领导者,并且比可靠来源的新闻更大程度地获得了用户参与。尽管在Covid-19爆发期间填补了这些信息差距,但可靠来源作为信息生态系统的驱动力的新发现的主要作用仅部分对减少用户对疫苗的错误信息的参与而产生了有益的效果。我们的结果确实表明,除了疫苗接种的有效性外,可靠的来源从未充分反对反vax的叙述,特别是在大大阶段的时期,因此有助于加剧科学否认和对阴谋论的信仰。然而,与此同时,他们确认了刻意提出令人信服的反叙事的错误信息传播的功效。确实,与其他两极分化的论点(例如安全问题,法律问题和疫苗业务)相比,疫苗接种的有效性是在大流行期间通过错误信息讨论的最不吸引人的话题。通过强调制度和主流交流的优势和劣势,我们的发现可能是改善和更好地针对疫苗错误信息的推动运动的宝贵资产。
translated by 谷歌翻译
社交媒体营销在向广泛的受众群体推广品牌和产品价值方面起着至关重要的作用。为了提高其广告收入,诸如Facebook广告之类的全球媒体购买平台不断减少品牌有机帖子的覆盖范围,推动品牌在付费媒体广告上花费更多。为了有效地运行有机和付费社交媒体营销,有必要了解受众,调整内容以适合其兴趣和在线行为,这是不可能大规模手动进行的。同时,各种人格类型分类方案(例如Myers-Briggs人格类型指标)使得通过以统一和结构化的方式对受众行为进行分类,可以在更广泛的范围内揭示人格特质和用户内容偏好之间的依赖性。研究界尚待深入研究这个问题,而到目前为止,尚未广泛使用和全面评估,而不同人格特征对内容建议准确性的影响水平尚未得到广泛的利用和全面评估。具体而言,在这项工作中,我们通过应用一种新型人格驱动的多视图内容推荐系统,研究人格特征对内容推荐模型的影响,称为人格内容营销推荐引擎或Persic。我们的实验结果和现实世界案例研究不仅表明Persic执行有效的人格驱动的多视图内容建议,而且还允许采用可行的数字广告策略建议,当部署时能够提高数字广告效率超过420 %与原始的人类指导方法相比。
translated by 谷歌翻译
在线社交网络(OSN)有助于访问各种数据,使研究人员能够分析用户的行为并开发用户行为分析模型。这些模型在很大程度上依赖于观察到的数据,这些数据通常由于参与不平等而产生偏差。这种不平等由三组在线用户组成:潜伏者 - 仅消耗内容的用户,招聘者 - 对内容创建的用户和贡献者很少贡献 - 负责创建大多数在线内容的用户。在解释人口水平的利益或情感的同时,未能考虑所有群体的贡献,可能会产生偏见的结果。为了减少贡献者引起的偏见,在这项工作中,我们专注于强调参与者在观察到的数据中的贡献,因为与潜伏者相比,它们更有可能贡献,与贡献者相比,它们的人口更大。这些用户行为分析的第一步是找到他们接触但没有互动的主题。为此,我们提出了一个新颖的框架,有助于识别这些用户并估算其主题曝光。暴露估计机制是通过合并来自类似贡献者的行为模式以及用户的人口统计学和个人资料信息来建模的。
translated by 谷歌翻译
我们研究了使用社交媒体数据预测加密货币未来表现的问题。我们提出了一个新模型,以根据与社交媒体帖子的互动来衡量用户与社交媒体讨论的主题的参与。该模型克服了以前的卷和基于情感的方法的局限性。我们使用此模型来估计2019年至2021年之间使用来自加密货币存在的第一个月的数据在2019年至2021年之间创建的48个加密货币的参与系数。我们发现加密货币的未来回报取决于参与系数。参与系数太低或太高的加密货币的回报较低。低参与系数表明缺乏兴趣,而高参与系数信号是人工活动,这可能来自自动化的bot。我们测量了加密货币的机器人柱数量,并发现通常,具有更多机器人柱的加密货币的未来回报较低。尽管未来的回报取决于机器人活动和参与系数,但依赖性对于参与系数最强,尤其是对于短期收益。我们显示,以超过固定阈值的参与系数选择加密货币的简单投资策略在几个月的固定时间内表现良好。
translated by 谷歌翻译
Social media has been one of the main information consumption sources for the public, allowing people to seek and spread information more quickly and easily. However, the rise of various social media platforms also enables the proliferation of online misinformation. In particular, misinformation in the health domain has significant impacts on our society such as the COVID-19 infodemic. Therefore, health misinformation in social media has become an emerging research direction that attracts increasing attention from researchers of different disciplines. Compared to misinformation in other domains, the key differences of health misinformation include the potential of causing actual harm to humans' bodies and even lives, the hardness to identify for normal people, and the deep connection with medical science. In addition, health misinformation on social media has distinct characteristics from conventional channels such as television on multiple dimensions including the generation, dissemination, and consumption paradigms. Because of the uniqueness and importance of combating health misinformation in social media, we conduct this survey to further facilitate interdisciplinary research on this problem. In this survey, we present a comprehensive review of existing research about online health misinformation in different disciplines. Furthermore, we also systematically organize the related literature from three perspectives: characterization, detection, and intervention. Lastly, we conduct a deep discussion on the pressing open issues of combating health misinformation in social media and provide future directions for multidisciplinary researchers.
translated by 谷歌翻译
近年来,在网上见证了令人反感的内容的泛滥,例如假新闻,宣传,错误信息和虚假信息。虽然最初这主要是关于文本内容,但随着时间的流逝,图像和视频越来越受欢迎,因为它们更容易消费,吸引更多的关注并比文本更广泛地传播。结果,研究人员开始利用不同的方式及其组合来解决在线多模式进攻内容。在这项研究中,我们提供了有关最新的多模式虚假信息检测的调查,该检测涵盖了各种模式组合:文本,图像,语音,视频,社交媒体网络结构和时间信息。此外,尽管有些研究集中于事实,但其他研究调查了内容的有害性。尽管虚假信息定义中的这两个组成部分(i)事实和(ii)有害性同样重要,但通常会孤立地研究它们。因此,我们主张在同一框架中考虑多种方式以及事实和有害性来解决虚假信息检测。最后,我们讨论当前的挑战和未来的研究方向
translated by 谷歌翻译
经过大量地震后,我们可以看到个人和媒体机构在社交媒体平台上发布的图像由于这些天智能手机的大规模使用而发布。这些图像可用于提供关于公共和研究群落的地震区域震荡损坏的信息,并且可能导致救援工作。本文提出了一种自动化的方法,可以在来自诸如Twitter等社交媒体平台的地震之后提取损坏的建筑图像,从而识别包含此类图像的特定用户帖子。使用传输学习和〜6500手动标记图像,我们培训了深入学习模型,以识别现场损坏的建筑物的图像。当在土耳其2020 M7.0地震发生后,在不同地区的新收购的地震图像上进行地震图像的地震图像时,训练有素的模型取得了良好的表现。此外,为了更好地了解模型如何做出决策,我们还实现了Grad-CAM方法来可视化促进决策的图像上的重要位置。
translated by 谷歌翻译