智能论文笔记

Domain-aware Self-supervised Pre-training for Label-Efficient Meme Analysis

Shivam Sharma , Mohd Khizir Siddiqui , Md. Shad Akhtar , Tanmoy Chakraborty

分类：自然语言处理 | 人工智能

2022-09-29

现有的自我监督学习策略被限制在有限的目标或主要针对单峰应用程序的通用下游任务。对于复杂性和域亲和力（例如模因分析）而言，这对命令性的多模式应用有了孤立的进展。在这里，我们介绍了两种自我监督的预训练方法，即ext-pie-net和mm-simclr（i）在预训练期间使用现成的多模式仇恨语音数据，并且（ii）执行自我 - 通过合并多个专业借口任务，有效地迎合模因分析所需的复杂多模式表示学习，从而有效地迎合了学习。我们实验不同的自我实验策略，包括可以帮助学习丰富的跨模式表示并使用流行的线性探测来评估可恨模因任务的潜在变体。拟议的解决方案通过标签有效的培训与完全监督的基线竞争，同时在梅诺特挑战的所有三个任务上明显优于他们，分别为0.18％，23.64％和0.93％的绩效增长。此外，我们通过在Harmeme任务上报告竞争性能来证明所提出的解决方案的普遍性。最后，我们通过分析特定于任务的学习，使用更少的标记培训样本来建立学习表现的质量，并争辩说，自主策略和手头下游任务的复杂性是相关的。我们的努力强调了更好的多模式自学方法的要求，涉及有效的微调和可推广性能的专业借口任务。

translated by 谷歌翻译

Predicting Hate Intensity of Twitter Conversation Threads

Qing Meng , Tharun Suresh , Roy Ka-Wei Lee , Tanmoy Chakraborty

分类：人工智能 | 自然语言处理

2022-06-16

推文是在线社交媒体中最简洁的交流形式，其中一条推文有可能制作或打破对话的话语。在线仇恨言论比以往任何时候都更容易访问，并且扼杀其传播对于社交媒体公司和用户进行友好沟通至关重要。除了最近的一条推文分类，无论导致这一点的推文线程/上下文如何，大多数研究都集中在对单个推文进行分类。遏制仇恨言论的经典方法之一是在仇恨言论邮寄后采用反应性策略。事实上的事实策略导致忽略了微妙的帖子，这些帖子并未显示出自己激发仇恨言论的潜力，但可能会在随后在帖子的答复中随后的讨论中进行预言。在本文中，我们提出了Dragnet ++，该论文旨在预测推文可以通过其未来的回复链引入的仇恨强度。它使用推文线程的语义和传播结构来最大化导致每个后续推文的仇恨强度的上下文信息。我们探索了三个公开可用的Twitter数据集 - 反种族主义包含有关社交媒体讨论在美国政治和COVID-19的背景期间关于种族主义言论的回答推文；反社会介绍了一个关于反社会行为的19000万推文的数据集；和反亚洲介绍了基于19日大流行期间的反亚洲行为的Twitter数据集。所有策划的数据集都包含Tweet线程的结构图信息。我们表明，Dragnet ++的表现大大优于所有最先进的基线。它比人相关系数的最佳基线降低了11 \％的利润率，而反种族主义数据集则在RMSE上降低了25 \％，而其他两个数据集则具有相似的性能。

translated by 谷歌翻译

Proactively Reducing the Hate Intensity of Online Posts via Hate Speech Normalization

Sarah Masud , Manjot Bedi , Mohammad Aflah Khan , Md Shad Akhtar , Tanmoy Chakraborty

分类：自然语言处理

2022-06-08

在线仇恨言论已成为小时的需求。但是，由于几种地缘政治和文化原因，对此类活动的禁令是不可行的。为了减少问题的严重性，在本文中，我们介绍了一项新颖的任务，仇恨言语归一化，旨在削弱在线帖子表现出的仇恨强度。仇恨言语归一化的意图不是支持仇恨，而是为用户提供对非讨厌的垫脚石，同时为在线平台提供更多时间来监视用户行为的任何改进。为此，我们手动策划了平行语料库 - 仇恨文本及其标准化的同行（标准化文本较不憎恨，更良性）。我们介绍了NACL，这是一个简单而有效的仇恨言语归一化模型，该模型在三个阶段运行 - 首先，它测量了原始样本的仇恨强度；其次，它标识了其中的仇恨跨度；最后，它通过解释仇恨跨度来降低仇恨强度。我们进行了广泛的实验，以通过三向评估（内在，外部和人类研究）来衡量NaCl的功效。我们观察到，NaCl优于六个基准-NACL的强度预测得分为0.1365 RMSE，在SPAN识别中获得0.622 F1分数，而82.27 BLEU和80.05的差异和80.05的困惑为归一化文本生成。我们进一步显示了NACL在其他平台上的普遍性（Reddit，Facebook，GAB）。将NaCl的交互式原型放在一起进行用户研究。此外，该工具正在WIPRO AI的真实环境中部署，这是其在线平台上处理有害内容的任务的一部分。

translated by 谷歌翻译

Counseling Summarization using Mental Health Knowledge Guided Utterance Filtering

Aseem Srivastava , Tharun Suresh , Sarah Peregrine , Lord , Md. Shad Akhtar , Tanmoy Chakraborty

分类：自然语言处理

2022-06-08

心理治疗干预技术是治疗师和患者之间的多方面对话。与一般的临床讨论不同，心理治疗的核心成分（即症状）很难区分，因此成为以后要总结的复杂问题。结构化的咨询对话可能包含有关症状，心理健康问题病史或发现患者行为的讨论。它还可能包含与临床摘要无关的讨论填充单词。我们将结构化心理治疗的这些要素称为咨询组成部分。在本文中，目的是心理健康咨询的摘要，以基于领域知识并帮助临床医生快速收集意义。在注释咨询组件的12.9k话语和每次对话的参考摘要之后，我们创建了一个新的数据集。此外，我们建议消费是一种新颖的咨询组件指导摘要模型。消费经历三个独立模块。首先，为了评估抑郁症状的存在，它使用患者健康问卷（PHQ-9）过滤了话语，而第二和第三模块旨在对咨询组件进行分类。最后，我们提出了针对特定问题的心理健康信息捕获（MHIC）评估指标，用于咨询摘要。我们的比较研究表明，我们改善了性能并产生凝聚力，语义和连贯的摘要。我们全面分析了生成的摘要，以研究心理治疗元素的捕获。摘要的人类和临床评估表明，消费会产生质量摘要。此外，心理健康专家验证了消费的临床可接受性。最后，我们讨论了现实世界中心理健康咨询摘要的独特性，并在Mathic.ai的支持下显示了其在线应用程序上的部署的证据

translated by 谷歌翻译

Nipping in the Bud: Detection, Diffusion and Mitigation of Hate Speech on Social Media

Tanmoy Chakraborty , Sarah Masud

分类：机器学习

2022-01-04

自社交媒体使用的扩散以来，仇恨言论已成为一个主要的危机。可恶的内容可以迅速传播并造成痛苦和敌意的环境。此外，可以被视为仇恨是语境的，随着时间的推移而变化。虽然在线仇恨言论减少了已经自由地参与讨论的边缘化群体的能力，但离线仇恨言论导致仇恨犯罪和暴力对抗个人和社区。仇恨言论的多方面性质及其真实影响已经激起了数据挖掘和机器学习社区的兴趣。尽管我们努力最大，但仇恨致辞仍然是研究人员和从业者的避免问题。本文介绍了阻碍建立自动化仇恨缓解系统的方法论挑战。这些挑战激发了我们在打击网络上仇恨内容的更广泛领域的工作。我们讨论了一系列拟议的解决方案，以限制仇恨言论在社交媒体上的传播。

translated by 谷歌翻译

Semi-supervised Stance Detection of Tweets Via Distant Network Supervision

Subhabrata Dutta , Samiya Caur , Soumen Chakrabarti , Tanmoy Chakraborty

分类：自然语言处理 | 机器学习

2022-01-03

通过仇恨语音检测，民意调查预测，参与预测和协调宣传检测，在社交媒体文本中检测和标记姿势强烈激励。今天的最佳神经姿势探测器需要大量的培训数据，这难以策划，鉴于社交媒体文本的快速变化和用户撰写的问题。社交网络的同性恋特性提供了强大的粗粒式用户级姿态信号。但是，发动机级姿势检测的半监督方法未能正确地利用同一性。鉴于此，我们呈现出新的半监督姿态探测器。沙子从很少有标记的推文开始。它构建了促进推文的多个深度特色视图。它还使用来自社交网络的远程监督信号，为组件学习者提供代理丢失信号。我们准备了两个新的推文数据集，其中包括来自两个人口统计数据（美国和印度）的政治上有关的236,000多次推文，以超过87,000名用户，他们的追随者 - 追随图，以及由语言学家注释的超过8,000名推文。 Sands在美国（印度）的数据集上实现了0.55（0.49）的宏观F1得分，表现出17个基线（包括沙子的变体），特别是对于少数群体立场标签和嘈杂的文本。砂岩的许多消融实验解开了文本和网络传播的姿态信号的动态。

translated by 谷歌翻译

Nice perfume. How long did you marinate in it? Multimodal Sarcasm Explanation

Poorav Desai , Tanmoy Chakraborty , Md Shad Akhtar

分类：自然语言处理

2021-12-09

讽刺是一种越来越普遍的语言现象，并且由于其主观性，缺乏背景和深刻的意见而令人挑战。在多模式设置中，讽刺通过文本和视觉实体之间的不协调传达。虽然最近接近讽刺作为分类问题，但目前尚不清楚为什么在线帖子被识别为讽刺。如果没有正确的解释，最终用户可能无法察觉潜在的讽刺意义。在本文中，我们提出了一种新的问题 - 多式联运讽刺解释（Muse） - 鉴于包含图像和标题的多模式讽刺柱，我们旨在产生自然语言解释，以揭示预期的讽刺。为此，我们开发更多，一个新的数据集，具有3510个讽刺的多模式帖子的解释。每个解释都是一种描述隐藏的讽刺的自然语言（英语）句子。我们通过采用基于多模式变换器的架构来基准更多。它包含了变压器编码器中的跨模型注意，它出席了两个模式之间的区别。随后，将基于BART的自动回归解码器用作发电机。经验结果表明，在五项评估指标上展示了各种基线（用于缪斯采用）的结果。我们还对预测进行人类评估，并获得0.4的FARISS Kappa得分，作为25个评估员之间的公平协议。

translated by 谷歌翻译

Speaker and Time-aware Joint Contextual Learning for Dialogue-act Classification in Counselling Conversations

Ganeshan Malhotra , Abdul Waheed , Aseem Srivastava , Md Shad Akhtar , Tanmoy Chakraborty

分类：自然语言处理

2021-11-12

Covid-19大流行的发作使风险的心理健康带来了。社会咨询在这种环境中取得了显着意义。与一般面向目标的对话不同，患者和治疗师之间的对话是相当明暗的，尽管谈话的目标非常明显。在这种情况下，了解患者的目的在提供治疗会话中提供有效咨询方面是必要的，同样适用于对话系统。在这项工作中，我们前进是一个小小的一步，在开发精神健康咨询的自动对话系统中。我们开发一个名为HOPE的新型数据集，为咨询谈话中的对话行为分类提供平台。我们确定此类对话的要求，并提出了12个域特定的对话法（DAC）标签。我们收集12.9k的话语从youtube上公开的咨询会话视频，用DAC标签提取他们的成绩单，清洁并注释它们。此外，我们提出了一种基于变压器的架构的Sparta，具有新颖的扬声器和时间感知的语境学习，用于对话行动分类。我们的评价显示了若干基线的令人信服的表现，实现了最先进的希望。我们还通过对Sparta进行广泛的实证和定性分析来补充我们的实验。

translated by 谷歌翻译

Discovering Emotion and Reasoning its Flip in Multi-Party Conversations using Masked Memory Network and Transformer

Shivani Kumar , Anubhav Shrimal , Md Shad Akhtar , Tanmoy Chakraborty

分类：自然语言处理

2021-03-23

在多方对话中有效地发现发言者的情绪状态是设计人类类似的会话代理商的重要性。在谈话期间，扬声器的认知状态通常由于某些过去的话语而改变，这可能导致他们的情绪状态的翻转。因此，在对话期间发现扬声器情感翻转背后的原因（触发）对于解释个人话语的情感标签至关重要。在本文中，除了解决对话中的情感认可的任务（ERC），我们介绍了一种新的任务 - 情感 - 翻转推理（EFR），旨在识别过去的话语，这引发了一个人的情绪状态以在一定时间翻转。我们提出了一个掩蔽的存储器网络来解决前者和基于变换器的网络的后一种任务。为此，我们考虑融合的基准情感识别数据集，用于ERC任务的多方对话，并使用EFR的新地基标签增强它。与五个最先进的模型进行了广泛的比较，表明我们对两个任务的模型的表现。我们进一步提出了轶事证据和定性和定量误差分析，以支持与基线相比模型的优势。

translated by 谷歌翻译

A Survey on Multimodal Disinformation Detection

Firoj Alam , Stefano Cresci , Tanmoy Chakraborty , Fabrizio Silvestri , Dimiter Dimitrov , Giovanni Da San Martino , Shaden Shaar , Hamed Firooz , Preslav Nakov

分类：人工智能 | 自然语言处理 | 机器学习

2021-03-13

近年来，在网上见证了令人反感的内容的泛滥，例如假新闻，宣传，错误信息和虚假信息。虽然最初这主要是关于文本内容，但随着时间的流逝，图像和视频越来越受欢迎，因为它们更容易消费，吸引更多的关注并比文本更广泛地传播。结果，研究人员开始利用不同的方式及其组合来解决在线多模式进攻内容。在这项研究中，我们提供了有关最新的多模式虚假信息检测的调查，该检测涵盖了各种模式组合：文本，图像，语音，视频，社交媒体网络结构和时间信息。此外，尽管有些研究集中于事实，但其他研究调查了内容的有害性。尽管虚假信息定义中的这两个组成部分（i）事实和（ii）有害性同样重要，但通常会孤立地研究它们。因此，我们主张在同一框架中考虑多种方式以及事实和有害性来解决虚假信息检测。最后，我们讨论当前的挑战和未来的研究方向

translated by 谷歌翻译