由于众多公司和组织在今天比比皆是,因此从众多公司和组织中选择一个是一项艰巨而繁琐的任务。尽管有许多可用的度量标准对公司进行排名,但是对于考虑了公司员工意见的不同方面的广义度量标准存在固有的需求。在这项工作中,我们的目标是通过研究公司的可靠员工评论来生成基于方面情感的嵌入来克服上述问题。我们从着名的网站Glassdoor.comand创建了公司评论的综合数据集,采用了一种新颖的集合方法来执行方面级别的情感分析。虽然已经针对电影,音乐等主题的评论进行了相关的工作,但这项工作是第一次。我们还提供了整理嵌入的一些见解,从而帮助用户更好地了解他们的选择,以及选择使用自定义偏好的公司。
translated by 谷歌翻译
中文发音系统提供了两种与其他语言区别开来的特征:深度音素拼写和语调变异。我们是第一个认为这两个重要属性可以在中国情感分析中发挥重要作用的人。特别地,我们提出了两种有效的特征来编码语音信息。接下来,我们使用强化网络开发用于情感分析(DISA)网络的DisambiguateIntonation。它用作每个汉字(拼音)的消除语调。因此,学习了中文的精确语音表示。此外,我们还将语音特征与文本和视觉特征融合在一起,以模仿人类阅读和理解中文文本的方式。对五种不同的中国情感分析数据集的实验结果表明,语音特征的包含显着且一致地改善了文本和视觉表征的表现,并且超越了最先进的中文字符表示。
translated by 谷歌翻译
本文提出了一个发现,即实体的长度遵循无标度幂律分布。实体的概念在此广泛地包括在自然语言处理和相关领域中被充分研究的命名实体,实体提及,时间表达和特定于域的实体。实体长度中的幂律分布具有定义均值和有限方差,并具有无标度属性。我们通过传播中的利用原则和优惠机制来解释实体长度中的幂律现象。
translated by 谷歌翻译
对话中的情感检测是许多应用程序的必要步骤,包括对聊天历史,社交媒体线程,辩论,论证挖掘,在实时对话中理解消费者反馈等方面的意见挖掘。目前,系统不会通过调整来单独处理对话中的各方对每个话语的发言者。在本文中,我们描述了一种基于递归神经网络的新方法,该方法在整个会话期间保持各个党派状态的跟踪,并使用该信息进行情绪分类。我们的模型在两个不同的数据集上显着优于theart的状态。
translated by 谷歌翻译
大多数先前的研究将命名实体提取和分类视为端到端任务。我们认为应该分别解决这两个子任务。实体提取处于句法分析的层面,实体分类处于语义分析的层面。根据NoamChomsky的“Syntactic Structures”,第93-94页(Chomsky,1957),语法没有出现在语义上,语义也不会影响语法。我们分析了两个标记数据集的命名实体的特征,发现不常见的单词可以区分命名实体和普通文本;其中不常见的词是几乎不出现在普通文本中的词,而且它们主要是正确的名词。实验验证了词法和句法特征在实体提取方面实现了最先进的性能,并且语义特征在我们的模型和最先进的基线中都没有进一步提高提取性能。根据乔姆斯基的观点,我们还解释了其他作品中的句法语法和语义分析的失败。
translated by 谷歌翻译
对话中的情感识别是一项具有挑战性的人工智能(AI)任务。最近,它因其在许多有趣的AI任务中的潜在应用而受到欢迎,例如移情对话生成,用户行为理解等。据我们所知,有多模式多方会话数据集可用,其中包含两个以上的发言者对话。在这项工作中,我们提出了MultimodalEmotionLines数据集(MELD),我们通过增强和扩展以前引入的EmotionLines数据集来创建它。 MELD包含来自1433个Friends TV系列对话的13,708个话语。 MELD优于其他对话情感识别数据集SEMAINE和IEMOCAP,因为它包含多方对话,MELD中的话语数量几乎是两个数据集的两倍。 MELD中的每个话语都与情感和情感标签相关联。 MELD中的话语是多模式的,包括音频和视觉模态以及文本。我们还解决了EmotionLines中的几个短期问题,并提出了一个强大的多模态基线。基线结果表明,语境和多模态信息在对话中的情感识别中起着重要作用。
translated by 谷歌翻译
在这项工作中,我们专注于有效地利用和整合来自概念层面和词汇层面的信息,通过将概念和文字投影到较低维空间,同时保留最关键的语义。在舆论理解系统的广泛背景下,我们研究了融合嵌入在若干核心NLP任务中的使用:命名实体检测和分类,自动语音识别重新排名和有针对性的情感分析。
translated by 谷歌翻译
We compile baselines, along with dataset split, for multimodal sentiment analysis. In this paper, we explore three different deep-learning based architectures for multimodal sentiment classification, each improving upon the previous. Further, we evaluate these architectures with multiple datasets with fixed train/test partition. We also discuss some major issues, frequently ignored in mul-timodal sentiment analysis research, e.g., role of speaker-exclusive models, importance of different modalities, and generalizability. This framework illustrates the different facets of analysis to be considered while performing multimodal sentiment analysis and, hence, serves as a new benchmark for future research in this emerging field.
translated by 谷歌翻译
随着意见挖掘技术的进步,公众情绪已成为股市预测的关键因素。然而,市场参与者的行为如何受到公众情绪的影响很少被讨论。因此,在公共情绪中利用分配问题几乎没有什么进展,这在可信和可解释的道路上是首选。为了解决从社会媒体分析公众情绪的问题,我们建议将公众情绪形式化为市场观点,因为市场观点可以融入现代投资组合理论。在我们的框架中,最佳市场观点将通过贝叶斯资产分配模型最大化每个时期的回报。我们训练两个神经模型来生成市场视图,并在其他流行的资产配置策略上对模型性能进行基准测试。我们的实验结果表明,市场观点的形式化显着提高了模拟投资组合在特定风险水平下的盈利能力(每年5%至10%)。
translated by 谷歌翻译
Semi-supervised learning is attracting increasing attention due to the fact that datasets of many domains lack enough labeled data. Variational Auto-Encoder (VAE), in particular, has demonstrated the benefits of semi-supervised learning. The majority of existing semi-supervised VAEs utilize a classifier to exploit label information, where the parameters of the classifier are introduced to the VAE. Given the limited labeled data, learning the parameters for the classifiers may not be an optimal solution for exploiting label information. Therefore, in this paper, we develop a novel approach for semi-supervised VAE without classifier. Specifically, we propose a new model called Semi-supervised Disentangled VAE (SDVAE), which encodes the input data into disentangled representation and non-interpretable representation, then the category information is directly utilized to regularize the disentangled representation via the equality constraint. To further enhance the feature learning ability of the proposed VAE, we incorporate reinforcement learning to relieve the lack of data. The dynamic framework is capable of dealing with both image and text data with its corresponding encoder and decoder networks. Extensive experiments on image and text datasets demonstrate the effectiveness of the proposed framework.
translated by 谷歌翻译