会话代理商在学术界(在研究方面)和商业方面(在应用方面)都开始崛起。本文研究了使用神经网络生成模型构建非目标驱动的会话代理的任务,并分析了如何处理会话上下文。它将较简单的编码器 - 解码器与分层递归编码器 - 解码器架构进行了比较,该架构包括一个额外的模块,用于使用先前的话语信息对会话的内容进行建模。我们发现层次模型能够提取相关的上下文信息并将它们包含在输出的生成中。然而,它比简单的编码器 - 解码器模型在语法正确的输出和有意义的响应方面表现更差(35-40%)。尽管有这些结果,但实验证明了由于特定主题相关词的频率增加,相似主题的对话如何在上下文空间中彼此接近,从而为将来的研究留下了有希望的方向,以及如何利用对话的内容。
translated by 谷歌翻译
对于任何设计者来说,设计徽标是一个漫长,复杂且昂贵的过程。然而,最近生成算法的进步提供了可以提供可能解决方案的模型。徽标是多模态的,具有非常少的属性,并且没有连续的潜在空间。然而,条件生成对抗网络可用于生成可帮助设计师创作过程的徽标。我们提出了LoGAN:一种改进的辅助分类器Wasserstein生成对抗神经网络(具有梯度惩罚),能够生成以两种不同颜色为条件的标识。在768个生成的实例(12个类和64个每个类别的log)中,当查看最突出的颜色时,模型的条件生成部分具有总体精度,并且分别为0.8和0.7。 LoGAN的结果首次展示了人工智能如何用于帮助设计师创作过程和开放未来的方向,例如包括更具描述性的标签,这些标签将提供更详尽和易于使用的系统。
translated by 谷歌翻译
在本文中,我们解决了多线索影响识别的挑战性环境,如儿童机器人交互。为了实现这一目标,我们提出了一种自动识别情感的方法,该方法利用身体表情和面部表情,而传统方法通常只关注后者。我们在一个充满挑战的机器人 - 情感表达的机器人交互数据库以及演员的情绪表达数据库中评估我们的方法,并且表明所提出的方法与面部表情基线相比具有明显更好的结果,可以联合和分开训练,并为我们提供了个人模态以及全身情绪的计算模型。
translated by 谷歌翻译
概念到文本生成通常采用流水线架构,这导致了次优文本。例如,内容选择可以贪婪地选择最重要的事实,然而,这可能需要太多的词来表达,并且当空间有限或昂贵时,这可能是不合需要的。选择其他事实,可能只是稍微不那么重要,可能允许太化阶段使用更少的单词,或在同一空间报告更多的事实。在内容选择和词汇化过程中做出的决定也可能导致更多或更少的句子聚合机会,从而影响所得文本的延长可读性。在语义Web本体的公共自然语言生成器的基础上,本文提出了一个整数线性规划模型,与管道体系结构不同,它共同考虑内容选择,词汇化和句子聚合中可用的选择,以避免贪婪的本地决策并产生更紧凑的文本,即每个单词报告更多事实的文本。紧凑文本是可取的,例如,当生成要包含在Web搜索结果中的广告时,或者在有限空间中汇总结构化信息时。所提出的模型的扩展版本还考虑了引用表达式生成的有限形式并避免了冗余的句子。当需要生成较长的文本时,可以使用这两个模型的近似。三个本体的实验证实,与管道系统相比,所提出的模型导致更紧凑的文本,没有恶化者,所产生的文本的感知质量得到改善。
translated by 谷歌翻译
许多概念到文本生成系统需要特定于域的语言资源来生成高质量的文本,但是手动构建这些资源可能是繁琐且昂贵的。关注用于OWL本体的公共可用的自然语言生成器NaturalOWL,我们提出了从Web语句计划和自然语言名称中提取的方法,这两种方法是由生成器使用的两种最重要的领域特定语言资源。实验表明,使用我们的方法以半自动方式提取的语言资源生成的文本,人工参与最少,被认为几乎与使用手工创作的语言资源生成的文本一样好,并且比使用从关系中提取的语言资源生成的文本更好。和本体的实体标识符。
translated by 谷歌翻译