为会话代理定义行动空间并通过强化学习优化他们的决策制定过程是一个持久的挑战。通常的做法是使用手工制作的对话行为或输出词汇,例如:在神经编码器解码器中,作为动作空间。两者都有自己的局限性。本文提出了一种新的潜在行动框架,它将端到端对话代理的动作空间作为潜在变量进行处理,并开发无监督方法,以便从数据中引出自己的动作空间。综合实验研究了连续和离散动作类型以及基于随机变分推理的两种不同的优化方法。结果表明,在DealOrNoDeal和MultiWoz对话框中,所提出的潜在行为比先前的单词级政策梯度方法具有更好的经验性能改进。我们的详细分析还提供了有关政策学习的各种潜在变量方法的见解,并可作为在未来研究中开发更好的潜在反应的基础。
translated by 谷歌翻译
本文提出的案例虽然大多数关于智能代理的研究主要集中在代理而不是用户身上,但事实恰恰相反。它涵盖了插槽填充,游戏和聊天机器人代理,它会查看代理商的注意力来自何处,以及为什么重要的是集中用户。在回顾相关文献后,我们提出了创建和评估以用户为中心的系统的第一种方法。
translated by 谷歌翻译
对话响应排名用于通过考虑与对话历史的关系来对响应候选进行排名。虽然研究人员已经解决了开放域对话的概念,但很少关注面向任务的对话。此外,之前没有研究分析响应排名是否可以改善具有语音识别错误的真人计算机对话中现有对话系统的性能。在本文中,我们提出了一个上下文感知对话框响应重新排序系统。我们的系统分两步重新响应:(1)计算每个候选响应和当前对话上下文的匹配分数; (2)它结合匹配分数和来自现有对话系统的候选者的概率分布以进行响应重新排序。通过使用基于神经词嵌入的模型和基于手工或逻辑回归的集合模型,我们改进了最近提出的端到端面向任务的对话系统的性能,该对话系统具有语音识别错误。
translated by 谷歌翻译
分散驾驶是致命的,仅在2015年就在美国夺走了3,477人的生命。虽然已经进行了大量关于在不同条件下对驾驶员的偏离行为进行建模的研究,使用多种模态的准确自动检测,尤其是使用语音模态来提高准确性的贡献很少受到关注。本文介绍了一种新的用于分心驾驶行为的多模态数据集,并使用三种模态的特征来讨论自动分心检测:面部表情,语音和汽车信号。详细的多模态特征分析表明,增加更多模态可以单调增加模型的预测精度。最后,与基线SVM和神经网络模型相比,使用多项式融合层的简单有效的多模态融合技术显示出更好的分心检测结果。
translated by 谷歌翻译
已经应用不同类型的卷积神经网络(CNN)来从计算机断层扫描(CT)扫描中检测癌性肺结节。然而,结节的大小非常多样,可以在3到30毫米之间。结节大小的高度变化使得它们难以分类并且具有挑战性。在这项研究中,我们提出了一种新的CNN体​​系结构,称为门控扩张(GD)网络,以对结节进行恶性或良性分类。与以前的研究不同,GD网络使用多次卷积而不是最大池来捕获尺度变化。此外,GD网络具有Context-Aware子网络,该子网络分析输入特征并将特征引导到适当的扩张卷积。我们对来自LIDC-LDRIdataset的1000多次CT扫描评估了所提出的网络。我们提出的网络优于基线模型,包括常规CNN,Resnet和Densenet,AUC> 0.95。与基线模型相比,GD网络提高了粒度范围大小的结节的分类精度。此外,我们观察到结节的大小与Context-Awaresub网络生成的注意信号之间的关系,后者验证了我们的新网络架构。
translated by 谷歌翻译
最近对人体机器人相互作用的研究探讨了人们对其他人的倾向是否延伸到人工因素(Hertz&Wiese,2016)。然而,人们对于机器人的感知在多大程度上影响人们的决定知之甚少。基于心智感知理论,目前的研究提出,人工智能因素可以促使决策改变到个体认为他们有思想的程度。通过改变机器人表达能力(代理)或感受(经验)的程度,我们专门研究了心灵归因的机制和社会影响的潜在机制。我们的研究结果表明,感知经验和感知代理对人工代理引起的社会影响具有交互作用。这些发现为自主机器人对个人决策的影响提供了初步见解,并为理解机器人决策的潜在动态奠定了基础。
translated by 谷歌翻译