我们提出了一种新方法来构建自动语言转换,用于许多任务,包括受控的语法或词汇变化,样式转换,文本生成和机器翻译。我们的方法包括创建句子的意义和语法的抽象表示,我们将其用作训练重现原始句子的编码器 - 解码器网络的输入。操纵抽象表示允许根据用户提供的参数(以语法和词汇方式)以任何组合来转换句子。另外,相同的结构可以用于受控文本生成,甚至是无监督的机器翻译,其中网络用于在不使用并行语料库之外的并行语料库之间进行翻译。由于缺乏足够的训练数据,这种策略有望实现迄今为止在NLP技术范围之外的许多任务。我们通过复制和转换英语句子,以及手动和自动评估结果,为我们的方法的有效性提供了经验证据。单个无监督模型用于所有任务。对于句子复制以及14对类之间的后向语法转换,我们报告55.99和81.82之间的.BLE分数。
translated by 谷歌翻译
随着社交网络的普及及其对仇恨言论的不幸使用,对后者的自动检测已成为一个迫切的问题。在本文中,我们从先前的工作中再现了七种最先进的仇恨语音检测模型,并表明它们只有在经过相同类型的数据训练时才能表现良好。基于这些结果,我们认为对于成功的hatespeech检测,模型体系结构不如数据类型和标签标准重要。我们进一步表明,所有提出的检测技术都可以对抗那些可以(自动)插入拼写错误,更改字符边界或在原始仇恨言论中添加无害字词的对手。这些方法的组合对Google Perspective来说也是有效的 - 来自行业的尖端解决方案。我们的实验证明,对抗训练并不能完全缓解攻击,使用特征级功能可以使模型在使用单词级特征时更具系统攻击力。
translated by 谷歌翻译
自动生成的虚假餐厅评论对在线评论系统构成威胁。最近的研究表明,用户在检测隐藏在真实餐馆评论中的机器生成的虚假评论方面存在困难。这项工作中的方法(char-LSTM)有一个缺点:它难以保持不足,即当它产生对特定目标实体的评论时,所得到的评论可能包含与目标无关的短语,从而增加其可检测性。在这项工作中,我们提出并评估一种基于神经机器翻译(NMT)的更复杂的技术,我们可以用它来生成关于主题的评论。我们在Amazon Mechanical Turk上使用母语为英语的人员测试了多种ourtechnique变体。我们证明最佳变体产生的评论几乎具有最佳的可检测性(类别平均F分数为47%)。我们与持怀疑态度的用户进行用户研究,并表明我们的方法更频繁地逃避检测,与具有统计意义的最新技术(平均逃避3.2 / 4 vs 1.5 / 4)相比,在{\ alpha} = 1%(部分) 4.3)。我们开发了非常有效的检测工具,并在分类时达到平均F值97%。尽管虚假评论在愚弄人们方面非常有效,但有效的自动检测仍然是可行的。
translated by 谷歌翻译
神经网络很容易受到对抗性攻击 - 视觉上不易察觉的小噪声,当加到输入端时会大大改变输出。防御这些敌对攻击的最有效方法是使用对抗性训练的方法。我们分析了经过对侧训练的强大模型,以研究它们在潜层层面对抗对抗性攻击的脆弱性。我们的分析揭示了与对抗性攻击具有鲁棒性的输入层相反,这些鲁棒模型的特征层非常容易受到小幅度的对抗性扰动。利用这些信息,我们引入了一种新技术潜在对抗训练(LAT),其中包括对经过对侧训练的模型进行微调,以确保在特征层中的稳健性。我们还提出潜在攻击(LA),一种用于构建对抗性示例的新算法。 LAT导致测试精度的微小改进,并导致针对MNIST,CIFAR-10,CIFAR-100数据集显示的通用一阶对抗性PGD攻击的最新对抗精度。
translated by 谷歌翻译
虽然目前的通用游戏(GGP)系统促进了用于游戏的人工智能(AI)的有用研究,但它们通常是特定的,并且计算效率低。在本文中,我们描述了一个名为Ludii的“ludemic”通用游戏系统的初始版本,该系统具有为AI研究人员以及相关领域的游戏设计师,历史学家,教育工作者和从业者提供有效工具的潜力。 Ludiidefines游戏作为ludemes的结构,即高级,易于理解的游戏概念。我们通过概述其主要优点来建立Ludii的基础:通用性,可扩展性,可理解性和效率。实验上,Ludii优于Tiltyard GGP存储库中所有可用游戏的基于命题网络的最有效的Game DescriptionLanguage(GDL)reasoners之一。
translated by 谷歌翻译
人类通常会教他们的同伴合作者通过少数示威来执行任务。通过指导来纠正或扩展学习的任务以完成特定的任务目标。采用类似的框架通过示范和指导来强化机器人,使教学任务非常直观。与需要多次演示的传统的演示学习(LfD)方法不同,我们提供了从演示方法学习任务的一次性学习。使用两层评估/修改来校正和概括所学习的任务。首先,机器人自己评估其性能并将性能校正为更接近于证明的任务。然后,教练被用作扩展政策的手段,以适应不同的任务目标。使用强化学习(RL)方法实现自我评估和教学。教练通过人工反馈实现预期目标和行动修改,以普及到指定的任务目标。通过呈现单个演示,通过ascooping任务评估所提出的方法。自我评估框架旨在减少媒体中对舀取的抵制。为了减少RL的这些空间,我们使用阻力理论获得的最小阻力路径进行搜索。教练用于概括学习任务政策以转移所需数量的材料。因此,所提出的方法提供了用于从一次演示中学习任务并使用人工反馈通过指导来概括它的框架。
translated by 谷歌翻译
基于one.g.的数值模拟评估的计算工作量。有限元方法很高。元模型可用于创建低成本替代方案。然而,用于创建足够的元模型的所需样本的数量应该保持较低,这可以通过使用自适应采样技术来实现。在这篇硕士论文中,研究了自适应采样技术在使用克里金技术创建元模型中的应用,该技术通过由先验协方差控制的高斯过程来插值。提出了扩展到多保真问题的Kriging框架,并用于比较文献中提出的基准问题的自适应采样技术以及接触力学的应用。本文首次对Kriging框架的自适应技术的大范围进行了综合比较。此外,自适应技术的灵活性被引入到多保真Kriging以及具有减少的超参数维度的Kriging模型,称为偏最小二乘Kriging。此外,提出了一种创新的二进制分类自适应方案,并用于识别Duffing型振荡器的混沌运动。
translated by 谷歌翻译
模式分析通常需要预处理阶段来提取选择特征,以帮助分类,预测或聚类阶段以更好的方式区分或表示数据。这一要求的原因是原始数据复杂且难以处理而无需事先提取或选择适当的特征。本文回顾了不同常用的特征选择和提取方法的理论和动机,并介绍了它们的一些应用。对于这些方法也示出了一些数字实现。最后,比较了方法的选择性和提取方法。
translated by 谷歌翻译
计算哲学是机械化计算技术的运用,利用传统哲学方法难以或不可能找到的哲学见解。计算形而上学是计算哲学,侧重于形而上学。在本文中,我们(a)开发了模态形而上学的结果,其发现是计算机辅助的,并且(b)得出结论,这些结果不仅对哲学的明显好处起作用,而且对于计算机科学的益处也不那么明显,因为新的导致这些结果的计算技术可能在计算机科学中更广泛地应用。本文包括对背景方法及其演变方式的描述,以及对我们新结果的讨论。
translated by 谷歌翻译
在这里,我们回顾了利用大数据和机器学习(ML)的前沿研究和创新方面,这两个计算机科学领域结合起来产生机器智能。 ML可以加速解决复杂的化学问题,甚至可以解决其他方面无法解决的问题。但ML的潜在好处是以大数据生产为代价的;也就是说,为了学习,算法需要来自不同来源的大量数据,来自材料属性传感器数据。在调查中,我们提出了未来发展的路线图,重点是材料发现和化学传感,并在物联网(IoT)的背景下,这两个领域都是MLin大数据背景的突出研究领域。除了概述最近的发展之外,我们还详细阐述了bigdata和ML应用于化学,概述过程,讨论陷阱以及回顾成功和失败案例的概念和实践限制。
translated by 谷歌翻译