本文描述了针对机器翻译(MT),实体发现和链接(EDL)以及文本和语音中的情景帧(SF文本和语音)的检测的低资源人类语言技术(LoReHLT)2018评估的ARIEL-CMU提交。
translated by 谷歌翻译
为低资源语言开发实用的语音识别器是具有挑战性的,不仅因为语言的(可能是未知的)属性,而且因为测试数据可能不是与可用训练数据来自相同的域。在本文中,我们关注使用基于序列的标准训练的系统的后一挑战,即域失配。我们证明了使用预训练的英语识别器的有效性,这种识别器对于这种不匹配的条件是健壮的,作为低资源语言的域规范化特征提取器。在我们的示例中,我们使用TurkishConversational语音和广播新闻数据。这使得语音识别器能够快速开发,可以轻松适应任何领域。在各种跨域方案中,我们实现了对音素错误率的25%的相对改进,对于某些域,改进率约为50%。
translated by 谷歌翻译
人工智能(AI)有机会彻底改变美国国防部(DoD)和情报界(IC)应对不断演变的威胁,数据泛滥和快速行动过程的挑战。开发端到端的人工智能系统需要并行开发不同的部分,这些部分必须协同工作才能提供决策者,作战人员和分析师可以使用的能力。这些部分包括数据收集,数据调节,算法,计算,强大的人工智能和人机组合。虽然今天流行的媒体围绕着算法和计算的进步,但大多数现代人工智能系统都利用了许多不同领域的进步。而且,虽然某些组件可能不像其他组件那样对最终用户可见,但我们的经验表明,这些组件中的每一个都是相互关联的。组件在AI系统的成功或失败中起着重要作用。本文旨在重点介绍端到端AI系统中涉及的许多这些技术。本文的目的是为读者提供学术界,行业界和政府的学术,技术细节和最新亮点的概述。在可能的情况下,我们会指出可用于进一步阅读和理解的相关资源。
translated by 谷歌翻译
在连续学习设置中,按顺序遇到任务。目标是学习,同时i)避免灾难性遗忘,ii)有效利用模型能力,以及iii)采用前向和后向转移学习。在本文中,我们将探讨变分连续学习(VCL)框架如何在持续学习的两个基准上实现这些需求:分裂MNIST和置换MNIST。我们首先报告了已经成为竞争方法的显着改进结果。通过建立平均场变分贝叶斯神经网络的新的最佳实践方法来实现改进。然后我们详细研究解决方案。这使我们能够理解VCL为什么会这样做,并且我们将解决方案与“理想”的持续学习解决方案进行比较。
translated by 谷歌翻译
为了解决复杂的,长期任务,智能机器人需要能够与运动规划一起进行高水平,抽象的规划和推理。然而,抽象模型通常是有损的,并且使用它们计算的计划或政策在实践中通常是不可执行的。这些问题在具有随机动态的更现实的情况下更加严重,其中机器人需要进行推理,并计划多种可能的突发事件。我们提出了一种新方法,用于集成任务和运动规划。与此方向的先前工作相反,我们表明,对于各种可能的紧急情况,ourapproach可以有效地计算具有分支结构编码代理行为的集成任务和运动策略。我们证明了我们的算法在概率上是完整的,并且可以随时计算可行的解决方案策略,以便遇到未解决的意外事件的可能性随着时间的推移而降低。对一系列具有挑战性的问题的实证结果显示了我们的方法的实用性和范围。
translated by 谷歌翻译
深度学习的最新进展主要取决于大量训练数据的可用性。然而,对于诸如说话人识别之类的特定任务而言,这种数据的可用性并不总是可行的,其中在实际场景中不可能收集大量数据。因此,在本文中,我们建议通过仅从少数几个例子中学习来识别说话者。为实现这一目标,我们使用具有原型损失的深度神经网络,其中网络的输入是频谱图。对于输出,我们将类特征向量投影到一个公共嵌入空间,然后进行分类。此外,我们在几个学习设置中显示了胶囊网的有效性。为此,我们利用自动编码器来学习从类网络中获得的类特定嵌入的广义特征嵌入。我们提供有关公开数据集和竞争基线的详尽实验,展示了所提出的少数镜头学习管道的优越性和泛化能力。
translated by 谷歌翻译
本文介绍了一种基于在线学习范式的登革热分类新方法。所提出的方法适用于实际实施,因为它使得仅使用少量训练样本进行学习。随着时间的推移,所提出的方法能够从数据收集中逐步学习,而无需重新训练模型或重新部署预测引擎。此外,我们还提供了用于预测登革热的机器学习方法的综合评估。建议的管道的输入包括记录的患者症状和诊断调查。已经采用离线分类器模型来获得基线核心以确定特征集对于登革热的分类是最佳的。本文提出的在线检测模型的主要优点是已经建立了有效识别登革病发病率高的患者,并且在训练和测试样本数量方面的可扩展性实验验证了所提出模型的使用。
translated by 谷歌翻译
在本文中,我们提出了一种学习运动规划(MP)的新方法,其中从一组给定的运动计划中获取具有低概率测量的环境的关键区域,并用于改善新问题实例的性能。我们证明卷积神经网络(CNN)可用于识别运动计划的关键区域。我们还介绍了一个基于新闻采样的运动规划器,学习和链接(LLP)。 LLP利用我们的CNN识别的关键区域位置来克服统一采样的局限性,同时仍然保持基于采样的固有算法的正确性。我们使用一系列有关具有挑战性的导航规划问题的实验来评估我们的规划人员,并将其性能与开放式运动规划库(OMPL)中的规划人员进行比较。 Weshow我们的方法需要创建比现有的基于采样的规划者少得多的状态。
translated by 谷歌翻译
我们在VariationalAuto-Encoders(VAEs)中通过将其作为潜在表征的\ emph {分解}来展开广泛的解开概念,其特征在于i)在数据的潜在编码中强制适当的重叠水平,以及ii)正则化通过先验表示的平均编码到期望的结构。我们通过证明a)$ \ beta $ -VAE纯粹通过潜在编码中的重叠的规范化,以及通过其平均(高斯)编码器方差来解开,并且b)解开,因为独立性之间的独立性,可以被视为正则化先前具有特定特征的总和。我们通过展示这些因素的简单操作来验证这种表征,例如使用旋转变异驱动器,可以帮助改善解缠结,并讨论这种特征如何提供一个更通用的框架来结合分解的概念,而不仅仅是潜伏之间的独立性。
translated by 谷歌翻译
分布式神经网络训练对于包括使用计算集群进行扩展,对诸如IOT设备和边缘服务器之类的数据进行训练,利用跨异构环境中的未充分利用资源等的若干原因特别感兴趣。大多数现代方法主要使用计算集群进行扩展,并且需要高网络带宽和频繁的通信。本文概述了标准分发培训,并提出了一种新技术,涉及使用类似Gossip的协议进行空中通信,称为弹性八卦。这种方法建立在称为弹性平均SGD(EASGD)的现有技术的基础上,类似于另一种称为Gossiping SGD的技术,它也是类似Gossip的协议。弹性八卦使用MNIST数字识别和CIFAR-10分类任务,使用常用的跨越多层感知器(MLP)和卷积神经网络(CNN)的神经网络架构,对Gossiping SGD进行经验评估。发现Elastic Gossip,Gossiping SGD和All-reduce SGD表现相当可观,即使后者需要相当高的通信成本。虽然弹性八卦在这些实验中表现优于Gossiping SGD,但可以通过对超参数空间进行更彻底的搜索(特定于agiven应用),可能会产生比弹性八卦更有效的Gossiping SGD配置。
translated by 谷歌翻译