本文描述了针对机器翻译(MT),实体发现和链接(EDL)以及文本和语音中的情景帧(SF文本和语音)的检测的低资源人类语言技术(LoReHLT)2018评估的ARIEL-CMU提交。
translated by 谷歌翻译
为低资源语言开发实用的语音识别器是具有挑战性的,不仅因为语言的(可能是未知的)属性,而且因为测试数据可能不是与可用训练数据来自相同的域。在本文中,我们关注使用基于序列的标准训练的系统的后一挑战,即域失配。我们证明了使用预训练的英语识别器的有效性,这种识别器对于这种不匹配的条件是健壮的,作为低资源语言的域规范化特征提取器。在我们的示例中,我们使用TurkishConversational语音和广播新闻数据。这使得语音识别器能够快速开发,可以轻松适应任何领域。在各种跨域方案中,我们实现了对音素错误率的25%的相对改进,对于某些域,改进率约为50%。
translated by 谷歌翻译
我们在VariationalAuto-Encoders(VAEs)中通过将其作为潜在表征的\ emph {分解}来展开广泛的解开概念,其特征在于i)在数据的潜在编码中强制适当的重叠水平,以及ii)正则化通过先验表示的平均编码到期望的结构。我们通过证明a)$ \ beta $ -VAE纯粹通过潜在编码中的重叠的规范化,以及通过其平均(高斯)编码器方差来解开,并且b)解开,因为独立性之间的独立性,可以被视为正则化先前具有特定特征的总和。我们通过展示这些因素的简单操作来验证这种表征,例如使用旋转变异驱动器,可以帮助改善解缠结,并讨论这种特征如何提供一个更通用的框架来结合分解的概念,而不仅仅是潜伏之间的独立性。
translated by 谷歌翻译
分布式神经网络训练对于包括使用计算集群进行扩展,对诸如IOT设备和边缘服务器之类的数据进行训练,利用跨异构环境中的未充分利用资源等的若干原因特别感兴趣。大多数现代方法主要使用计算集群进行扩展,并且需要高网络带宽和频繁的通信。本文概述了标准分发培训,并提出了一种新技术,涉及使用类似Gossip的协议进行空中通信,称为弹性八卦。这种方法建立在称为弹性平均SGD(EASGD)的现有技术的基础上,类似于另一种称为Gossiping SGD的技术,它也是类似Gossip的协议。弹性八卦使用MNIST数字识别和CIFAR-10分类任务,使用常用的跨越多层感知器(MLP)和卷积神经网络(CNN)的神经网络架构,对Gossiping SGD进行经验评估。发现Elastic Gossip,Gossiping SGD和All-reduce SGD表现相当可观,即使后者需要相当高的通信成本。虽然弹性八卦在这些实验中表现优于Gossiping SGD,但可以通过对超参数空间进行更彻底的搜索(特定于agiven应用),可能会产生比弹性八卦更有效的Gossiping SGD配置。
translated by 谷歌翻译
这项工作提出了一种新的方法,从其视频早期识别腹腔镜手术的类型。早期识别算法可以有利于“智能”OR系统的开发,该系统可以提供自动上下文感知辅助,并且还可以实现快速数据库索引。无论如何,该任务都是针对属于腹腔镜检查领域的视频所特有的挑战,例如跨手术的高视觉相似性和视频持续时间的大变化。为了捕获这些视频中的时空依赖性,我们选择卷积神经网络(CNN)和长短期记忆(LSTM)网络作为我们的模型。然后,我们提出了两种补充方法来改善早期识别性能。第一个方法是CNN微调方法,鼓励手术根据腹腔镜视频的初始帧进行区分。第二种方法,称为“未来状态预测LSTM”,训练LSTM与未来帧相关的topredict信息,这有助于区分不同类型的手术。我们对包含9种手术(Laparo425)的大型425例腹腔镜视频进行评估,并且仅观察手术的前10分钟,平均达到75%的准确度。从实用的角度来看,这些结果非常有希望,并且还鼓励其他类型的图像引导手术。
translated by 谷歌翻译
变分推理(VI)已成为拟合多种现代概率模型的首选方法。然而,从业者面临着一个碎片文学,它提供了一系列令人眼花缭乱的算法选择。首先,变异家庭。其次,更新的粒度,例如是否更新是每个数据点的本地,并采用消息传递或全局。第三,优化方法(定制或黑盒,封闭形式的随机更新等)。本文提出了一个新的框架,称为分区变分推理(PVI),明确承认VI的这些算法维度,统一不同的文献,并提供使用指导。至关重要的是,建议的PVI框架允许我们确定执行VI的新方法,这些方法非常适合挑战学习场景,包括联合学习(其中分布式计算用于处理非集中数据)和持续学习(新数据和任务随时间推移到达且必须是很快就适应了)。我们通过开发贝叶斯神经网络的通信高效联邦训练和持续学习具有私有伪点的高斯过程模型来展示这些新功能。新方法明显优于现有技术,同时实现标准VI几乎一样简单。
translated by 谷歌翻译
诸如American Fuzzy Lop(AFL)之类的灰盒模糊器是用于查找程序中的错误和潜在漏洞的常用工具。虽然这些模糊器已经能够在许多广泛使用的程序中发现漏洞,但它们并不高效; AFL在典型的模糊测试中执行的数百万输入中,只有少数人发现看不见的行为或触发崩溃。剩余的输入是多余的,表现出已经观察到的行为。在这里,我们提出了一种方法,通过应用机器学习直接模拟程序的行为来提高像AFL这样的模糊器的效率。我们学习了一个前向预测模型,它将程序输入映射到执行轨迹,训练在标准模糊测试期间收集的数千个输入。这个学习模型通过关注模糊输入来指导探索,模糊输入对我们的模型最不确定(通过预测的执行跟踪分布的熵来测量)。通过专注于执行输入,我们学习的模型是不可靠的,并且忽略了我们的模型确定的行为的任何输入,我们可以显着地限制浪费的执行。通过对作为DARPA Cyber​​ GrandChallenge的一部分发布的一组二进制文件进行测试,我们发现我们的方法能够找到一组输入,这些输入会导致更多的代码覆盖并发现崩溃而不是基线模糊测试,执行次数显着减少。
translated by 谷歌翻译
无透镜内窥镜是一种有前途的装置,设计用于在细胞尺度上对组织进行成像。传统的采集设置包括inraster扫描,在此期间来自光纤的聚焦光束顺序地照射视场(FOV)的每个像素。用于聚焦光束的校准步骤和采样方案都需要时间。在这项初步工作中,我们提出了一种基于压缩采样理论的扫描方法。该方法不依赖于聚焦光束,而是依赖于由单模光纤产生的随机照明图案。对于不同压缩率(从FOV的10%到100%)的合成数据进行实验。
translated by 谷歌翻译
像芝加哥这样的城市中涉及帮派的年轻人越来越多地转向社会媒体,在网上发布他们的经历和意图。在某些情况下,当他们遇到失去亲人时,他们在线表达的情感可能演变成对敌人的侵略,并最终成为现实世界的暴力。在本文中,我们提出了一种新的社交媒体中的攻击和丢失检测系统。我们的系统使用自动从大型未标记的文本中获取的特定于域的资源,以及用户最近推文的情感和语义内容的上下文表示以及它们与其他用户的交互。在我们的卷积神经网络(CNN)中加入上下文导致显着改善。
translated by 谷歌翻译
我们探讨了加班选择模型的可学习性问题。我们提出了一个由结构标准定义的大类偏好模型,对于这些偏好模型,我们能够获得超过先前已知的更一般偏好模型的学习界限的指数改进。这特别意味着跨时选择的三个最重要的折扣效用模型 - 指数,双曲线和准双曲线偏差 - 在PAC设置中是可学习的,VC维度在时间段的数量上以对数方式增长。我们还在主动学习的框架中研究了这些模型。我们发现通常基于研究流的设置通常难以分析偏好模型,但我们提供了一种救赎情境,其中学习者确实可以改善PAC学习提供的保证。与基于流的设置相比,我们表明,如果学习者对数据的充分权力 - 通过成员查询学习的形式 - 甚至非常有效的算法明显优于高级主动学习算法提供的保证。
translated by 谷歌翻译