本文描述了针对机器翻译(MT),实体发现和链接(EDL)以及文本和语音中的情景帧(SF文本和语音)的检测的低资源人类语言技术(LoReHLT)2018评估的ARIEL-CMU提交。
translated by 谷歌翻译
单词嵌入的跨语言转移旨在通过学习相应单词嵌入空间的变换函数来建立不同语言的单词之间的语义映射。成功解决这个问题将有利于许多下游任务,例如从资源丰富的语言(例如英语)翻译资源语言翻译文本分类模型。针对该问题的监督方法依赖于跨语言监督的可用性,或者使用并行语料库或双语词典作为用于训练的标记数据,这对于许多低资源语言可能是不可用的。本文提出了一种无监督的学习方法,不需要任何跨语言的标记数据。给定任意语言对的双字符词嵌入空间,我们的算法在分布匹配的基础上同时优化两个方向的变换函数,并最小化反向翻译损失。我们使用神经网络实现来计算Sinkhorn距离,awell定义的分布相似性度量,并通过反向传播优化我们的目标。我们对双语图像诱导和跨语言词汇相似性预测的基准数据集的评估显示,与其他语言监督和无监督基线方法相比,所提出的方法与许多语言对相比具有更强的竞争性能。
translated by 谷歌翻译
我们考虑在一组过度完整的向量上分解信号。系数向量的$ \ ell ^ 1 $ -norm的最小化通常可以检索最稀疏的解决方案(所谓的“$ \ ell ^ 1 / \ ell ^ 0 $ -equivalence”),永久性的NP难度任务,以及这个事实为压缩感知领域提供了动力。 Wright等人的基于稀疏表示的分类(SRC)将这种关系应用于机器学习,其中待分解的信号代表测试样本,并且字典的列是训练样本。我们研究了SRC中$ \ ell ^ 1 $ -minimization,稀疏度和分类准确性之间的关系。在证明了验证$ \ ell ^ 1 / \ ell ^ 0 $ -equivalence的易处理的确定性方法与同类训练样本之间的高度一致性之后,我们证明了$ \ ell ^ 1 $ -minimization仍然可以恢复最稀疏的解决方案当类很好分离时。进一步,使用非线性变换使得稀疏恢复条件可能不满意,我们证明近似(非严格)等价是SRC成功的关键。
translated by 谷歌翻译
弱引力透镜是大规模宇宙物分布的有力探测器。宽视场星系测量允许我们生成所谓的弱透镜图,但由于对星系形状扭曲的测量不完整以及源星系的有限数量密度,实际观测会受到噪声的影响。在本文中,我们探索了一种深度学习方法来降低噪声。我们开发了一种带有条件对抗网络(CAN)的图像到图像转换方法,它可以学习从输入噪声弱透镜映射到底层噪声场的有效映射。我们使用300个图像对来训练CAN,这些图像对是从1000次射线跟踪模拟的弱引力透镜获得的。我们证明训练好的CANs再现了无噪声透镜图的真实点概率分布函数,平均值小于$ 1 \ sigma $,其中$ \ sigma $是统计误差。由于我们使用了许多模型参数CANs,我们的方法在重建弱透射图的汇总统计时有额外的误差预算。发现这种重建误差的典型幅度为$ 1-2 \ sigma $ level。有趣的是,对于欠密集区域的逐像素去噪比对去密集区域去噪的偏差更小。我们的深度学习方法是对现有分析方法的补充,这些方法侧重于聚类属性和弱透镜图的峰值统计。
translated by 谷歌翻译
由于卷积神经网络在该领域取得了迅速进展,因此最近正在极大地关注多人姿势估计方法。特别是,利用部分置信度图和部分亲和力场(PAF)的最近方法已经实现了对多人关键点的准确实时预测。然而,人类注释标签有时不适合学习模型。例如,如果有一个肢体延伸到图像外,肢体的关键点可能没有注释,因为图像外的迭代,因此无法生成肢体的标签。如果使用包括这样的缺失标签的数据训练模型,则该位置的模型的输出即使是正确的,也会被误判为假阳性,这可能对模型的性能造成负面影响。在本文中,我们指出了一些不适当标签的模式的存在,并提出了一种新的方法来校正这些标签与教师模型训练这些不完整的数据。 COCO数据集的实验表明,使用校正标签进行培训可以提高模型的性能,并加快培训速度。
translated by 谷歌翻译
提出了一种新的协方差矩阵适应进化策略(CMA-ES)线性约束处理技术。提出的约束处理表现出两个不变性。一个是对任意元素增加的目标和约束函数的变换的不变性。另一个是搜索空间的任意仿射变换的不变性。所提出的技术通过考虑目标函数值的排序和约束违反的排序来虚拟地将约束优化问题转换为无约束优化问题,所述约束违反的排序由每个候选解决方案与其在约束边界上的投影之间的Mahalanobisdistance测量。 。仿真结果表明,所提出的约束处理的CMA-ES表现出仿射不变性,并且与无约束对应物上的CMA-ES表现相似。
translated by 谷歌翻译
在阅读文本时,常常会陷入不熟悉的单词和短语,例如具有新颖感官的多义词,很少使用的习语,互联网俚语或新兴实体。首先,我们试图从他们的背景中找出那些表达的含义,最终我们可以根据他们的定义来咨询字典。然而,很少使用的感官或紧急情况并不总是由现有的手工制作的定义涵盖,这可能会导致文本理解上的问题。本文承担了基于其使用情境描述(或定义)给定表达(单词orphrase)的任务,并提出了一种新颖的神经网络生成器,用于表达其作为自然语言描述的意义。四个数据集的实验结果(包括WordNet,Oxford和UrbanDictionaries,非标准英语和维基百科)证明了我们的方法相对于以前的定义生成方法的有效性[Noraset + 17; Gadetsky + 18;倪+ 17]。
translated by 谷歌翻译
非负矩阵分解(NMF)是一种用于许多领域的知识发现方法,此外,其变分推理和吉布斯采样方法也是众所周知的。然而,变分近似精度尚未阐明,因为NMF在统计上不是规则的,并且在变分贝叶斯NMF(VBNMF)中使用的先验具有零点或发散点。在本文中,使用代数几何方法,我们在理论上分析VBNMF和贝叶斯NMF之间的负对数证据/边际可能性(自由能)的差异,并渐近地给出近似准确度的下界。结果定量地显示了VBNMF算法与贝叶斯NMF的近似程度。
translated by 谷歌翻译
换句话说是对文本意义的重述。换言之,已经研究过语言以增强许多自然语言处理任务的表现。在本文中,我们提出了一个新的任务iParaphrasingto提取视觉上接地的释义(VGP),这是在图像中描述相同视觉概念的不同的phrasalexpressions。这些提取的VGP有可能改善语言和图像多模式任务,例如视觉问题回答和图像字幕。如何建模VGP之间的相似性是iParaphrasing的关键。我们应用各种现有方法,并提出一种新的基于神经网络的图像注意方法,并报告首次尝试iParaphrasing的结果。
translated by 谷歌翻译
随机矩阵分解(SMF)可以被视为非负矩阵分解(NMF)的限制。 SMF对于主题模型的推理,二元矩阵数据的NMF,马尔可夫链和贝叶斯网络是有用的。然而,SMF需要强大的假设来达到唯一的因子分解,并且理论预测的准确性尚未得到澄清。本文研究了年龄SMF的zeta函数极点(实数对数正则阈值)的最大值,推导了贝叶斯参考中泛化误差的上界。该结果为SMF的广泛适用和严格的因子化方法奠定了基础,并且意味着SMF中的泛化误差比贝叶斯推断的常规统计模型小。
translated by 谷歌翻译