大多数语言建模方法依赖于大规模数据来统计地学习单词的顺序模式。在本文中,我们认为单词是原子语言单位,但不一定是原子语义单位。受到HowNet的启发,我们使用人类语言中最小语义单位的sememes来表示语言建模后面的隐含语义,即名为驱动语言模型(SDLM)。更具体地说,为了预测下一个词,SDLM首先估计了sememe分布给出了文本背景。之后,它将每个sememe视为一个独特的语义专家,并且这些专家共同识别最可能的感官和相应的词。这样,SDLM启用了语言除了词级操作之外,模型还可以工作到细粒度的语义级语义,并为我们提供更多的功能,以便微调语言模型,提高可解释性以及语言模型的稳健性。语言建模实验和标题生成的下游应用证明了SDLM的显着性。可以通过以下网址访问实验中使用的源代码和数据:// github.com/thunpp/SDLM-pytorch。
translated by 谷歌翻译
去马赛克,去噪和超分辨率(SR)在数字图像处理中具有实际重要性,并且已经在过去的十年中独立研究。尽管近年来基于学习的图像处理方法在图像质量方面有所改进,但在现实设置的混合问题中,对于它们的相互作用和特性缺乏足够的分析,以及去马赛克,去噪和SR的混合问题。在现有解决方案中,这些任务被简单地组合以从低分辨率原始马赛克图像获得高分辨率图像,导致最终图像质量的性能下降。在本文中,我们首先从整体的角度重新思考混合问题,然后提出三位一体增强网络(TENet),一种专门设计的基于学习的混合问题方法,采用新颖的图像处理流水线顺序和联合学习策略。为了获得正确的训练颜色采样,我们还提供了一个新的数据集,即PixelShift200,它由使用先进像素移位技术的高质量全色采样实际图像组成。实验证明,从定量和定性的角度来看,TENet优于现有的解决方案。我们的实验还表明了提出的PixelShift200数据集的必要性。
translated by 谷歌翻译
本文讨论了图结构对象的检索和匹配的挑战性问题,并做出了两个关键的贡献。首先,我们演示了图形神经网络(GNN)如何作为结构化数据上定义的各种监督预测问题的有效模型,可以训练如何在向量空间中生成图形嵌入,从而实现有效的相似性推理。其次,我们提出了一种新颖的图形匹配网络模型,给定一对图形作为输入,通过一个新的基于交叉graphattention的匹配机制联合推理它们来计算它们之间的相似性比较。我们展示了我们的模型在不同领域的有效性,包括基于控制流图的功能相似性搜索的挑战性问题,它在检测软件系统中的漏洞方面起着重要作用。实验分析表明,我们的模型不仅能够在相似性学习的背景下利用结构,而且还可以胜过针对这些问题精心手工设计的特定领域的基线系统。
translated by 谷歌翻译
我们提出了面部化妆和化妆的局部对抗性解开网络(LADN)。我们的方法的核心是在内容式解开网络中的多个和重叠的局部对话鉴别器,在面部图像之间进行局部细节转移,使用具有高频细节的戏剧性化妆风格的不对称损失函数。现有技术不能证明或不能在全局对抗设置中传输高频细节,或仅训练单个局部判别器以确保图像结构一致性,因此仅适用于相对简单的样式。与其他人不同,我们提出的局部对抗性判别器可以区分所生成的局部图像细节是否与在无监督设置中的给定参考图像中的对应区域一致。结合这些技术贡献,我们不仅实现了传统风格的最新成果,而且还实现了涉及复杂和戏剧性风格的新颖结果,其中高频细节覆盖了多个面部特征的大面积区域。将发布精心设计的未配对之前和之后的化妆图像数据集。
translated by 谷歌翻译
贝叶斯网络的结构学习一直是一个具有挑战性的问题。如今,具有数千个或更多节点但是少量样本的大规模网络经常出现在许多区域中。我们开发了一种分而治之的框架,称为分区估计融合(PEF),用于这种大型网络的结构学习。所提出的方法首先将节点分成簇,然后在每个节点簇上学习子图,最后将所有学习的子图融合到一个贝叶斯网络中。 PEF方法是在灵活的道路上设计的,因此在第二步中可以使用任何结构学习方法,将子图结构容忍为DAG或CPDAG。在聚类步骤中,我们调整层次聚类方法以自动选择适当数量的聚类。在融合步骤中,我们提出了一种新颖的混合方法,它可以在子图之间添加边缘。与现有方法相比,广泛的数值实验证明了我们的PEF方法在速度和精度方面的竞争性能。我们的方法可以将结构学习的准确性提高20%或更多,同时将运行时间减少到两个数量级。
translated by 谷歌翻译
Human visual systems are robust to a wide range of image transformations thatare challenging for artificial networks. We present the first study of imagemodel robustness to the minute transformations found across video frames, whichwe term "natural robustness". Compared to previous studies on adversarialexamples and synthetic distortions, natural robustness captures a more diverseset of common image transformations that occur in the natural environment. Ourstudy across a dozen model architectures shows that more accurate models aremore robust to natural transformations, and that robustness to synthetic colordistortions is a good proxy for natural robustness. In examining brittleness invideos, we find that majority of the brittleness found in videos lies outsidethe typical definition of adversarial examples (99.9\%). Finally, weinvestigate training techniques to reduce brittleness and find that no singletechnique systematically improves natural robustness across twelve testedarchitectures.
translated by 谷歌翻译
在本文中,我们通过机器学习研究图像质量评估(IQA)和增强的问题。这个问题长期以来引起了计算智能和图像处理社区的广泛关注,因为对于许多实际应用,例如,物体检测和识别通常需要适当增强原始图像以提高视觉质量(例如可见度和对比度)。事实上,properenhancement可以显着提高输入图像的质量,甚至可以比最初捕获的图像更好,这些图像通常被认为是最佳质量。在这项工作中,我们提出了两个最重要的贡献。第一个贡献是开发一种新的无参考(NR)IQA模型。给定图像,我们的质量测量首先通过分析对比度,清晰度,亮度等来提取17个特征,然后使用回归模块产生一定程度的视觉质量,这是通过大数据训练样本学习的,这些样本远大于相关图像数据集。九个数据集的实验结果验证了我们盲目度量的优越性和效率,与典型的最先进的完整,简化和非参考IQA方法相比。第二个贡献是基于质量优化建立稳健的图像增强框架。对于输入图像,在所提出的NR-IQA测量的指导下,我们进行组织图修改以连续地将图像亮度和对比度校正到适当的水平。彻底的测试表明,我们的框架可以很好地增强自然图像,低对比度图像,低光图像和去噪图像。该源代码将发布于:http://sites.google.com/site/guke198701/publications。
translated by 谷歌翻译
对于难以理解的状态和行动的乐观态度是许多可证明有效的强化学习算法的主要推动力。我们提出了面对敏感价值函数(OFVF)的乐观主义 - 一种新颖的数据驱动贝叶斯算法,用于构建MDP的合理性集,以探索最大限度地减少最坏情况下的勘探成本。该方法通过引入两个新想法来计算具有更严格的勘探估计的政策。首先,它基于贝叶斯的posteriordistributions而不是无分布的边界。其次,OFVF没有将似然性集合构造为简单的置信区间。作为合理性集合的置信区间是一个充分但不是必要的条件.OFVF使用值函数的结构来优化合理性集的位置和形状,以直接保证上限,而不必强制要求该集合为置信区间.OFVF收益以情节方式,其中剧集的持续时间是固定的并且是已知的。我们的算法本质上是贝叶斯算法,可以利用先验信息。我们的理论分析显示了OFVF的稳健性,实证结果证明了它的实际前景。
translated by 谷歌翻译
这是Kaggle数据竞赛'Predict futuresales'的方法报告。在本文中,我们提出了一种基于特征工程,随机森林回归和整体学习的未来销售预测的相当简单的方法。它的性能超过了许多传统方法,最终得分为0.88186,代表了均方根误差。截至本文撰写时,我们的模型在排行榜上排名第五。 (至8.5.2018)
translated by 谷歌翻译
大多数当前的语音增强模型使用频谱图特征,其需要昂贵的变换并导致相位信息丢失。以前的工作通过使用卷积网络来学习跨高分辨率波形的长时间相关性来克服这些问题。然而,这些模型受到来自上采样的存储器密集的扩张卷积和混叠伪像的限制。我们引入了端到端全反复沙漏形神经网络架构,其具有用于基于波形的单通道语音增强的剩余连接。我们的模型可以通过在没有信息损失的情况下降低特征分辨率来有效地捕获长期时间依赖性。实验结果表明,我们的模型在六个评估指标中优于最先进的方法。
translated by 谷歌翻译