传统的无监督域自适应(UDA)假设训练数据是从单个域采样的。这忽略了从多个来源收集的更实际的场景训练数据,需要多源域适应。我们为解决这一问题做出了三大贡献。首先,我们提出了一种新的深度学习方法,即多源域自适应的时间匹配M3SDA,旨在通过动态调整其特征分布的时刻,将从多个标记源域学到的知识转移到未标记的目标域。其次,我们为多源域适应的矩相关误差界提供了合理的理论分析。第三,我们收集并注释了迄今为止最大的UDAdataset六个不同的域和大约60万个图像分布在345个类别中,解决了多源UDA研究中数据可用性的差距。进行了广泛的实验,以证明我们提出的模型的有效性,该模型大大优于现有的最先进的方法。
translated by 谷歌翻译
Heterogeneous network embedding (HNE) is a challenging task due to the diverse node types and/or diverse relationships between nodes. Existing HNE methods are typically unsupervised. To maximize the profit of utilizing the rare and valuable supervised information in HNEs, we develop a novel Active Heterogeneous Network Embedding (Ac-tiveHNE) framework, which includes two components: Discriminative Heterogeneous Network Embedding (DHNE) and Active Query in Heterogeneous Networks (AQHN). In DHNE, we introduce a novel semi-supervised heterogeneous network embedding method based on graph convolutional neu-ral network. In AQHN, we first introduce three active selection strategies based on uncertainty and representativeness, and then derive a batch selection method that assembles these strategies using a multi-armed bandit mechanism. ActiveHNE aims at improving the performance of HNE by feeding the most valuable supervision obtained by AQHN into DHNE. Experiments on public datasets demonstrate the effectiveness of ActiveHNE and its advantage on reducing the query cost.
translated by 谷歌翻译
真相发现是广泛的统计方法的通用名称,旨在根据来自嘈杂来源的多个答案提取正确的问题答案。例如,众包平台中的工作人员。在本文中,我们设计了由\ emph {proxyvoting}启发的简单真理发现方法,这些方法对那些答案接近其他工作者的工人给予更高的权重。我们证明,在标准统计假设下,基于代理的真实发现(\ PTD)允许我们估计每个工人的真实能力,工人是否面临问题,其答案是真实的,分类的,orrankings。然后,我们通过对合成和真实数据的广泛实证研究证明,PTD比未加权聚合要好得多,并且在所有上述领域中与其他真实发现方法竞争良好。
translated by 谷歌翻译
随着神经网络开始执行越来越重要的任务,从驾驶汽车到确定药物开发的候选人,他们在预测中执行不确定性量化(UQ)的能力的价值已经相应增加。永久性丢失,神经网络UQ的apopular方法,涉及将随机性注入模型的推理阶段并为每个测试数据创建许多预测。这将深度神经网络的计算和能量负担从训练阶段转移到推理阶段。最近的工作证明了经典的深度神经网络向它们的尖峰对象的无损转换。我们使用这些结果来证明在尖峰神经网络上进行永久性丢失的推理阶段的可行性,减轻了技术的计算和能量负担,这对于其在规模或边缘平台上的使用是必不可少的。我们通过Nengo尖峰神经模拟器展示了针对癌症治疗的组合药物治疗数据集的提议方法,其中UQ是关键的。我们的结果表明,尖峰近似给出的预测分布实际上与经典网络给出的预测分布不同。
translated by 谷歌翻译
我们介绍了一组九个挑战任务,测试理解功能词。这些任务是通过结构化突变数据集的句子来创建的,以便能够理解特定类型的功能词(例如,介词,wh-words)。使用这些探测任务,我们探索了各种预训练目标对句子编码器(例如,语言建模,CCG超级标准和自然语言推理(NLI))对学习代表的影响。我们的结果表明,对CCG进行预训练 - 我们最常用的语法 - 在我们的探究任务中平均表现最佳,这表明句法知识有助于词汇理解。语言建模也显示出强大的性能,支持其广泛用于预训练最先进的NLP模型。总的来说,没有预训练目标支配董事会,我们的功能词探测任务突出了预训练目标之间的几个直观差异,例如,NLI有助于理解否定。
translated by 谷歌翻译
本文提出了一种新的基于深度学习的方法,可以同时校准鱼眼镜头的内在参数并纠正失真图像。假设鱼眼投影产生的畸变线在整流后应该是直的,我们提出了一种新颖的深度神经网络,将明确的几何约束强加到鱼眼镜头校准和失真图像校正的过程中。另外,考虑到鱼眼图像中失真分布的非线性,提出了多尺度感知,以均衡整个图像的整形效果。为了训练和评估所提出的模型,我们还创建了一个新的大规模数据集,该数据集标有相应的失真参数和带注释的失真线。与最先进的方法相比,我们的模型在大量合成和真实鱼眼图像上实现了最佳的公布整流质量和最准确的畸变参数估计。
translated by 谷歌翻译
化学反应的实用性是所有基于符号智能的化学信息处理的核心任务,例如,它为进一步的自动合成路径推断提供了必不可少的线索。考虑到化学反应已经以语言形式表示,我们提出了一种新的解决方案,通常可以在不考虑复杂的量子物理模型或化学知识的情况下判断有机反应的实用性。在将实际判断作为机器学习任务从正面和负面(化学反应)样本中解决的同时,所有现有研究都必须仔细处理负面样本上的这些不足问题。我们提出了一种自动构建方法来很好地解决广泛存在的长期困难。实验结果表明,该模型能够有效预测化学反应的实际性,在实际大型化学实验室反应实用性判断中达到99.76%的高精度。
translated by 谷歌翻译
任意属性编辑通常可以通过组合编码器 - 解码器和生成对抗网络来解决。然而,编码器 - 解码器中的瓶颈层通常会导致模糊和低质量的编辑结果。并且添加跳过连接以降低属性操作能力为代价提高了图像质量。此外,现有方法利用目标属性向量来引导灵活翻译到期望的目标域。在这项工作中,我们建议从选择性转移的角度解决这些问题。考虑到特定的编辑任务肯定只与更改的属性而不是所有目标属性相关,我们的模型选择性地将目标和源属性向量之间的差异作为输入。此外,选择性传输单元与编码器 - 解码器结合以自适应地选择和修改编码器特征以用于增强的属性编辑。实验表明,我们的方法(即STGAN)同时提高了属性操作的准确性以及感知质量,并且在任意的面部属性编辑和季节翻译中有利地对抗了现有技术。
translated by 谷歌翻译
Object segmentation and object tracking are fundamental research area in the computer vision community. These two topics are diicult to handle some common challenges, such as occlusion, deformation, motion blur, and scale variation. The former contains heterogeneous object, interacting object, edge ambiguity, and shape complexity. And the latter suuers from diiculties in handling fast motion, out-of-view, and real-time processing. Combining the two problems of video object segmentation and tracking (VOST) can overcome their respective diiculties and improve their performance. VOST can be widely applied to many practical applications such as video summarization, high deenition video compression, human computer interaction, and autonomous vehicles. This article aims to provide a comprehensive review of the state-of-the-art tracking methods, and classify these methods into diierent categories, and identify new trends. First, we provide a hierarchical categorization existing approaches, including unsupervised VOS, semi-supervised VOS, interactive VOS, weakly supervised VOS, and segmentation-based tracking methods. Second, we provide a detailed discussion and overview of the technical characteristics of the diierent methods. Third, we summarize the characteristics of the related video dataset, and provide a variety of evaluation metrics. Finally, we point out a set of interesting future works and draw our own conclusions. Additional Key Words and Phrases: Video object segmentation, object tracking, unsupervised methods, semi-supervised methods, interactive methods, weakly supervised methods ACM Reference format:
translated by 谷歌翻译
变分自动编码器(VAE)已经在图像生成方面取得了很好的成果,并且最近在音乐生成方面取得了很大的进步。然而,在所学习的潜在表征缺乏有意义的音乐语义的意义上,生成过程仍然很难控制。如果人们可以通过潜在表示修改某些音乐特征(例如节奏音高轮廓)来测试不同的组合物,那将会更有用。在本文中,我们提出了一种新方法来检查潜在表征的音高和节奏偏差,并将其命名为解构。基于可解释的表示,设计了直观的图形用户界面,以便用户通过操纵音高轮廓和节奏复杂度来更好地指导音乐创作过程。
translated by 谷歌翻译