群体重新识别(G-ReID)是一项重要但研究较少的任务。其挑战不仅在于在一般人重新识别(ReID)中进行过调查的个体的外观变化,而且还来自于群体布局和成员变化。因此,G-ReID的关键任务是学习对这些变化具有鲁棒性的代表性。为了解决这个问题,我们提出了一个传输的单一和夫妻代表学习网络(TSCN)。其中有两个方面:1)由于缺乏标记的训练样本,现有的G-ReID方法主要依赖于手工制作的不令人满意的特征。考虑到深度学习模型的优越性,我们将一个组视为多个人,并将标记的ReID数据集的域转换为G-ReID targetdataset样式以学习单个表示。 2)考虑到群体中的邻居关系,我们进一步提出在两个群体成员之间学习一种新的代表性,这在G-ReID任务中实现了更强的判断力。另外,利用无监督的权重学习方法根据结果模式自适应地融合不同视图的结果。广泛的实验结果证明了我们的方法的有效性,其显着优于道路组数据集上11.7%CMC-1和DukeMCMT数据集上39.0%%CMC-1的最新方法。
translated by 谷歌翻译
风格转移一直是计算机视觉和图形学中的一个重要课题。加蒂等人。首先证明由预先训练的VGG网络提取的深度特征代表图像的内容和样式特征,因此,可以通过特征空间中的优化来实现样式转移。黄等人。然后通过简单地对齐每个特征通道的均值和方差,表明实时任意样式转移可以发生变化。然而,在本文中,我们认为仅仅调整深度特征的全局统计数据并不总能保证良好的风格转移。相反,我们建议联合分析输入图像对并提取两者之间的共同/可交换的样式特征。此外,还开发了一种新的融合模式,用于在特征空间中结合内容和样式信息。定性和定量实验证明了我们的方法的优势。
translated by 谷歌翻译
在本文中,我们提出神经短语到短语机器翻译(NP $ ^ 2 $ MT)。我们的模型使用短语注意机制来发现解码器用来生成输出(目标)短语的相关输入(源)段。我们还设计了一种有效的动态编程算法来解码分段,这些分段允许比Huang等人现有的基于神经短语的机器翻译方法更快地训练模型。 (2018)。此外,我们的方法可以在解码期间自然地与外部短语词典集成。经验实验表明,我们的方法与基准数据集上的最新方法具有可比性。但是,当训练和测试数据来自不同的分布或域时,我们的方法表现更好。
translated by 谷歌翻译
自然语言生成(NLG)是面向任务的对话系统的重要组成部分。尽管近来NLG的神经方法取得了成功,但它们通常是针对具有丰富注释训练样本的特定域开发的。在本文中,我们在资源匮乏的环境中研究NLG,以便通过少量训练示例在新场景中生成句子。我们从元学习的角度阐述问题,并基于公认的模型不可知元学习(MAML)算法提出基于广义优化的方法(Meta-NLG)。 Meta-NLG定义了一组元代码,并直接将适应新的低资源NLG任务的目标纳入元学习优化过程。对具有多样性变化的大型多域数据集(MultiWoz)进行了广泛的实验。我们表明,Meta-NLG在各种低资源配置中明显优于其他方法。我们分析结果,并证明Meta-NLG适应极快和良好的资源情况。
translated by 谷歌翻译
解密潜在空间中的内容和风格是普通的文本风格转移。然而,在大多数当前神经模型中存在两个主要问题。 1)很难从句子的语义中完全剥离样式信息。 2)基于递归神经网络(RNN)的编码器和解码器,由潜在表示介导,不能解决长期依赖问题,导致非风格语义内容的保存。本文提出了风格变换器,它没有对潜在句子的潜在表现做出任何假设,并且配备了变形金刚注意机制的力量,以实现更好的风格转移和更好的内容保存。
translated by 谷歌翻译
事实证明,语言模型预训练对于学习通用语言表示非常有用。作为最先进的语言模型预训练模型,BERT(变形金刚的双向编码器表示)在许多语言理解任务中取得了惊人的成果。在本文中,我们进行了详尽的实验,以研究BERT在文本分类任务上的不同微调方法,并为BERTfine调整提供一般解决方案。最后,所提出的解决方案在八个广泛研究的文本分类数据集上获得了新的最新结果。
translated by 谷歌翻译
视觉定位是一个有吸引力的问题,它基于查询图像估计来自数据库图像的相似定位。它是各种应用的关键任务,例如自动驾驶汽车,辅助导航和增强现实。任务的挑战性问题在于查询和数据库图像之间的不同外观变化,包括照明变化,季节变化,动态对象变化和观点变化。为了应对这些挑战,本文提出了全景环形透镜和强大的深度图像描述符的全景环形定位器。处理由单个摄像机捕获的全景环形图像并将其馈送到NetVLAD网络中以形成活动的深度描述符,并且利用顺序匹配来生成定位结果。在公共数据集和现场进行的实验说明了所提出的系统的验证。
translated by 谷歌翻译
为了快速学习少量样本,元学习利用从先前任务中学到的知识。然而,在学习中学习的一个关键挑战是任务的不确定性和异质性,这是不能通过全局共享任务之间的知识来处理的。在本文中,基于基于梯度的元学习,我们提出了一种分层结构的学习(HSML)算法,该算法明确地将可转换知识定制到不同的任务集群。受人类组织知识的启发,我们采用分层任务聚类结构来完成任务。因此,所提出的方法不仅解决了通过知识定制对不同任务集群的挑战,而且还保留了类似任务集群之间的知识泛化。解决任务关系的变化,此外,我们将层次结构扩展到持续的学习环境。实验结果表明,我们的方法可以在二次回归和几次图像分类问题中实现最先进的性能。
translated by 谷歌翻译
我们引入了像素对齐的隐式函数(PIFu),这是一种高效的隐式表示,可以将2D图像的像素与其对应的3D对象的全局上下文进行局部对齐。使用PIFu,我们提出了一种端到端深度学习方法,用于数字化高度详细的穿着人类,可以从单个图像和可选的多个输入图像中提取3D表面和纹理。高度复杂的形状,例如发型,衣服,以及它们的变形和变形可以以统一的方式数字化。与用于3D深度学习的现有表示相比,PIFu可以产生高分辨率表面,包括很大程度上看不见的区域,例如人的背面。特别地,与体素表示不同,它是存储器有效的,可以处理任意拓扑,并且所得到的表面在空间上与输入图像对齐。此外,虽然先前的技术被设计为处理单个图像或多个视图,但PIFu自然地延伸到任意数量的视图。我们从DeepFashion数据集展示了对真实世界图像的高分辨率和强大的重建,其中包含各种具有挑战性的服装类型。我们的方法在公共基准测试中实现了最先进的性能,并且优于单个图像的衣服人体数字化的先前工作。
translated by 谷歌翻译
本文重点研究数据集的分层非重叠聚类问题。在这样的聚类中,每个数据项与一个叶子节点完全相关联,并且每个内部节点与存储在其下的子树中的所有数据项相关联,使得层次的每个级别对应于数据集的分区。我们开发了一种新的贝叶斯非参数方法,结合了嵌套的中餐厅过程(nCRP)和分层Dirichlet过程(HDP)。与其他现有的贝叶斯方法相比,我们的解决方案使用复杂的潜在混合特征处理数据,这在以前的文献中尚未探索过。我们讨论模型的细节和推理过程。此外,对三个数据集的实验表明,我们的方法实现了与现有算法相比较的可靠实证结果。
translated by 谷歌翻译