群体重新识别(G-ReID)是一项重要但研究较少的任务。其挑战不仅在于在一般人重新识别(ReID)中进行过调查的个体的外观变化,而且还来自于群体布局和成员变化。因此,G-ReID的关键任务是学习对这些变化具有鲁棒性的代表性。为了解决这个问题,我们提出了一个传输的单一和夫妻代表学习网络(TSCN)。其中有两个方面:1)由于缺乏标记的训练样本,现有的G-ReID方法主要依赖于手工制作的不令人满意的特征。考虑到深度学习模型的优越性,我们将一个组视为多个人,并将标记的ReID数据集的域转换为G-ReID targetdataset样式以学习单个表示。 2)考虑到群体中的邻居关系,我们进一步提出在两个群体成员之间学习一种新的代表性,这在G-ReID任务中实现了更强的判断力。另外,利用无监督的权重学习方法根据结果模式自适应地融合不同视图的结果。广泛的实验结果证明了我们的方法的有效性,其显着优于道路组数据集上11.7%CMC-1和DukeMCMT数据集上39.0%%CMC-1的最新方法。
translated by 谷歌翻译
大多数人重新识别(ReID)方法假设人图像在相对相似的照明条件下被捕获。实际上,长期人物检索是常见的,并且人物图像在一天中的不同时间在不同的照明条件下被捕获。在这种情况下,现有ReID模型的性能经常会急剧下降。本文讨论了照明变化的ReID问题,并将其命名为{\ em Illumination-Adaptive Person Re-identification(IA-ReID)}。我们提出了照明 - 身份解构(IID)网络,以区分不同的照明区域,同时保留个体的身份信息。为了演示照明问题并评估我们的网络,我们构建了两个具有广泛照明变化的大规模模拟数据集。模拟数据集和现实世界图像的实验结果证明了所提框架的有效性。
translated by 谷歌翻译
使用卷积神经网络(CNN)进行准确的计算机辅助诊断需要大规模注释的训练数据,这与专家医生的耗时劳动相关;因此,使用GenerativeAdversarial Networks(GAN)的数据增强(DA)在医学成像中是必不可少的,因为它们可以合成额外的注释训练数据来处理来自各种扫描仪的小的和碎片化的医学图像;这些图像是真实的,但与原始图像完全不同,填补了真实图像分布中缺乏的数据。作为教程,本文介绍了基于GAN的医学图像增强的背景,以及基于我们的经验经验和相关工作实现高分类/对象检测/分割性能的技巧。此外,我们使用自动边界框注释显示我们的第一个基于GN的DA工作,用于在256 x 256 MR图像上进行稳健的基于CNN的脑转移检测;基于GAN的DA可以提高10%的诊断敏感度,临床上可接受的额外假阳性,即使是高度粗糙和不一致的边界框。
translated by 谷歌翻译
扩散通常用作检索任务中的排序或重新排序方法以实现更高的检索性能,并且近年来引起了许多关注。扩散的一个缺点是它与天真的k-NN搜索相比表现缓慢,这导致大型数据集的非平凡的在线计算成本。为了克服这个缺点,我们在本文中提出了一种新的扩散技术。在我们的工作中,我们不是对查询应用扩散,而是预先计算数据库中每个元素的扩散结果,使在线搜索在k-NN搜索过程之上成为一个简单的线性组合。我们提出的方法在在线搜索速度方面变得快10倍。此外,我们建议在以前的工作中使用延迟截断而不是早期截断来实现更好的检索性能。
translated by 谷歌翻译
现有的近似最近邻搜索系统遭受两个基本问题,这些问题具有实际重要性,但尚未得到研究界的充分关注。首先,尽管存在系统对整个数据库表现良好,但难以在数据库的子集上运行搜索。其次,在系统中新添加了许多项目之后,没有讨论性能下降。我们开发了一个可重构的倒排索引(Rii)来解决这两个问题。基于标准的IVFADC系统,我们设计了一个数据布局,使得itemsare线性存储。如果子集的大小很小,这使我们能够通过将搜索方法切换到线性PQ扫描来有效地运行子集搜索。由于线性布局,数据结构可以在添加新项目后动态调整,从而保持系统的快速速度。大量的比较表明,Rii与Faiss等最先进的系统实现了相当的性能。
translated by 谷歌翻译
由于对象检测技术的成功,我们甚至可以从巨大的图像集合中检索指定类的对象。然而,当前最先进的对象检测器(例如更快的R-CNN)只能处理预先指定的类。此外,培训需要大量的正面和负面样本。在本文中,我们解决了开放词汇对象检索和定位的问题,其中目标对象由文本查询(例如,单词或短语)指定。我们首先提出了Query-Adaptive R-CNN,它是一种适用于开放式词汇查询的快速R-CNN的简单扩展,它通过将文本嵌入向量转换为对象分类器和本地化回归器。然后,为了区别性训练,我们然后提出消极短语增强(NPA)来挖掘硬判断样本,这些样本在视觉上类似于查询并且同时在语义上与查询互斥。所提出的方法可以高精度地仅在0.5秒内从一百万个图像中检索和定位由文本查询指定的对象。
translated by 谷歌翻译
对抗攻击和防御的开发技术是建立可靠机器学习及其应用的重要研究领域。许多现有方法采用高斯随机变量来探索数据空间,以找到最具对抗性(攻击性)或最少对抗性(防御性)点。然而,当要求探索遵循大多数现实世界数据分布所展示的复杂结构时,高斯分布不一定是最佳选择。在本文中,我们研究了随机变量的统计数据如何影响这种随机的walkepploration。具体来说,我们概括了边界攻击,最先进的基于黑盒决策的攻击策略,并提出了L''evy-Attack,其中随机游走由对称的$ \ alpha $ -stablerandom变量驱动。我们对MNIST和CIFAR10数据集的实验表明,L \'evy-Attack可以更有效地探索图像数据空间,并显着提高性能。我们的结果还可以深入了解白盒攻击场景中最近发现的事实,即选择用于测量对抗模式幅度的标准是必不可少的。
translated by 谷歌翻译
在Wu等人的关于“使用变分自回归网络求解统计力学”的评论中,我们提出了一种微妙但强有力的修正方法。我们证明了他们的方法的固有抽样误差可以通过使用基于神经网络的MCMC或重要性抽样来校正,这导致了物理量的渐近无偏估计。由于VAN的奇异特性,这种修改是可能的,即它们提供精确的样本概率。通过这些修改,我们相信他们的方法可能对各种重要的物理领域产生更大的影响,包括强相互作用理论和统计物理学。
translated by 谷歌翻译
NISQ(噪声,中等规模量子)计算需要缓解错误才能实现有意义的计算。我们的编译工具开发侧重于各个量子位的错误率不相等的事实,其目标是最大化现实世界子程序(例如加法器电路)的成功概率。我们首先建立一个度量标准,用于选择可能的路径和电路替代方案,以便在处理器中放置的变量之间执行门,并在两个IBM 20-qubit系统上命名为Tokyo和Poughkeepsie。我们发现描述单个门的保真度的单数量度量是一个有用但不完美的指南。我们编译了这个子系统,并使用基于beamsearch的启发式将完整的电路映射到机器上,该启发式将随着处理器和程序大小的增长而扩展。为了评估整个编译过程,我们编译并执行了addercircuits,然后计算了KL-散度(两个概率分布之间距离的度量)。对于硬件功能范围内的电路,我们的编译增加了估计的成功概率,并相对于错误不经意的放置减少了KL-发散。
translated by 谷歌翻译
黑盒离散优化(BBDO)出现在广泛的工程任务中。已经应用了进化或其他BBDO方法,旨在自动化系统参数的必要调整,例如当针对特定任务安装时基于机器学习的系统的超参数调整。但是,自动化通常会受到BBDO算法的策略参数调整需求的影响。具有领域知识的专家必须进行耗时的策略参数调整。本文提出了一种基于信息几何优化的无参数BBDO算法,利用随机自然梯度进行黑盒优化的上行框架。在理论意义的基础上,我们开发了离散搜索域随机自然梯度法策略参数的自适应机制。所提出的算法在常用的测试问题上进行评估。它进一步扩展到深度学习模型的超参数和连接权重的同时优化的两个示例,导致比现有方法更快的优化而没有任何参数调整。
translated by 谷歌翻译