群体重新识别(G-ReID)是一项重要但研究较少的任务。其挑战不仅在于在一般人重新识别(ReID)中进行过调查的个体的外观变化,而且还来自于群体布局和成员变化。因此,G-ReID的关键任务是学习对这些变化具有鲁棒性的代表性。为了解决这个问题,我们提出了一个传输的单一和夫妻代表学习网络(TSCN)。其中有两个方面:1)由于缺乏标记的训练样本,现有的G-ReID方法主要依赖于手工制作的不令人满意的特征。考虑到深度学习模型的优越性,我们将一个组视为多个人,并将标记的ReID数据集的域转换为G-ReID targetdataset样式以学习单个表示。 2)考虑到群体中的邻居关系,我们进一步提出在两个群体成员之间学习一种新的代表性,这在G-ReID任务中实现了更强的判断力。另外,利用无监督的权重学习方法根据结果模式自适应地融合不同视图的结果。广泛的实验结果证明了我们的方法的有效性,其显着优于道路组数据集上11.7%CMC-1和DukeMCMT数据集上39.0%%CMC-1的最新方法。
translated by 谷歌翻译
计算颜色恒定性是指场景照明的估计并且使得感知的颜色在变化照明下相对稳定。在过去几年中,深度卷积神经网络(CNN)在光源估计方面提供了卓越的性能。通过使用CNN学习图像块的局部外观,几种表示方法将其表示为多标签预测问题。然而,这些方法不可避免地对受其邻域背景影响的模糊斑块进行不正确的估计。当结合到全局预测中时,不准确的局部估计可能会导致性能下降。针对上述问题,我们提出了一种基于补丁的光源估计的上下文深度网络,该网络具有细化性。首先,具有中心环绕架构的上下文网络从图像补丁中提取局部上下文特征,并生成初始光源估计和相应的颜色校正补丁。基于观察到具有大的色差的像素良好地描述照明,对斑块进行采样。然后,细节网将输入的补丁与校正的补丁集成,并与中间特征的使用相结合,以提高性能。为了训练这样一个具有众多参数的网络,我们提出了一种阶段性的训练策略,其中特征和预测的光源是相当的。提供给下一个学习阶段的阶段,恢复更精细的评估。实验表明,我们的方法在两个光源估算基准上获得了竞争性能。
translated by 谷歌翻译
通过开发复杂的图像先验或设计深(er)架构,最近提出了各种图像超分辨率(SR)方法并且实现了非常有前途的性能。一个自然的问题是,这些方法是否可以重新形成一个统一的框架,这个框架是否有助于SR重建?在本文中,我们提出了一种基于集成学习的简单但有效的单图像SR方法,该方法可以产生比从任何SR方法(或称为组件超级解析器)获得的更好的性能。基于在执行SR重建时更好的组件超级解析器应该具有更大的集合权重的假设,我们提出了用于推断最优集合权重的最大后验(MAP)估计框架。特别地,我们引入了一个参考数据集,它由高分辨率(HR)和低分辨率(LR)图像对组成,用于测量不同组件超级分辨率的超分辨率能力(先验知识)。为了获得optimalesesemble权重,我们建议结合重建约束,其表明退化的HR图像应该等于LRobservation的权重,以及集合权重的先验知识到MAP估计框架中。此外,所提出的优化问题可以通过分析解决方案来解决。我们通过与不同的竞争方法进行比较来研究所提出方法的性能,包括基于最先进的非深度学习方法,四种最新的基于深度学习的方法和一种基于集成学习的方法,并证明它在三个公共数据集上的有效性和优越性。 。
translated by 谷歌翻译
大多数人重新识别(ReID)方法假设人图像在相对相似的照明条件下被捕获。实际上,长期人物检索是常见的,并且人物图像在一天中的不同时间在不同的照明条件下被捕获。在这种情况下,现有ReID模型的性能经常会急剧下降。本文讨论了照明变化的ReID问题,并将其命名为{\ em Illumination-Adaptive Person Re-identification(IA-ReID)}。我们提出了照明 - 身份解构(IID)网络,以区分不同的照明区域,同时保留个体的身份信息。为了演示照明问题并评估我们的网络,我们构建了两个具有广泛照明变化的大规模模拟数据集。模拟数据集和现实世界图像的实验结果证明了所提框架的有效性。
translated by 谷歌翻译
以最少的试验次数合成先进的无机材料对于加速无机材料的开发至关重要。现有的多变量合成方法所涉及的巨大复杂性导致了高度的不确定性,大量的试验和过高的成本。最近,机器学习(ML)已经展示了巨大的潜在的形态研究。在这里,我们报告了ML在两个有代表性的多变量系统中优化和加速材料合成过程的应用。建立了化学气相沉积生长的MoS2的分类ML模型,能够优化合成条件以实现更高的成功率。在水热合成的碳量子点上构建回归模型,以增强与光致发光量子产率等工艺相关的性质。进一步开发了渐进式自适应模型,旨在将ML纳入新材料合成的开始阶段。通过有效的反馈回路可以实现最小化试验的实验结果的优化。这一工作作为概念的证明,揭示了ML促进无机材料合成的可行性和卓越的能力,并为加速材料开发开辟了新的窗口。
translated by 谷歌翻译
在本文中,我们提出了一种新的框架来检测人造环境中的线段。具体而言,我们建议用简单的图形来描述它们之间的连接点,关联点和关系,这比现有的中文检测方法中使用的端点表示更具结构性和信息性。为了从图像中提取线段图,我们进一步介绍了PPGNet,一种卷积神经网络,可以直接从图像中推断图形。我们在已发布的基准测试上评估我们的方法,包括York Urban和Wireframe数据集。结果表明,我们的方法取得了令人满意的性能,并在所有基准上得到了很好的推广。我们的工作源代码可在\ url {https://github.com/svip-lab/PPGNet}上找到。
translated by 谷歌翻译
乳腺癌是最常见的侵袭性癌症,女性癌症发生率最高。手持式超声是鉴别和诊断乳腺癌的最有效方法之一。病变的面积和形状信息对临床医生做出诊断决定非常有帮助。在这项研究中,我们提出了一种新的深度学习方案,半像素循环生成对侧网(SPCGAN),用于在2D超声中分割病变。该方法利用完全连接的卷积神经网络(FCN)和生成性对抗网络的优点,通过使用先验知识来对病变进行分割。我们将所提出的方法与完全连接的神经网络和水平集分割方法进行比较,测试数据集包括32个恶性病变和109个良性病变。我们提出的方法实现了0.92的Dice相似系数(DSC),而FCN和水平集分别达到0.90和0.79。特别是对于恶性病变,我们的方法将完全连接的神经网络的DSC(0.90)显着增加到0.93(p $ <0.001)。结果表明我们的SPCGAN可以获得稳健的分割结果,并可能用于减轻放射科医生的负担用于注释。
translated by 谷歌翻译
为图形结构数据设计的卷积运算通常利用拉普拉斯图,它可以看作是通过通用随机游走在相邻邻居之间传递的消息。在本文中,我们提出PAN,一种新的卷积框架,它涉及根据路径长度链接消息senderand接收器和可学习权重的每条路径,这对应于最大熵随机游走。 PAN将graphLaplacian概括为一个新的转移矩阵,我们称之为从路径积分形式派生出的\ emph {极大熵转换}(MET)矩阵。大多数先前的图形卷积网络体系结构可以适应我们的框架,并且可以开发出基于路径积分思想的多种变换和衍生物。实验结果表明,基于路径积分的图形神经网络具有很好的可学习性和快速的收敛速度,并且实现了状态。基准任务的艺术表现。
translated by 谷歌翻译
深度神经网络容易受到对抗性攻击。许多努力都集中在防御上,这些防御要么试图在经过训练的模型中修补“漏洞”,要么难以计算利用这些漏洞的对抗性例子。在我们的工作中,我们探索了一种反直觉的方法来构建“对抗性陷阱。与先前的作品不同,试图修补或掩盖流形中的脆弱点,我们故意注入”trapdoors“,歧管中的人为弱点将吸引优化的扰动吸引到某些预嵌入因此,对抗性生成功能自然地倾向于我们的陷阱,产生模型所有者可以通过已知的神经元激活签名识别的对抗性示例。在本文中,我们引入陷阱并描述使用类似策略的后门/特洛伊木马的实现我们通过主动将陷门注入模型(并提取其神经激活特征),我们可以检测到由现有技术攻击(投射梯度下降,基于CW优化和弹性网络)生成的对抗性示例,具有高检测成功率和对正常投入的影响可以忽略不计也可以概括多个分类域(图像识别,人脸识别和交通标志识别)。我们探索了活板门的不同属性,并讨论了潜在的对策(自适应攻击)和缓解措施。
translated by 谷歌翻译
颜色纹理表示是纹理分类任务中的重要一步。最短路径用于从RGB和HSV颜色空间中提取颜色纹理特征。在本文中,我们建议在HSI空间中使用最短路径来构建用于分类的纹理表示。特别地,两个无向图分别用于模拟H通道和S和I通道,以便表示颜色纹理图像。此外,根据纹理图像的不同尺度和方向,通过使用四对像素来构造最短路径。对Colod Brodatz和USPTex数据库的实验结果表明,我们提出的方法是有效的,在Brodatz数据库中最高的分类准确率为96.93%。
translated by 谷歌翻译