代理辅助进化算法(SAEAs)是计算成本高昂的问题(CEP)的强大优化工具。然而,由于没有免费的午餐定理,随机选择的算法可能无法解决未知问题,如果我们重新运行算法或尝试其他算法来获得更多解决方案,这将导致更多的计算资源,这在CEP中更为严重。在本文中,我们考虑SAEA的算法组合,以降低为CEP选择不适当算法的风险。我们提出了两个非常昂贵的问题的框架,其中最大数量的异常评估只是问题维度的5倍。一个名为Par-IBSAEA的框架并行运行所有候选算法,一个名为UCB-IBSAEA的更复杂的框架采用强化学习的上置信区(UCB)策略来帮助在每次迭代中选择最合适的算法。为UCB政策提出了有效的奖励定义。我们考虑了三个最先进的基于个体的SAEA,针对不同的问题,并将它们与基于几个基准问题的实例建立的组合进行比较,给出了有限的计算预算。 Ourexperimental研究表明,我们提出的投资组合框架在基准问题集合上显着优于任何单一算法。
translated by 谷歌翻译
我们提出了一种完全卷积的单级目标检测器(FCOS),以逐像素预测方式解决对象检测,类似于语义分割。几乎所有最先进的物体探测器,如RetinaNet,SSD,YOLOv3和Faster R-CNN都依赖于预定义的锚箱。相比之下,我们提出的探测器FCOS不需要锚箱,也可以免费提供。通过消除预定义的锚箱组,FCOS完全避免了与锚箱相关的复杂计算,例如计算重叠训练并显着减少训练记忆足迹。更重要的是,我们还避免了与锚箱相关的所有超参数,这些参数通常对最终检测性能非常敏感。通过唯一后处理非最大抑制(NMS),我们的探测器FCOS优于以前基于锚的一级探测器,具有更简单的优点。我们首次展示了一种更简单灵活的检测框架,可以提高检测精度。我们希望所提出的FCOS框架可以作为许多其他实例级任务的简单而强大的替代方案。
translated by 谷歌翻译
在实际系统中非常昂贵的问题是非常普遍的,因为一个适合的评估花费几个小时甚至几天。在过去的几十年中,替代辅助进化算法(SAEAs)已被广泛用于解决这一关键问题。然而,大多数研究的SAEA专注于解决问题,至少十倍的问题维度,这在许多非常昂贵的现实问题中是不可接受的。在本文中,我们使用Voronoidiagram来提高SAEA的性能,并提出一个新的框架,名为基于Voronoi的有效代理协助进化算法(VESAEA),用于解决非常昂贵的问题,其中优化预算在fitnessevaluations方面仅为5倍。问题的维度。在提议的框架中,Voronoi图将整个搜索空间划分为若几个子空间,然后本地搜索在一些可能的更好的子空间中运行。此外,为了权衡勘探和开发,该框架涉及通过组合一次性交叉验证和径向基函数替代模型而开发的全局搜索阶段。性能选择器旨在在全局和本地搜索阶段之间动态和自动切换搜索。各种基准问题的实证结果表明,所提出的框架显着优于具有极其有限的适应性评估的几种最先进的算法。此外,还进一步分析了Voronoi图的功效,结果表明它有可能优化非常昂贵的问题。
translated by 谷歌翻译
由于随着时间的推移,面部外观受到老化过程引起的显着的类内变化的影响,年龄不变的面部识别(AIFR)仍然是面部识别社区中的主要挑战。为了减少由衰老引起的类内差异,在本文中,我们提出了一种新方法(即,正交嵌入CNN或OE-CNN)来学习年龄不变的深部特征。具体而言,我们将深层特征分解为两个正交分量,以表示与年龄相关的特征和与身份相关的特征。因此,对于AIFR,使用对老化稳健的身份相关特征。此外,为了补充现有的跨年龄数据集并推进该领域的研究,我们构建了一个全新的大型跨年龄人脸数据集(CAF)。在三个公共领域面对老化数据集(MORPH Album 2,CACD-VS和FG-NET)上进行的大量实验已经证明了所提出方法的有效性以及构建的CAF数据集对AIFR的价值。在最流行的一般人脸识别(GFR)数据集LFW之一上对我们的算法进行基准测试,另外证明了在GFR上具有可比较的泛化性能。
translated by 谷歌翻译
我们将平面和规则域(例如2D图像)上的卷积神经网络(CNN)扩展到嵌入3D欧几里德空间中的曲面,这些曲面被分离为不规则网格,并广泛用于表示计算机视觉和图形中的几何数据。我们在表面域的切线空间上定义表面卷积,其中卷积具有两个期望的属性:1)表面域信号的偏差在被投影到切线空间时局部最小,以及2)平移等方差属性通过对齐而局部保持切线空间与规范的平行传输,保留度量。为了计算,我们依赖于表面上的并行N方向帧场,其最小化场变化,因此尽可能与并行传输兼容并近似。在装有平行框架的切线空间上,表面卷积的计算成为标准的例程。框架具有旋转对称性,我们通过构造由平行框架引起的表面覆盖空间并将特征图分组为N组来消除歧义;在覆盖空间的N个分支上使用相应的特征映射计算卷积,同时共享核心权重。为了在共享内核权重的同时处理离散网格的不规则点,我们使卷积半离散,即卷积内核是多项式函数,并且它们与离散表面点的卷积变为采样和加权求和。通过简化构建的网格层次计算池化和解池操作。所呈现的表面CNN允许对网格进行有效的深度学习。我们展示了对于分类,分割和非刚性配准的任务,仅使用原始输入信号的表面CNN比使用复杂输入特征的先前模型实现了优越的性能。
translated by 谷歌翻译
在本文中,我们专注于面部表情翻译任务,并提出一个新的表达式条件GAN(ECGAN),它可以学习基于一个额外的表达属性从一个图像域到另一个图像域的映射。所提出的ECGAN是通用框架,并且适用于不同的表达生成任务,其中特定的面部表情可以通过条件属性标签容易地控制。此外,我们还介绍了一种新颖的面膜,以减少背景变化的影响。此外,我们提出了在野外进行面部表情生成和识别的整个框架,其包括两个模块,即生成和识别。最后,我们在几个公共面部数据集上评估我们的框架,其中主体具有不同的种族,光照,遮挡,姿势,颜色,内容和背景条件。尽管这些数据集非常多样化,但定性和定量结果都表明我们的方法能够准确,稳健地生成面部表达。
translated by 谷歌翻译
执法部门或大众媒体机构经常需要面对隐瞒提供隐私保护。共享敏感内容,其中遮蔽或减少技术可能未能完全消除所有可识别的痕迹,可能导致危及生命的后果。因此,能够系统地测量给定技术的面部遮蔽性能是至关重要的。在本文中,我们建议测量三种模拟技术的有效性:高斯模糊,中值模糊和像素化。通过在两种情况下识别编辑的面部来进行编辑:将遮蔽的面部分类为一组身份,并将遮蔽的面部与清晰面部的相似性进行比较。威胁建模还被认为是为每种研究的遮蔽技术提供漏洞分析。基于ourevaluation,我们表明基于像素化的面部遮蔽方法是最有效的。
translated by 谷歌翻译
我们引入了像素对齐的隐式函数(PIFu),这是一种高效的隐式表示,可以将2D图像的像素与其对应的3D对象的全局上下文进行局部对齐。使用PIFu,我们提出了一种端到端深度学习方法,用于数字化高度详细的穿着人类,可以从单个图像和可选的多个输入图像中提取3D表面和纹理。高度复杂的形状,例如发型,衣服,以及它们的变形和变形可以以统一的方式数字化。与用于3D深度学习的现有表示相比,PIFu可以产生高分辨率表面,包括很大程度上看不见的区域,例如人的背面。特别地,与体素表示不同,它是存储器有效的,可以处理任意拓扑,并且所得到的表面在空间上与输入图像对齐。此外,虽然先前的技术被设计为处理单个图像或多个视图,但PIFu自然地延伸到任意数量的视图。我们从DeepFashion数据集展示了对真实世界图像的高分辨率和强大的重建,其中包含各种具有挑战性的服装类型。我们的方法在公共基准测试中实现了最先进的性能,并且优于单个图像的衣服人体数字化的先前工作。
translated by 谷歌翻译
面部解析,即为面部图像中的每个像素分配语义标签,最近由于其巨大的应用潜力而引起了越来越多的关注。尽管许多面部相关领域(例如,面部识别和面部检测)已经被很好地研究多年,但是现有的用于面部解析的数据集在尺度和质量方面仍然受到严格限制,例如,广泛使用的Helen数据集仅包含2,330个图像。这主要是因为像素级注释是一项成本高且耗时的工作,特别是对于没有明确边界的面部部位。缺乏准确的注释数据集成为面部解析任务进展的主要障碍。利用密集的面部标志来指导解析注释是一种可行的方法。然而,在人脸上注释密集的地标会遇到与解析注释相同的问题。为了克服上述问题,在本文中,我们开发了一个高效的faceparsing注释框架,它通过两个连续的模块大大简化和加速了解析注释。受益于拟议的框架,我们构建了一个新的Dense Landmark Guided Face Parsing(LaPa)基准。它包含22,000个面部图像,表情,姿势,遮挡等方面有很大变化。每个图像都提供了精确的11类像素级标签贴图注释以及106点标记的坐标。据我们所知,它是目前最大的面部解析publicdataset。为了充分利用具有丰富面形和边界先验的LaPa数据集,我们提出了一种简单而有效的边界敏感解析网络(BSPNet)。我们的网络被视为提议的LaPa数据集的基线模型,同时,它在Helen数据集上实现了最先进的性能,而无需借助于外部对齐。
translated by 谷歌翻译
计算颜色恒定性是指场景照明的估计并且使得感知的颜色在变化照明下相对稳定。在过去几年中,深度卷积神经网络(CNN)在光源估计方面提供了卓越的性能。通过使用CNN学习图像块的局部外观,几种表示方法将其表示为多标签预测问题。然而,这些方法不可避免地对受其邻域背景影响的模糊斑块进行不正确的估计。当结合到全局预测中时,不准确的局部估计可能会导致性能下降。针对上述问题,我们提出了一种基于补丁的光源估计的上下文深度网络,该网络具有细化性。首先,具有中心环绕架构的上下文网络从图像补丁中提取局部上下文特征,并生成初始光源估计和相应的颜色校正补丁。基于观察到具有大的色差的像素良好地描述照明,对斑块进行采样。然后,细节网将输入的补丁与校正的补丁集成,并与中间特征的使用相结合,以提高性能。为了训练这样一个具有众多参数的网络,我们提出了一种阶段性的训练策略,其中特征和预测的光源是相当的。提供给下一个学习阶段的阶段,恢复更精细的评估。实验表明,我们的方法在两个光源估算基准上获得了竞争性能。
translated by 谷歌翻译