在本文中,我们专注于面部表情翻译任务,并提出一个新的表达式条件GAN(ECGAN),它可以学习基于一个额外的表达属性从一个图像域到另一个图像域的映射。所提出的ECGAN是通用框架,并且适用于不同的表达生成任务,其中特定的面部表情可以通过条件属性标签容易地控制。此外,我们还介绍了一种新颖的面膜,以减少背景变化的影响。此外,我们提出了在野外进行面部表情生成和识别的整个框架,其包括两个模块,即生成和识别。最后,我们在几个公共面部数据集上评估我们的框架,其中主体具有不同的种族,光照,遮挡,姿势,颜色,内容和背景条件。尽管这些数据集非常多样化,但定性和定量结果都表明我们的方法能够准确,稳健地生成面部表达。
translated by 谷歌翻译
本文提出了一种卷积神经网络向后传播的分数阶梯度法。为了克服分数阶梯度法不能收敛到实际极值点的问题,基于Caputo的定义设计了简化的分数阶梯度法。层内的参数由设计的梯度方法更新,但层之间的传播仍然使用整数阶梯度,因此避免了复合函数的复杂导数,并保留链规则。通过串联连接每个层并增加损失函数,可以根据各种任务顺利地训练所提出的卷积神经网络。为了最终证明神经网络的有效性,进行了一些实际的实验。
translated by 谷歌翻译
基于深度学习的方法已经在分类,检测,分割等无关紧要的任务方面取得了重大进展。众所周知,通过组合多个互补模型,集成学习可以进一步提高性能。例如,基于平均,投票或其他方法,很容易应用集成学习进行分类任务。但是,对于其中输出数量不变且无法简单比较的其他任务(如对象检测),多模型的集合变得困难。在本文中,我们提出了一种新的方法,称为预测集成学习(PEL),基于深度神经网络的强大预测能力,直接预测每个测试实例的基础模型的最佳表现模型,从而将集成学习转化为传统的分类任务。将场景文本检测作为应用,在没有合适的集成学习策略的情况下,与单个最先进的模型相比,PEL可以显​​着提高性能,或者通过非最大压缩来融合多个模型。实验结果表明PEL仅基于查询示例预测不同模型性能的可能性和潜力,可以扩展到许多其他复杂任务中的集成学习。
translated by 谷歌翻译
合作在多智能体强化学习(MARL)中至关重要。在交通信号控制的背景下,交通信号控制之间的良好合作使得车辆能够更加顺畅地通过交叉口。传统的交通方式通过预先计算两个交叉口之间的偏移来实现合作。这种预先计算的偏移量不适用于动态交通环境。为了结合促进学习(RL)中的合作,提出了两种典型的方法来考虑其他因素的影响:(1)学习通信(即代理之间的影响的表示)和(2)学习代理的联合。尽管在最近的研究中联合行动模型已经显示出一种优选的趋势,但是在交通信号控制的背景下,尚未系统地研究改进药剂之间通信学习的深入研究。为了学习代理之间的通信,在本文中,我们建议使用图注意网络来促进合作。具体来说,对于网络中的目标交叉点,我们提出的模型CoLight不仅可以结合邻近交互的影响,还可以学会将它们的影响区分为目标交叉点。据我们所知,我们是第一个在交通信号控制强化学习环境中使用graphattentional网络的人。在实验中,我们通过学习通信证明,所提出的模型可以获得令人惊讶的良好性能,而基于联合动作建模的现有方法无法很好地学习。
translated by 谷歌翻译
面部地标定位是众多面部相关应用中非常关键的一步,例如面部识别,面部姿势估计,面部图像合成等。然而,之前的面部地标定位竞赛(即300-W,300-VW和Menpo挑战)旨在预测68点地标,这些地标无法描述面部构件的结构。为了克服这个问题,我们构建了一个具有挑战性的数据集,名为J-landmark。每个图像都用106点地标手动注释。这个数据集涵盖了姿势和表情的大变化,这给预测准确的地标带来了很多困难。我们与IEEE国际多媒体和博览会(ICME)2019一起在该数据集上举办了一场106点的面部地标定位竞赛1。本次比赛的目的是发现有效而强大的面部地标定位方法。
translated by 谷歌翻译
基于Swarm的搜索长期以来一直是一个热门话题。在所有提出的算法中,由于L \'{e} vyflight,本地搜索功能和有保证的全局收敛的结合,Cuckoo搜索(CS)已被证明是全局最优搜索的有效方法。 CS使用L \'{e} vy航班,这些航班是从L \'{vy vy分布,aheavy-tailed概率分布,在全球随机游走中生成的,用于探索这些空间。在这种情况下,更有可能生成大步骤,这在增强搜索能力方面发挥着重要作用。虽然许多觅食者和流浪动物的运动已被证明可以遵循L \'{e}分布,但是对于不同的重尾概率分布对CS的影响的调查至今仍然不够充分。本文研究了四种不同类型的常用重尾分布,包括:标签 - 莱弗勒分布,帕累托分布柯西分布和威布尔分布,以提高CS的搜索能力。然后提出了四种新的CS算法并进行了实验。 on20基准测试功能,以比较他们的搜索性能。最后,将所提出的方法用于系统识别以证明其有效性。
translated by 谷歌翻译
自然语言推理(NLI)是自然语言理解中最具挑战性的任务之一。最近关于无监督预训练的研究表明,对语言模型和句子预测目标等无监督信号的研究已经证明对广泛的NLP问题非常有效。仍然需要进一步了解它如何帮助NLI;例如,如果它在数据注释中产生了人工制品,或者代之以学习真正的推理知识。此外,在有限数量的NLI训练数据中不存在的外部知识可以以两种典型方式添加到NLI模型中,例如,来自人类创建的资源或者无人监督的预训练范式。我们在这里进行了几项实验来调查它们是否以相同的方式帮助NLI,如果不是,如何?
translated by 谷歌翻译
在用户在电子商务中做出购买决定之前,用户通常会遇到许多与产品相关的问题。然而,检查用户评论以识别所需信息通常是耗时的。在本文中,我们提出了一个新颖的评论驱动框架,用于在电子商务中产品相关问题的答案生成,名为RAGE。我们在多层卷积结构的基础上开发了RAGE,以便利用并行计算加速应答。对于每个问题,RAGE都会从相应产品的评论中描述相关的评论片段。然后,我们设计了一种机制,从易于发现噪音的审查片段中识别相关信息,并将这些信息纳入指导这一代。对两个真实世界的电子商务数据集的实验表明,提出的RAGE明显优于现有的替代品,在自然语言中产生更准确和信息丰富的答案。此外,RAGE在现有的基于RNN的生成模型上进行模型训练和答案生成所花费的时间要少得多。
translated by 谷歌翻译
在本文中,我们研究了基于GNN(Graph NeuralNetwork)的求解器和基于GNN的启发式学习指定QBF(QuantifiedBoolean Formula)问题的可行性。我们为2QBF公式设计和评估了几个GNN架构,并推测GNN在学习2QBFsolvers方面存在局限性。然后我们将展示如何学习启发式CEGAR 2QBF求解器。我们进一步探讨了将基于GNN的启发式概括为更大的看不见的实例,并揭示了一些有趣的挑战。总之,本文提供了将GNN嵌入应用于指定QBFsolvers的综合测量观点,旨在为将ML应用于更复杂的符号推理问题提供指导。
translated by 谷歌翻译
最近多样化的移动应用程序的涌现,尤其是人工智能(AI)所支持的,正在引发关于无线通信未来发展的激烈讨论。虽然5G正在全球范围内部署,但工业界和学术界的努力已开始超越5G并将6G概念化。我们设想6G将进行前所未有的转换,这将使其与之前的无线蜂窝系统产生显着不同。特别是,6G将超越移动互联网,并将需要支持从核心到网络终端设备的无处不在的AI服务。同时,AI将在设计和优化6G架构,协议和操作方面发挥关键作用。在本文中,我们讨论了6G的潜在技术,以实现移动AI应用,以及支持AI的6G网络设计和优化方法。还将讨论向6G演变的主要趋势。
translated by 谷歌翻译