引入内在奖励来模拟人类智能如何运作,这通常通过内在动机的游戏来评估,即没有外在奖励的游戏,但是用外在奖励进行评估。然而,在这种非常具有挑战性的内在动机游戏环境下,现有的内在奖励方法都不能达到人类水平的表现。在这项工作中,我们提出了一种新颖的狂妄自大驱动的内在奖励(大奖励),据我们所知,这是第一种在内在动机游戏中实现可比较的人类表现的方法。超级奖励的出发来自于婴儿的智力在他们试图获得对环境中的实体的更多控制时的发展;因此,超级奖励旨在最大化特定环境中代理人的实体控制能力。为了形成大型奖励,提出了一种关系转换模型来弥合直接控制和潜在控制之间的差距。实验研究表明,超级奖励可以(i)大大超越最先进的内在奖励方法,(ii)通常达到与Ex-PPO和专业人类级别得分相同的表现水平; (iii)在与外在进展相结合时也具有优越的表现。
translated by 谷歌翻译
分层强化学习(HRL)最近显示出在加速学习,改进探索和发现任务可转移技能方面的有希望的进步。最近的工作集中在两个级别的HRL上,即主要政策操纵子政策,而子政策又操纵原始行为。然而,在许多现实世界的场景中通常需要具有多个级别的HRL,其最终目标是高度抽象的,而这些场景非常原始。因此,在本文中,我们提出了adiversity驱动的可扩展HRL(DEHRL),其中构建了可扩展和可扩展的框架,并逐级学习以实现具有多个级别的HRL.DEHRL遵循一个流行的假设:多种子策略是有用的,即,子策略被认为是如果它们更加多样化会更有用。然而,这种多样性假设的现有实现通常具有它们的owndrawbacks,这使得它们不适用于具有多个级别的HRL。因此,我们进一步提出了一种新的多样性驱动的解决方案以在DEHRL中实现该假设。实验研究从两个领域的四个角度评估DEHRL的五个基线;结果表明,DEHRL在所有四个方面都优于最先进的基线。
translated by 谷歌翻译
朦胧图像在实际场景中很常见,并且已经开发了许多去雾方法以自动从图像中去除雾度。通常,图像去雾的目标是产生更清晰的图像,人类视觉可以从中更好地识别图像中存在的对象和结构细节。当地面真实无雾图像可用于模糊图像时,图像去雾的定量评估通常基于客观度量,例如峰值信噪比(PSNR)和结构相似性(SSIM)。然而,在许多应用中,收集的大尺寸图像不是为了人类的视觉检查。相反,它们用于许多高级视觉任务,例如自动分类,识别和分类。这里的一个基本问题是各种去雾方法是否能够产生更清晰的图像,这有助于提高高级任务的性能。在本文中,我们通过使用合成和真实模糊图像数据集,在图像分类的重要任务中实证研究了这个问题。从实验结果可以看出,现有的图像去雾方法不能提高图像分类性能,有时甚至会降低图像分类性能。
translated by 谷歌翻译
以前的方法已经处理了面部属性的离散操作,例如微笑,悲伤,愤怒,惊讶等,超出规范表达,并且它们不可扩展,以单一模态操作。在本文中,我们提出了一个支持连续编辑的anovel框架和使用对抗性学习的多模态肖像操作。具体而言,我们通过利用额外的面部标记信息,使循环一致性适应条件设置。这有两个作用:第一周期映射引起双向操作和身份保持;因此可以利用来自不同模态的第二配对样本。为了确保高质量的合成,我们采用纹理损失来强化纹理一致性和多层次的逆向监控,以促进梯度流动。定量和定性实验表明我们的框架在执行具有照片效果效果的柔性和多模态肖像操作方面的有效性。
translated by 谷歌翻译
在本文中,我们专注于图像修复任务,旨在恢复给定上下文信息的不完整图像的丢失区域。最近在深度生成模型中的开发为图像合成和修复任务提供了有效的端到端框架,但是基于生成模型的现有方法没有利用分割信息来约束对象形状,这通常导致边界上的模糊结果。为了解决这个问题,我们提出引入语义分割信息,它解开了图像修饰中的类间差异和类内变异。这导致在语义上不同的区域之间更清晰的恢复边界以及在语义上一致的区段内更好的纹理。我们的模型将图像修复过程的内部分割预测(SP-Net)和分割引导(SG-Net)分解为两步,首先预测缺失区域中的分割标签,然后生成分割引导的修复结果。对多个公共数据集的实验表明,我们的方法在优化图像质量方面优于现有方法,并且交互式分割指导为图像绘制的多模态预测提供了可能性。
translated by 谷歌翻译
我们研究了图像修复的任务,即用可信的内容填充不完整图像的缺失区域。为此,我们提出了基于alearning的方法,在具有缺失组件的高分辨率图像的情况下生成视觉上连贯的完成。为了克服直接学习高维图像数据分布的困难,我们将任务分为推理和翻译两个独立的步骤,并用深度神经网络模拟每一步。我们还使用简单的启发式方法来指导局部纹理从边界到孔的传播。我们表明,通过使用这种技术,修复减少了在更小的空间中学习两个图像特征平移功能的问题,因此更容易训练。我们在几个公共数据集上评估我们的方法,并表明我们生成的视觉质量比以前最先进的方法更好。
translated by 谷歌翻译
全景视频通过让人类通过头部运动(HM)控制视野(FoV),提供身临其境的互动体验。因此,HM在人类对全景视频的关注建模中起着关键作用。这包括在全景视频序列中收集受试者HM的数据库。从该数据库中,我们发现HM数据是高度一致的acrosssubjects。此外,我们发现深度强化学习(DRL)可以应用于预测HM位置,通过最大化通过代理的动作模仿人类HP扫描路径的奖励。根据我们的研究结果,我们提出了一种基于DRL的HM预测(DHP)方法,该方法具有离线和在线版本,称为离线-DHP和在线-DHP。在离线-DHP中,运行多个DRL工作流程以确定每个全景帧处的潜在HM位置。然后,生成称为HM映射的潜在HM位置的热图作为离线-DHP的输出。在在线-DHP中,通过在学习的离线-DHP模型上开发DRL算法来估计当前观察到的HM位置的一个受试者的下一个HM位置。最后,实验验证了我们的方法在全景视频的HM位置的离线和在线预测中都是有效的,并且所学习的离线-DHP模型可以提高在线-DHP的性能。
translated by 谷歌翻译
由于不准确的检测和识别,自主车辆可能做出错误的决定。因此,智能车辆可以将自己的数据与其他车辆相结合,提高感知能力,从而提高检测精度和驾驶安全性。然而,多车协同感知要求现实世界场景的整合和原始传感器数据交换的流量远远超过现有车载网络的带宽。据我们所知,我们是第一个对原始数据级合作感知进行研究的人。提高自驾系统的检测能力。在这项工作中,依靠LiDAR 3D点云,我们完成了从连接车辆的不同位置和角度收集的传感器数据。提出了一种基于点云的三维物体检测方法,用于对齐点云的多样性。 KITTI和我们收集的数据集的实验结果表明,所提出的系统通过扩展感知区域优于感知,提高了检测精度并促进了增强结果。最重要的是,我们证明可以通过现有的车载网络技术传输用于协作感知的pointclouds数据。
translated by 谷歌翻译
图神经网络(GNNs)受到越来越多的关注,部分归功于它们在许多节点和图形分类任务中的优越性能。然而,对于它们的学习和学习图形功能的复杂性缺乏了解。在这项工作中,我们首先提出了图形特征网络(GFN),一个简单的轻量级神经网络,在一组图形增强特征上定义。然后,我们建议将图形分类上的GNN解剖为两部分:1)图形过滤,其中执行基于图形的邻域聚合;以及2)集合函数,其中组成一组隐藏节点特征用于预测。为了分别测试这两个部分的重要性,我们通过线性化GNN的图形过滤部分来证明和利用GFN可以导出的连接。根据经验,我们对常见的图表分类基准进行了评估。令我们惊讶的是,我们发现,尽管有简化,但GFN可以匹配或超过最近提出的GNN产生的最佳精度,只需要一小部分计算成本。我们的结果为GNN学习的功能和当前评估它们的基准提供了新的视角。
translated by 谷歌翻译
机器学习和计算机科学中的许多凸问题共享相同的形式:\ begin {align *} \ min_ {x} \ sum_ {i} f_i(A_i x + b_i),\ end {align *}其中$ f_i $是凸函数on $ \ mathbb {R} ^ {n_i} $,常数为$ n_i $,$ A_i \ in \ mathbb {R} ^ {n_i \ times d} $,$ b_i \ in \ mathbb {R} ^ {n_i} $和$ \ sum_i n_i = n $。这个问题推广了线性规划,包括许多问题,经验风险最小化。在本文中,我们给出了一个运行intime \ begin {align *}的算法O ^ *((n ^ {\ omega} + n ^ {2.5 - \ alpha / 2} + n ^ {2+ 1/6}) \ log(n / \ delta))\ end {align *}其中$ \ omega $是matrixmultiplication的指数,$ \ alpha $是矩阵乘法的双指数,$ \ delta $是相对精度。请注意,运行时只对条件数或其他数据相关参数具有对数依赖性,并且这些参数在$ \ delta $中捕获。对于当前绑定的$ \ omega \ sim 2.38 $ [Vassilevska Williams'12,Le Gall'14]和$ \ alpha \ sim 0.31 $ [Le Gall,Urrutia'18],我们的运行时$ O ^ *(n ^ {\ omega} \ log(n / \ delta))$匹配当前最佳解决密集最小二乘回归问题,这是我们考虑的问题的一个特例。最近,[Alman'18]证明了目前所有已知的技术都无法提供低于$ 2.168 $的更好的$ \ omega $,这比$ 2 + 1/6 $更大。我们的结果推广了当前矩阵乘法时间[Cohen,Lee,Song'19]中线性程序的最新结果,以解决更广泛的问题。我们的算法提出了两个与[Cohen,Lee,Song'19]不同的概念:$ \ bullet $我们给出一个鲁棒的确定性中心路径方法,而前一个是随机中心路径,它通过randomsparse向量更新权重。 $ \ bullet $我们提出了一种有效的数据结构,即使权重更新向量密集,也能维持内点方法的中心路径。
translated by 谷歌翻译