人类群体通常能够找到相互合作的方式,不合时宜的,暂时延长的社会困境。基于行为经济学的模型只能解释这种不现实的无状态矩阵游戏的现象。最近,多智能体强化学习被应用于普遍化社会困境问题,以暂时和空间扩展马尔科夫格。然而,这还没有产生一种能够像人类一样学会合作社会困境的代理人。一个关键的洞察力是,许多(但不是全部)人类个体具有不公平的厌恶社会偏好。这促进了矩阵游戏社会困境的特定解决方案,其中不公平 - 反对个人亲自亲社会并惩罚叛逃者。在这里,我们将这一内容扩展到马尔可夫游戏,并表明它通过与政策性能的有利互动促进了几种类型的顺序社会困境中的合作。特别是,我们发现不公平厌恶改善了跨期社会困境的重要类别的时间信用分配。这些结果有助于解释大规模合作可能如何产生和持续存在。
translated by 谷歌翻译
序数数据是标签之间存在自然顺序的数据。由于存在许多常见问题,这类数据的分类和预处理在机器学习领域引起了越来越多的关注。传统上,序数分类问题已被视为名义问题。但是,这意味着不考虑他们的自然顺序约束。本文介绍了一个创新的R软件包namedocapis(Scala中的序分类和预处理)。主要在Scala中实现并可通过Github获得,该库包括四个学习者和两个用于序数和单调数据的预处理算法。该软件包的主要特点本手稿中解释了安装和使用的示例。
translated by 谷歌翻译
Many systems for autonomous vehicles' navigation rely on lane detection. Traditional algorithms usually estimate only the position of the lanes on the road, but an autonomous control system may also need to know if a lane marking can be crossed or not, and what portion of space inside the lane is free from obstacles, to make safer control decisions. On the other hand, free space detection algorithms only detect navigable areas, without information about lanes. State-of-the-art algorithms use CNNs for both tasks, with significant consumption of computing resources. We propose a novel approach that estimates the free space inside each lane, with a single CNN. Additionally, adding only a small requirement concerning GPU RAM, we infer the road type, that will be useful for path planning. To achieve this result, we train a multi-task CNN. Then, we further elaborate the output of the network, to extract polygons that can be effectively used in navigation control. Finally, we provide a computationally efficient implementation, based on ROS, that can be executed in real time. Our code and trained models are available online.
translated by 谷歌翻译
我们介绍了一种新的损失函数,用于训练深度学习架构以进行分类。它包括最小化在体系结构输出处构建的相似性图上的标签信号的平滑度。等效地,可以将其视为最大化来自不同类的训练输入的网络功能图像之间的距离。因此,在该过程中仅考虑不同类中的示例对之间的距离,并且训练不会阻止来自相同类的输入被映射到输出域中的远程位置。我们表明,这种损失在分类中表现出与使用经典交叉熵训练的架构相似的性能,同时提供有趣的自由度和属性。我们还证明了所提出的损失的兴趣,以增加受过训练的架构对输入偏差的鲁棒性。
translated by 谷歌翻译
将模型训练为高端性能需要大型标记数据集的可用性,这些数据集的获取成本很高。我们的工作目标是自动合成与下游任务相关的标记数据集。我们提出Meta-Sim,它学习合成场景的生成模型,并通过图形引擎获取图像以及相应的地面实况。我们使用神经网络对我们的数据集生成器进行参数化,该神经网络可以修改从概率场景图获得的场景图的属性,从而最小化其渲染输出和目标数据之间的分布差距。如果真实数据集带有小的标记验证集,我们还旨在优化元目标,即下游任务性能。实验表明,该方法可以大大提高人工工程概率场景语法的内容生成质量,无论是定性还是定量,都可以通过对下游任务的性能来衡量。
translated by 谷歌翻译
在图像中分割对象并在音频中分离声源是具有挑战性的任务,部分原因是传统方法需要大量标记数据。在本文中,我们开发了一个神经网络模型,用于视觉对象分割和声源分离,通过自我监督从自然视频中学习。该模型是最近提出的将图像像素映射到声音的工作的扩展。在这里,我们在神经网络中引入学习方法todisentangle概念,并分配语义类别网络特征通道,以便在视频上进行视听培训后实现独立的图像分割和声源分离。我们的评估表明,解开模型在语义分割和声源分离方面优于几个基线。
translated by 谷歌翻译
驾驶需要对各种复杂的环境条件和代理行为做出反应。对每个可能的场景进行明确建模是不现实的。相比之下,模仿学习在理论上可以利用大型人力车辆的数据。特别是行为克隆已成功用于端到端学习简单的视觉运动策略,但扩展到驾驶行为的全部范围仍然是一个未解决的问题。在本文中,我们提出了一个新的基准来实验性地研究行为克隆的可扩展性和限制。我们表明,行为克隆可以带来最先进的结果,包括在看不见的环境中,执行复杂的边界和纵向操作,而不会明确地编程这些反应。然而,我们确认众所周知的局限性(由于数据集偏差和过度拟合),新的泛化问题(由于动态对象和缺乏因果模型),以及在行为克隆之前需要进一步研究的训练不稳定性可以逐渐转向真实世界的驾驶。研究行为克隆方法的代码可以在http://github.com/felipecode/coiltraine找到。
translated by 谷歌翻译
事件相机是视觉传感器,记录异像素亮度变化的异步流,称为“事件”。它们比基于帧的计算机视觉相机具有吸引人的优势,包括高时间分辨率,高动态范围和无运动模糊。由于事件信号的稀疏,非均匀时空布局,模式识别算法通常将事件聚合成基于网格的表示,并随后通过标准视觉管道(例如,卷积神经网络(CNN))对其进行处理。在这项工作中,我们引入了一个通用框架,通过一系列不同的操作将转换流转换为基于网格的表示。我们的框架带有两个主要优势:(i)允许以端到端的方式学习输入事件表示和任务专用网络,以及(ii)提供统一文献中现存事件表示的大多数的分类法。识别小说。根据经验,我们表明,我们的端到端学习事件表示的方法在光流估计和对象识别方面比最先进的方法提高了大约12%。
translated by 谷歌翻译
Figure 1: Overview of the proposed method. First, human pose in the input video is estimated. From this, multiple plausible human poses are predicted for a long-term near-future. Finally, the future video based on the predicted poses is generated. ABSTRACT Predicting the near-future from an input video is a useful task for applications such as autonomous driving and robotics. While most previous works predict a single future, multiple futures with different behaviors can possibly occur. Moreover, if the predicted future is too short, it may not be fully usable by a human or other system. In this paper, we propose a novel method for future video prediction capable of generating multiple long-term futures. This makes the predictions more suitable for real applications. First, from an input human video, we generate sequences of future human poses as the image coordinates of their body-joints by adversarial learning. We generate multiple futures by inputting to the generator combinations of a latent code (to reflect various behaviors) and an attraction point (to reflect various trajectories). In addition, we generate long-term future human poses using a novel approach based on unidimensional convolutional neural networks. Last, we generate an output video based on the generated poses for visual-ization. We evaluate the generated future poses and videos using three criteria (i.e., realism, diversity and accuracy), and show that our proposed method outperforms other state-of-the-art works.
translated by 谷歌翻译
磁共振图像(MRI)中骨骼肌的分割对于肌肉生理学和肌肉病理学诊断的研究是必不可少的。然而,大型MRI体积的手动分割是耗时的任务。 MRI中肌肉分割算法的最新技术仍然不是很广泛,并且在某种程度上依赖于数据库。在本文中,提出了一种基于AdaBoost局部纹理特征分类的自动分割方法。纹理描述符由Oriented Gradients(HOG)的Histogram,基于Wavelet的特征以及从灰度MRI的高斯过滤的原始和拉普拉斯算子计算的一组统计测量值组成。分类器性能表明纹理分析可能是设计广义和自动MRI肌肉分割框架的有用工具。此外,本文还描述了基于图谱的单个肌肉分割方法。通过使用适当的仿射变换在图像对准之后覆盖由放射科医师提供的肌肉分割基础事实来获得Theatlas。然后,它用于在AdaBoostbinary分割上定义肌肉标签。当获得准确的肌肉组织分割时,开发的图谱方法提供了合理的结果。
translated by 谷歌翻译