最近提出的对抗性训练方法显示了对抗性和原始例子的稳健性,并实现了最先进的结果,无监督和半监督学习。所有现有的对抗训练方法都只考虑最差的扰动例子(即,adversarialexamples)如何影响模型输出。尽管取得了成功,但我们认为这种设置可能缺乏概括性,因为输出空间(或标签空间)显然信息量较少。在本文中,我们提出了一种新的方法,称为Manifold Adver-sarial Training(MAT)。 MAT设法根据最差扰动如何影响分布流形而不是输出空间来构建一个对抗框架。特别地,将首先导出具有高斯混合模型(GMM)的潜在数据空间。一方面,MAT试图扰乱输入样本,使粗分布最差的方式。另一方面,深度学习模型被训练试图在潜在空间中促进由高斯混合的变化(给定数据点的局部扰动)测量的流形平滑度。重要的是,由于潜在空间比输出空间更具信息性,因此拟议的MAT可以更好地学习运行和紧凑数据表示,从而进一步提高性能。提出的MAT是重要的,因为它可以被认为是一个最近提出的称为中心损失的判别特征学习方法的超集。我们在三个基准数据集的监督和半监督中进行了一系列实验,表明提出的MAT可以表现出卓越的性能,远远优于现有的对等方法。
translated by 谷歌翻译
基于相关滤波器的跟踪器严重地受到由遮挡引起的响应图中的多峰问题的困扰。此外,由于峰值偏移带来的不确定性,整个跟踪管道可能会发生故障,这将进一步导致相关滤波器模型退化。为了缓解由遮挡引起的漂移问题,我们提出了一种根据不同的方法选择特定滤波器模型的新方案。具体而言,设计了一种有效的测量函数来评估滤波器响应的质量。采用复杂的策略来判断是否发生遮挡,然后决定如何更新滤波器模型。此外,我们利用对数极坐标方法和金字塔式方法来估计目标的最佳尺度。我们评估了我们提出的针对VOT2018挑战和OTB100数据集的方法,其实验结果表明,与最先进的跟踪器相比,所提出的跟踪器实现了有前途的性能。
translated by 谷歌翻译
Most of existing correlation filter-based tracking approaches only estimatesimple axis-aligned bounding boxes, and very few of them is capable ofrecovering the underlying similarity transformation. To tackle this challengingproblem, in this paper, we propose a new correlation filter-based tracker witha novel robust estimation of similarity transformation on the largedisplacements. In order to efficiently search in such a large 4-DoF space inreal-time, we formulate the problem into two 2-DoF sub-problems and apply anefficient Block Coordinates Descent solver to optimize the estimation result.Specifically, we employ an efficient phase correlation scheme to deal with bothscale and rotation changes simultaneously in log-polar coordinates. Moreover, avariant of correlation filter is used to predict the translational motionindividually. Our experimental results demonstrate that the proposed trackerachieves very promising prediction performance compared with thestate-of-the-art visual object tracking methods while still retaining theadvantages of high efficiency and simplicity in conventional correlationfilter-based tracking methods.
translated by 谷歌翻译
近年来,使用深度学习的人脸检测结果令人满意。尽管取得了显着的进步,但野外的面部检测仍然是一个开放的研究挑战,特别是在检测面部具有极大不同的尺度和特征时。在本文中,我们提出了一种新的简单有效的“特征聚集网络”框架(FANet)来构建一个新的单级人脸检测器,它不仅可以实现最先进的性能,而且可以高效运行。受特征金字塔网络(FPN)的启发,我们框架的关键思想是利用单个卷积神经网络的固有多尺度特征,通过聚合不同尺度的高级语义特征映射作为上下文线索,通过增强低级特征映射。边际集聚方式在边际计算成本。我们进一步提出了一种分层损失来有效地训练FANet模型。我们在几个公共面部检测基准上评估了所提出的FANet检测器,包括PASCAL面,FDDB和WIDER FACEdatasets,并获得了最先进的结果。我们的探测器可以在GPU上实时运行VGA分辨率图像。
translated by 谷歌翻译
机器学习正在从艺术和科学转变为可供每个开发人员使用的技术。在不久的将来,每个平台上的每个应用程序都将包含训练有素的模型,以编码开发人员无法创作的基于数据的决策。这提出了一个重要的工程挑战,因为目前数据科学和建模在很大程度上与标准软件开发过程脱钩。这种分离使得在应用程序内部的机器学习能力不必要地变得困难,并且进一步阻碍了开发人员将MLin置于首位。在本文中,我们介绍了ML .NET,这是一个在过去十年中在Microsoft开发的框架,用于应对在大型软件应用程序中轻松发布机器学习模型的挑战。我们提出了它的架构,并阐明了形成它的应用程序需求。具体而言,我们引入了DataView,它是ML .NET的核心数据抽象,它可以有效地,一致地捕获完整的预测管道,并在训练和推理生命周期中进行。我们结束了论文,对ML .NET进行了令人惊讶的有利的性能研究,与更多的接受者相比,并讨论了一些经验教训。
translated by 谷歌翻译
交通信号控制是一种新兴的应用场景,用于加强学习。除了作为影响人们通勤日常生活的重要问题之外,交通信号控制在适应动态交通环境和协调包括车辆和行人在内的数千名代理人方面对于强化学习提出了独特的挑战。现代强化学习成功的关键因素依赖于商品模拟器来生成大量用于学习的数据样本。然而,最常用的开源流量模拟器SUMO不能扩展到大型公路网和大流量,这阻碍了对交通场景的强化学习的研究。这促使我们创建一个新的流量模拟器CityFlow,它具有基本优化的数据结构和高效的算法。 CityFlow可以根据合成和真实数据支持灵活的道路网络和交通流量定义。它还提供了用户友好的强化学习界面。最重要的是,CityFlow比SUMO快20多倍,并且能够通过交互式渲染形式监控来支持全市范围的交通模拟。除了交通信号控制,CityFlow还可以作为其他交通研究的基础,并为智能交通领域的测试机器学习方法创造新的可能性。
translated by 谷歌翻译
尽管其重要性,乘客需求预测仍然是一个具有高度挑战性的问题,因为需求同时受到许多空间和时间因素与其他外部因素(如天气)之间的复杂相互作用的影响。为了解决这个问题,我们提出了一个Spatio-TEmporalFuzzy神经网络(STEF-Net)来准确预测乘客需求,以解决所有已知重要因素的复杂相互作用。我们设计了一个端到端的学习框架,其中不同的神经网络建模了不同的因素。具体而言,我们建议通过卷积长短期记忆网络和模式神经网络捕获时空特征交互,模糊神经网络处理的数据不确定性明显优于确定性方法。为了在融合两个网络时保持时间关系并强调有区别的时空特征交互,我们采用了一种新的特征融合方法,即卷积操作和注意层。据我们所知,我们的工作是第一个深度递归神经网络和模糊神经网络来模拟复杂的时空特征相互作用与额外的不确定输入特征进行预测学习。在大型真实世界数据集上的实验表明,我们的模型比最先进的方法实现了超过10%的改进。
translated by 谷歌翻译
由于大量会话数据的可用性以及针对会话AI的神经方法的进展,开发智能开放域对话系统的兴趣日益浓厚。与传统的面向任务的机器人不同,开放域对话系统旨在通过满足人类对沟通,感情和社会归属的需求来与用户建立长期联系。本文回顾了最近关于neuralapproaches的工作,这些工作致力于解决开发此类系统的三个挑战:语义,一致性和交互性。语义学要求adialog系统不仅要理解对话框的内容,还要在对话过程中识别用户的社交需求。一致性要求系统展示一致的个性以赢得用户的信任和gaintheir的长期信心。互动性是指系统产生人际反应以实现特定社会目标的能力,如娱乐,整合和任务完成。我们选择的作品基于我们独特的观点,并不完整。尽管如此,我们希望这次讨论将激发新的研究,以开发更智能的对话系统。
translated by 谷歌翻译
视觉世界中的大多数物体都被部分遮挡,但人类可以毫无困难地识别它们。然而,仍然不知道卷积神经网络(CNN)等对象识别模型是否可以处理现实世界的遮挡。还有一个问题是,使这些模型对恒定掩模遮挡具有鲁棒性的努力是否对于真实世界的阻塞是有效的。我们测试了人类和上述计算模型在极端遮挡下对象识别的挑战性任务,其中目标对象被真实背景中的无关真实对象严重遮挡。我们的结果表明人类视觉对于极端遮挡是非常强大的,而CNN不是,即使经过修改以处理恒定的遮罩遮挡。这表明处理恒定掩模遮挡的能力并不意味着对现实世界遮挡的鲁棒性。作为比较,我们提出了另一种计算模型,该模型利用组合方式中的对象部分/子部分来构建对遮挡的鲁棒性。这在我们的任务上与基于CNN的模型相比具有与人类类似的错误模式。这些结果表明,极端遮挡下的测试可以更好地揭示视觉识别的稳健性,并且组成原则可以鼓励这种稳健性。
translated by 谷歌翻译
合作在多智能体强化学习(MARL)中至关重要。在交通信号控制的背景下,交通信号控制之间的良好合作使得车辆能够更加顺畅地通过交叉口。传统的交通方式通过预先计算两个交叉口之间的偏移来实现合作。这种预先计算的偏移量不适用于动态交通环境。为了结合促进学习(RL)中的合作,提出了两种典型的方法来考虑其他因素的影响:(1)学习通信(即代理之间的影响的表示)和(2)学习代理的联合。尽管在最近的研究中联合行动模型已经显示出一种优选的趋势,但是在交通信号控制的背景下,尚未系统地研究改进药剂之间通信学习的深入研究。为了学习代理之间的通信,在本文中,我们建议使用图注意网络来促进合作。具体来说,对于网络中的目标交叉点,我们提出的模型CoLight不仅可以结合邻近交互的影响,还可以学会将它们的影响区分为目标交叉点。据我们所知,我们是第一个在交通信号控制强化学习环境中使用graphattentional网络的人。在实验中,我们通过学习通信证明,所提出的模型可以获得令人惊讶的良好性能,而基于联合动作建模的现有方法无法很好地学习。
translated by 谷歌翻译