交通信号控制是一种新兴的应用场景,用于加强学习。除了作为影响人们通勤日常生活的重要问题之外,交通信号控制在适应动态交通环境和协调包括车辆和行人在内的数千名代理人方面对于强化学习提出了独特的挑战。现代强化学习成功的关键因素依赖于商品模拟器来生成大量用于学习的数据样本。然而,最常用的开源流量模拟器SUMO不能扩展到大型公路网和大流量,这阻碍了对交通场景的强化学习的研究。这促使我们创建一个新的流量模拟器CityFlow,它具有基本优化的数据结构和高效的算法。 CityFlow可以根据合成和真实数据支持灵活的道路网络和交通流量定义。它还提供了用户友好的强化学习界面。最重要的是,CityFlow比SUMO快20多倍,并且能够通过交互式渲染形式监控来支持全市范围的交通模拟。除了交通信号控制,CityFlow还可以作为其他交通研究的基础,并为智能交通领域的测试机器学习方法创造新的可能性。
translated by 谷歌翻译
早期发现肺癌是提高患者生存率的有效方法。在计算机断层扫描(CT)图像中准确检测肺结节是诊断肺癌的关键步骤。然而,由于肺结节的异质性和周围环境的复杂性,强大的结节检测一直是一项具有挑战性的任务。在这项研究中,我们提出了一种用于肺结节检测的两阶段卷积神经网络(TSCNN)架构。第一阶段的CNN架构基于改进的UNet分割网络,以建立肺结节的初始检测。同时,为了在不引入过多误报结节的情况下获得高召回率,我们提出了一种小说采样策略,并根据所提出的级联预测方法,使用离线硬挖掘思想进行训练和预测。第二阶段的CNN架构基于所提出的双池结构,其构建在三个3D CNN分类网络中用于假阳性减少。由于网络训练需要大量的训练数据,我们采用基于随机掩模的数据增强方法。此外,我们通过集成学习提高了误报减少模型的泛化能力。所提出的方法已经在LUNA数据集上进行了实验验证。实验结果表明,所提出的TSCNN架构可以获得有竞争力的检测性能。
translated by 谷歌翻译
近年来,车辆重新识别正在吸引越来越多的关注。最具挑战性的问题之一是从其多视点图像中学习车辆的有效表示。现有方法倾向于导出尺寸范围从数千到数万的特征。在这项工作中,我们提出了一个基于深度学习的框架,可以有效地表达车辆。虽然所述特征的维数可以低至256,但是对不同数据集的实验表明,Top-1和Top-5检索精度超过了多种最先进的方法。我们框架的关键是双重的。首先,采用变分特征学习来生成更具辨识性的变分特征。其次,长期短期记忆(LSTM)用于学习车辆的不同视点之间的关系。 LSTM还可以作为编码器来缩小功能。
translated by 谷歌翻译
基于蒸馏的学习基于以下假设提高了小型化神经网络的性能:教师模型的表示可以用作结构化且相对弱的监督,因此可以通过小型化模型容易地学习。然而,我们发现,对于训练一个小学生模型来说,交错重型模型的表示仍然是一个强大的约束,这导致了同余损失的高下界。在这项工作中,受课程学习的启发,我们从路线学课程学习的角度考虑知识蒸馏。我们使用融合教师模型监督学生模型,而不是使用从教师模型传递的参数空间中的路径中选择的一些锚点来监督它,我们称之为路径约束优化(RCO)。我们通过实验证明这种简单的操作大大降低了同形体的下限,用于知识蒸馏,暗示和模仿学习。在像CIFAR100和ImageNet这样的密集分类任务中,RCO分别将知识分析提高了2.14%和1.5%。为了评估一般化,我们还在开放式人脸识别任务MegaFace上测试RCO。
translated by 谷歌翻译
在本文中,我们从全新的角度提出了一种新的聚合交叉熵(ACE)方法,用于序列识别。 ACE损失函数表现出对CTC和注意机制的竞争性能,具有更多的实现(因为它只涉及四个基本公式),更快的参考\反向传播(大约O(1)并行),更少的存储要求(没有参数和可忽略的运行时内存) )和方便就业(通过用ACE代替CTC)。此外,所提出的ACE损失函数具有两个值得注意的特性:(1)它可以直接应用于2D预测,将2D预测平坦化为1D预测作为输入;(2)它只需要字符及其数字在序列注释中进行监督,这允许它超越了序列识别,例如计算问题。该代码可通过以下网址公开获取://github.com/summerlvsong/Aggregation-Cross-Entropy。
translated by 谷歌翻译
Autonomous navigation is an essential capability of smart mobility for mobile robots. Traditional methods require the environment map to plan a collision-free path in workspace. Deep reinforcement learning (DRL) is a promising technique to realize the autonomous navigation task without a map, with which deep neural network can fit the mapping from observation to reasonable action through explorations. It should not only memorize the trained target, but more importantly, the planner can reason out the path to unseen goal. We proposed a new motion planner based on deep reinforcement learning that can arrive at new targets that have not been trained before in the indoor environment with RGB image and odometry only. The model has a structure of stacked Long Short-Term memory (LSTM). Finally, experiments were implemented in both simulated and real environments. The source code is available: https://github.com/marooncn/navbot.
translated by 谷歌翻译
我们提出了一个统一的多人姿态估计和跟踪框架。我们的框架由两个主要组成部分组成,即空间网和TemporalNet。SpatialNet在单个框架中完成身体部位检测和部分级数据关联,而TemporalNet组连续帧中的人类实例进入轨迹。具体地,除了身体部位检测热图之外,SpatialNet还预测用于身体部位关联的关键点嵌入(KE)和空间实例嵌入(SIE)。我们将分组程序建模为可微分姿态引导分组(PGG)模块,使整个部分检测和分组管道完全端到端可训练。 TemporalNet将关键点的空间分组扩展到人类实例的时间分组。来自两个连续帧的人类提议,TemporalNet利用人类嵌入(HE)中编码的bothappearance特征和时间实例嵌入(TIE)中体现的时间一致几何特征来进行鲁棒跟踪。大量实验证明了我们提出的模型的有效性。值得注意的是,我们在ICCV'17 PoseTrack数据集上展示了从65.4%到71.8%的多目标跟踪精度(MOTA)的最先进的姿态跟踪方法的实质性改进。
translated by 谷歌翻译
为了解决深度生成模型学习中的挑战(例如,变分自动编码器的瑕疵和训练生成对抗网络的不稳定性,我们提出了一种新的深度生成模型,名为Wasserstein-Wasserstein自动编码器(WWAE)。我们制定了WWAE的最小化目标分布和生成的分布之间的惩罚最佳传输。通过注意到潜在代码Z的先前$ P_Z $和聚合后验$ Q_Z $可以被高斯人很好地捕获,所提出的WWAE利用方形的Wasserstein的封闭形式 - 因此,WWAE不会受到采样负担的影响,并且通过利用重新参数化技巧在计算上是有效的。数值结果在多个基准数据集上进行了评估,包括MNIST,时尚-MNIST和CelebA表明WWAE学习得更好。结构比VAE和生成更好的视觉质量和更高的样本r FID得分超过VAE和GAN。
translated by 谷歌翻译
在本文中,我们提出了一种简单但有效的方法来解决从单个RGB图像估计物体的6D姿势的问题。我们的系统训练一个新颖的卷积神经网络,从2D检测系统返回的边界框内的部分图像中回归单位四元数,代表3D旋转。然后我们提出了一种算法,我们称之为BoundingBox方程,使用3Drotation和2D边界框高效准确地获得3D平移。考虑到四元数的四个元素的二次和等于1,我们添加一个归一化层来保持单位球上网络的输出,并为单位四元数回归提出一个特殊的损失函数。我们在LineMod数据上评估我们的方法,实验表明我们的方法优于基线和一些最先进的方法。
translated by 谷歌翻译
保护用户隐私是机器学习中的一个重要问题,正如2018年5月在欧盟(EU)推出通用数据保护法规(GDPR)所证明的那样.GDPR旨在让用户更好地控制他们的个人数据,这促使我们在不违反用户隐私的情况下通过数据共享来探索机器学习框架。为了实现这一目标,在本文中,我们提出了一种新的无损隐私保护树增强系统,称为SecureBoost,用于教学设置。该联合学习系统允许学习过程通过具有部分公共用户样本但不同特征集的多方联合进行,其对应于垂直分区的虚拟数据集。 SecureBoost的一个优点是它提供与非隐私保护方法相同的精度,同时不会泄露每个私有数据提供者的信息。我们理论上证明SecureBoost框架与将数据集中到一个地方的其他非联合梯度树提升算法一样准确。此外,除了安全性证明之外,我们还讨论了使协议完全安全所需的条件。
translated by 谷歌翻译