我们采用三重态损耗作为空间嵌入正则化器来提升分类性能。标准体系结构(如ResNet和DesneNet)经过扩展,可通过最少的超参数调整来支持这两种损耗。这可以在调整预训练网络的同时提高通用性。三胞胎损失是最近提出的嵌入正则化器的强有力的替代品。然而,它适用于大批量需求和高计算成本。通过实验,我们重新评估这些假设。在推理期间,我们的网络支持分类和嵌入任务,没有任何计算开销。定量评估突出显示我们的方法在多个细粒度识别数据集上优于现有技术水平。对不平衡视频数据集的进一步评估实现了显着的改进(> 7%)。除了提高效率,三重态损失带来了检索和解释性的分类模型。
translated by 谷歌翻译
我们将视觉检索视为回归问题,将三联体损失视为回归损失。这使得能够在检索中使用丢失作为贝叶斯近似框架来进行认知不确定性估计。因此,利用蒙特卡罗(MC)采样来提高检索性能。我们的方法在两个应用中进行评估:人员重新识别和自动驾驶汽车。在多个数据集上为表演者应用程序实现了可比较的最新结果。我们利用本田驾驶数据集(HDD)进行自动驾驶应用。它提供了多种形式和相似性概念前动作动作理解。因此,我们提出了一种多模态条件检索网络。它将嵌入解嵌到单独的表示中以对不同的相似性进行编码。这种形式的联合学习消除了培训多个独立网络的需要,而没有任何性能下降。定量评估突出了我们的方法能力,在高度不确定的环境中实现了6%的改进。
translated by 谷歌翻译
驾驶场景理解是智能交通系统的关键要素。为了实现能够在复杂的物理和社会环境中运行的系统,他们需要了解和学习人类如何驾驶和与交通场景交互。我们介绍本田研究院驾驶数据集(HDD),这是一个具有挑战性的数据集,可用于研究现实生活环境中的学习驾驶员行为。该数据集包括使用配备有不同传感器的装备车辆收集的旧金山湾区104小时的人类驾驶。我们提供HDD的详细分析,并与其他驾驶数据集进行比较。引入了一种新颖的注释方法,使得能够从未修剪的数据序列中研究驾驶员行为理解。作为第一步,对驾驶员行为检测的基线算法进行训练和测试,以证明所提议任务的可行性。
translated by 谷歌翻译