我们通过$ \ ell_1 $ -minimization研究从一组信号中全局恢复字典的问题。我们假设信号是asi.i.d生成的。来自完整参考字典$ D ^ * \ in \ mathbb R ^ {K \ times K} $的$ K $原子的随机线性组合,其中线性组合系数来自伯努利型模型或精确稀疏模型。首先,我们获得必要且充分的规范条件,引用的字典$ D ^ * $是预期的$ \ ell_1 $目标函数的一个尖锐的局部最小值。我们的结果大大扩展了Wu和Yu(2015)的结果,并允许组合系数是非负的。其次,我们在所引用的字典的目标值最小的区域上获得显式绑定。第三,我们证明了参考字典是唯一的尖锐局部最小值,从而建立了第一个已知的$ \ ell_1 $ -minimization字典学习的全局属性。在理论结果的推动下,我们引入了基于扰动的测试来确定adictionary是否是目标函数的尖锐局部最小值。此外,我们还提出了一种新的基于Block CoordinateDescent的字典学习算法,称为DL-BCD,保证具有单调收敛性。模拟研究表明DL-BCD在恢复率方面具有竞争性,与许多状态相比。 -art字典学习算法。
translated by 谷歌翻译
车辆重新识别是一个重要的问题,随着视频监控和智能传输应用的快速扩展而变得可取。通过回顾人类视觉的识别过程,我们发现当人类识别不同的车辆时存在本地的等级依赖性。具体地,人类总是首先确定一个车辆的粗粒度类别,即汽车模型/类型。然后,在预测的汽车模型/类型的分支下,他们将通过细微的视觉线索(例如,定制的绘画和挡风玻璃)在细粒度水平上识别特定的车辆。受粗到细分层过程的启发,我们提出了一种用于车辆重新识别的端到端基于RNN的分层注意(RNN-HA)分类模型。 RNN-HA由三个相互耦合的模块组成:第一个模块生成车辆图像的图像表示,第二个层次模块模拟上述层级依赖关系,最后一个注意模块侧重于捕获特定车辆彼此之间的细微视觉信息识别。通过对两个车辆重新识别基准数据集VeRi和VehicleID进行全面的实验,我们证明了所提出的模型实现了超越现有技术的卓越性能。
translated by 谷歌翻译
对于感兴趣的产品,我们提出了一种表示一组参考产品的搜索方法。参考产品可用作支持下游建模任务和业务应用程序的候选者。搜索方法包括产品表示学习和指纹型矢量搜索。通过新颖的注意自动编码器神经网络将产品目录信息转换为高质量的低维度嵌入,并且嵌入还与二进制编码向量相结合以便快速检索。我们通过大量实验来评估所提出的方法,并将其与同行服务进行比较,以证明其在搜索返回率和精度方面的优势。
translated by 谷歌翻译
自动驾驶是一个具有挑战性的多智能体领域,需要优化复杂的,混合的合作竞争互动。学习排除其他车辆轨迹上的偶然分布可以简化问题,通过轨迹优化和动态约束来实现近似解。我们采用基于模型的预测方法,以便使用车辆运动学的结构化先验知识,以及其他驾驶员计划轨迹以最小化未知成本函数的假设。我们引入了一种新颖的逆最优控制(IOC)算法,以在基于能量的生成模型中学习其他车辆的成本函数。 LangevinSampling是一种基于蒙特卡罗的采样算法,用于直接对控制序列进行采样。我们的算法比standardIOC方法提供更大的灵活性,并且可以学习在整个轨迹上定义的更高级别的非马尔可夫成本函数。我们利用神经网络扩展基于加权特征的成本函数,以获得NN增强的成本函数,这些函数结合了基于模型和无模型学习的优点。结果表明,基于模型的IOC可以实现最先进的车辆轨迹预测精度,并自然地考虑场景信息。
translated by 谷歌翻译
The behavior of the gradient descent (GD) algorithm is analyzed for a deep neural network model with skip-connections. It is proved that in the over-parametrized regime, for a suitable initialization, with high probability GD can find a global minimum exponentially fast. Generalization error estimates along the GD path are also established. As a consequence, it is shown that when the target function is in the reproducing kernel Hilbert space (RKHS) with a kernel defined by the initialization, there exist generalizable early-stopping solutions along the GD path. In addition, it is also shown that the GD path is uniformly close to the functions given by the related random feature model. Consequently, in this "implicit regularization" setting, the deep neural network model deteriorates to a random feature model. Our results hold for neural networks of any width larger than the input dimension.
translated by 谷歌翻译
尽管二阶相似性(SOS)已经在图形匹配和聚类等任务中得到了显着的成功,但它还没有被用于学习局部描述符。在这项工作中,我们通过建立一个正对匹配点应该表现出相对于嵌入空间中其他点的相似距离的概念来探索描述符学习领域中SOS的潜力。因此,我们提出了一个新的正则化项,称为二阶相似正则化(SOSR),遵循这一原则。通过将SOSR结合到训练中,我们学习的描述符在包含不同任务的几个具有挑战性的基准上实现了最先进的性能,这些任务包括来自运动的局部补丁检索结构。此外,通过设计基于von Mises-Fischer分布的评估方法,我们将描述符空间的利用率与匹配性能联系起来,从而证明了我们提出的SOSR的有效性。提供了广泛的实验结果,经验证据和诠释分析,表明SOSR可以显着提高学习描述符的匹配性能。
translated by 谷歌翻译
自动退房(ACO)近年来获得了越来越多的兴趣。 ACO系统的一个重要组成部分是视觉项目计数,它识别客户选择的项目的类别和计数。然而,这种系统的培训受到领域适应问题的挑战,其中训练数据是来自孤立项目的图像而测试图像用于收集物品。现有方法通过使用合成图像的数据增强来解决该问题,但是图像合成导致影响训练过程的不真实图像。在本文中,我们提出了一种新的数据启动方法来解决域适应问题。具体来说,我们首先使用预增强数据启动,其中从训练图像中分离出背景,并通过姿势修剪方法选择具有逼真视角的图像。在后增强步骤中,我们使用检测和计数协作学习训练数据启动网络,并从测试数据中选择更可靠的图像来计算最终视觉项目计算网络。在大规模零售产品检验(RPC)数据集上的实验证明了所提出方法的优越性,即,与基线方法的56.68%相比,我们实现了80.51%的检验准确性。
translated by 谷歌翻译
准确预测其他人的轨迹对于自动驾驶至关重要。轨迹预测是具有挑战性的,因为它需要推理代理人的过去运动,不同数量和代理人之间的社会交互,场景环境的约束以及人类行为的随机性。我们的方法在一种新颖的多智能体张量融合(MATF)网络中共同模拟这些相互作用和约束。具体而言,模型将多个代理的过去轨迹和场景上下文编码为多代理张量,然后应用卷积融合来捕获多重交互,同时保留代理的空间结构和场景上下文。该模型反复解码为多个特工的未来轨迹,利用对抗性损失来学习随机预测。在高速公路驾驶和行人人群数据集上的实验表明,该模型实现了最先进的预测精度。
translated by 谷歌翻译
由于深度卷积神经网络(CNN)的巨大改进,近年来人脸识别取得了显着进展。然而,deepCNN很容易受到对抗性的例子的影响,这些例子可能会在具有安全敏感性目的的真实世界人脸识别应用程序中造成致命的后果。对抗性攻击被广泛研究,因为它们可以在部署之前识别模型的脆弱性。在本文中,我们评估了基于决策的黑盒攻击设置中最先进的人脸识别模型的稳健性,其中攻击者无法访问模型参数和梯度,但只能通过发送查询来获取硬标签预测到目标模型。这种攻击设置在现实世界的人脸识别系统中更为实用。为了提高上述方法的效率,我们提出了一种进化攻击算法,该算法可以对搜索方向的局部几何进行建模,并减小这些空间的维数。大量实验证明了所提出的方法的有效性,该方法通过较少的查询引起对输入面部图像的最小扰动。我们还应用所提出的方法成功地攻击真实世界的人脸识别系统。
translated by 谷歌翻译
我们提出了一种新的碰撞感知任务分配(CATA)问题公式和一种分散的基于拍卖的算法来解决最优边界问题。使用碰撞锥,我们预测潜在的碰撞并将二元决策变量引入局部奖励函数以进行任务计划。我们通过实现停止机器人场景的后退碰撞来进一步改进CATA,即当机器人被限制在机架位置并且成为其他移动机器人的静态障碍物时。基于Theauction的算法鼓励机器人针对碰撞考虑事项竞标任务。我们使用模拟和实验结果验证了改进的任务分配解决方案,这显示了重叠路径和死锁的显着减少。
translated by 谷歌翻译