高维空间中的高效最近邻(NN)搜索是许多多媒体检索系统的基础。一种常见的方法是依赖产品量化,允许在存储器中存储大型矢量数据库,并且还允许有效的距离计算。然而,使用产品量化的最近邻搜索的实现通过它们执行的许多存储器访问来限制其性能。根据这一观察结果,Andr \'e等人。建议利用特定的SIMD指令更有效地实现$ m \ times {} 4 $ productquantizers(PQ)。更快的ADC提供额外的实现,不仅限于$ m \ times {} 4 $代码,而且依赖于AVD-512,这是SIMDinstruction集的最新版本。在这样做的过程中,Quicker ADC面临着我们的挑战,即不能与计算机字节或字对齐的高效5,6和7位混洗。为此,我们引入(i)不规则产品量化器组合不同粒度的子量化器和(ii)分割表,允许查找表大于寄存器。我们使用多个索引(包括反向多索引和IVF HNSW)评估Quicker ADC,并表明它在多种配置方面优于FAISS PQ实现和优化(即Polysemous代码)。最后,我们开源源码http://github.com/technicolor-research/faiss-quickeradc包含了一个包含Quicker ADC的FAISS分支。
translated by 谷歌翻译
由于城市车队中摩托车的大量增长以及对其行为的研究的增长以及该车辆如何影响交通流量的必要性,开发了与常规车辆不同的工具和技术以确定其在交通流中的存在并且是能够提取您的信息。该文章试图通过组合LBP技术以创建特征向量和分类技术LinearSVC来执行预测来生成摩托车图像库并开发和校准摩托车分类器,从而有助于对这种类型的车辆的研究。通过这种方式,本研究中开发的摩托车类型的分类器可以对两类摩托车和非摩托车之间的监控视频提取的车辆的图像进行分类,精度和精度优于0.9。
translated by 谷歌翻译
直线是人造环境中的常见特征。它们比点更具有特征性,因为它们产生更多关于环境的信息(这些是一度特征而不是零度点)。此外,它们更容易在图像传感器中检测和跟踪。具有对从图像测量的线的3D参数的稳健估计对于诸如视觉伺服的若干控制应用是有利的。在这项工作中,提出了模拟移动相机图像中线条的明显运动的经典动力系统。为了获得线的三维结构,提出了一种非线性观测器。然而,为了保证收敛,动力系统必须与代数方程耦合。这是通过使用球面坐标来表示线的矩向量和基础的变化来实现的,这允许直接在系统的动态上引入代数约束。最后,提出了一种试图优化观察者收敛行为的控制律。这种方法经过了验证,并且配备了带有摄像头的真实机器人平台。
translated by 谷歌翻译
跨任务转移技能的能力有可能将增强型学习(RL)代理扩展到目前无法实现的环境。最近,基于两个概念,后继特征(SF)和广泛策略改进(GPI)的框架已被引入转移技能的原则性方式。在本文中,我们在两个方面扩展了SF和GPI框架。 SFs和GPI原始公式的基本假设之一是,所有感兴趣的任务的奖励可以计算为固定特征集的线性组合。我们放松了这个约束,并表明支持框架的理论保证可以扩展到只有奖励函数不同的任何一组任务。我们的第二个贡献是,可以使用奖励函数本身作为未来任务的特征,而不会损失任何表现力,从而无需事先指定一组特征。这使得可以以更稳定的方式将SF和GPI与深度学习相结合。我们在acomplex 3D环境中凭经验验证了这一主张,其中观察是来自第一人称视角的图像。我们表明,SF和GPI推动的转移几乎可以立即实现看不见任务的非常好的政策。我们还描述了如何以一种允许将它们添加到代理的技能集中的方式学习专门用于新任务的策略,从而在将来重用。
translated by 谷歌翻译
无人驾驶飞行器(UAV)是一种相对较新的技术。应用程序通常涉及复杂和看不见的问题。例如,他们可以在地面站的监督下在基于合作社的环境中工作,以加速关键的决策过程。然而,飞机和地面站之间交换的信息量受到高距离,低带宽尺寸,受限制的处理能力和能量限制的限制。这些缺点限制了诸如大的非常大的大规模操作。新的分布式最先进的处理架构,如雾计算,可以通过不同层次的数据采集,处理和存储来改善延迟,可扩展性和效率,以满足时间约束。在这些修订中,这项研究工作提出了一个数学模型分析基于分布的无人机拓扑和用于大规模任务和搜索操作的雾云计算框架。这些测试成功地预测了延迟和其他操作限制,使得分析计算优势优于传统的云计算架构。
translated by 谷歌翻译
随着数字设备越来越成为我们生活中不可或缺的一部分,自然的人机交互和视听人类行为感知系统将更加需要在野外实现强大的性能。准确地注释真实数据是设计这种系统的关键。但是,现有数据库通常考虑受控设置,低人口统计变异性和单个任务。在本文中,我们介绍了超过2000分钟的视听数据的SEWA数据库,这些数据来自六种文化,50%的女性,并且统一跨越18至65岁的年龄范围。受试者被记录在两个不同的背景下:在观看广告时和在视频聊天中讨论广告时。该数据库包括记录的丰富注释,包括面部标志,面部动作单元(FAU),各种发声,镜像,以及连续评估的价值,唤醒,喜欢,协议和(dis)喜欢的原型示例。该数据库旨在成为情感计算和自动人体感知研究人员极为宝贵的资源,并有望推动人类行为分析研究,包括文化研究。与数据库一起,我们提供广泛的基线实验,用于自动FAU检测和自动化合价,唤醒和(消除)强度估计。
translated by 谷歌翻译
在过去的几十年中,已经针对各种监督学习任务提出了许多损失函数,包括回归,分类,排序和更一般的结构化预测。了解支撑这些损失的核心原则和理论属性是正确解决正确问题的关键,并创造新的损失,并结合其优势。在本文中,我们介绍了Fenchel-Younglosses,一种为正则预测函数构造凸损失函数的通用方法。我们在非常广泛的环境中提供他们的属性的深入研究,涵盖所有上述监督学习任务,并揭示稀疏性,广义熵和分离边缘之间的新联系。我们证明Fenchel-Young损失统一了许多众所周知的损失函数,并允许轻松创建有用的新函数。最后,我们得出了有效的预测和训练算法,使Fenchel-Young在理论和实践中都有所损失。
translated by 谷歌翻译
目前,没有一致的模型用于在视觉上或正式地表示AI系统的架构。这种缺乏代表性在现有模型和系统的描述中带来了解释性,正确性和完整性挑战。 DIAL(图解人工智能语言)是为人工智能系统作为“工程原理图”的愿望而创建的。它在此作为AI系统的通用图解语言的社区对话的起点。
translated by 谷歌翻译
强化学习(RL)代理同时学习许多奖励功能的能力具有许多潜在的好处,例如将复杂任务分解为更简单的任务,任务之间的信息交换以及技能的重用。我们特别关注一个方面,即能够推广到看不见的任务。参数泛化依赖于函数逼近器的插值功率,该函数逼近器被赋予任务描述作为输入;其最常见的形式之一是通用值函数逼近器(UVFA)。推广到新任务的另一种方法是在RL问题本身中开发结构。广义策略改进(GPI)将先前任务的解决方案组合到针对看不见的任务的策略中;这依赖于新向下功能下的旧策略的即时策略评估,这通过后继特征(SF)实现。我们提出的通用后继特征近似器(USFAs)结合了所有这些的优点,即UVFAs的可扩展性,SF的即时参考,以及GPI的强大推广。我们讨论了培训USFA所涉及的挑战,其泛化属性,并证明其实际利益和转移能力在一个大规模的领域,其中代理人必须在第一人称视角三维环境中导航。
translated by 谷歌翻译
多类别边际分类理论中的一个主要开放问题是保证风险对类别数C,样本大小m和边际参数γ的最优依赖形式。从实际角度看,理论泛化性能分析有助于开发新的学习算法。在本文中,我们只关注提出的问题的理论方面。更准确地说,在最小可学习性假设下,我们得出了多类别边际分类器的新风险界限。当考虑的边际损失函数满足Lipschitz条件时,我们改善了对C的所有依赖性。我们从基本的上限不等式开始,将Rademacher复杂性作为容量度量。然后通过链接方法将该容量度量与度量熵相关联。在这种情况下,开发是基于引入新的组合度量熵。
translated by 谷歌翻译