高维空间中的高效最近邻(NN)搜索是许多多媒体检索系统的基础。一种常见的方法是依赖产品量化,允许在存储器中存储大型矢量数据库,并且还允许有效的距离计算。然而,使用产品量化的最近邻搜索的实现通过它们执行的许多存储器访问来限制其性能。根据这一观察结果,Andr \'e等人。建议利用特定的SIMD指令更有效地实现$ m \ times {} 4 $ productquantizers(PQ)。更快的ADC提供额外的实现,不仅限于$ m \ times {} 4 $代码,而且依赖于AVD-512,这是SIMDinstruction集的最新版本。在这样做的过程中,Quicker ADC面临着我们的挑战,即不能与计算机字节或字对齐的高效5,6和7位混洗。为此,我们引入(i)不规则产品量化器组合不同粒度的子量化器和(ii)分割表,允许查找表大于寄存器。我们使用多个索引(包括反向多索引和IVF HNSW)评估Quicker ADC,并表明它在多种配置方面优于FAISS PQ实现和优化(即Polysemous代码)。最后,我们开源源码http://github.com/technicolor-research/faiss-quickeradc包含了一个包含Quicker ADC的FAISS分支。
translated by 谷歌翻译
序列到序列模型是NLP的强大主力。大多数变体在其注意机制和输出层中都采用softmax变换,导致密集对齐和严格正输出概率。这种密度是浪费的,使得模型可解释性较差,并为许多难以置信的输出分配概率质量。在本文中,我们提出了sparsese序列到序列模型,植根于$ \ alpha $ -entmaxtransformations的新系列,其中包括softmax和sparsemax作为特定情况,并且对于任何$ \ alpha> 1 $都是稀疏的。我们提供快速算法来评估这些变换及其渐变,这些算法可以很好地扩展到大型词汇表。我们的模型能够生成稀疏对齐并将非非可置性分配给可能输出的简短列表,有时会使波束搜索精确。形态学变形和机器平移的实验揭示了密集模型的一致增益。
translated by 谷歌翻译
目标识别是在给定一组目标假设,域模型和正在执行的计划的(可能是嘈杂的)样本的情况下推断出针对执行计划的正确目标的问题。这是合作和竞争性代理人互动中的关键问题,并且最近的方法产生了快速且准确的目标识别算法。在本文中,使用线性程序计算的算子计数启发式算法在经典规划问题的约束下计算,以解决目标识别问题。我们的方法使用从观察中导出的附加的算子计数约束来有效地推断出正确的目标,并且作为具有附加约束的许多其他方法的基础。
translated by 谷歌翻译
由于大数据革命和不断增长的计算能力,人工智能(AI)在过去几年中取得了令人印象深刻的复兴,现在在研究和工业领域都无处不在。创意部门一直是人工智能技术的早期采用者,这种情况一直如此。事实上,最近的技术发展突破了创意应用中智能系统的界限:2016年发布的备受好评的电影“Sunspring”完全是由人工智能技术编写的,也是有史以来第一部名为“Hello World”的音乐专辑,使用人工智能生产的产品已于今年发布。同时,创造性过程的探索性特征为AI提出了重要的技术挑战,例如,在传统的“大数据”方法或者处理,分析和匹配数据的能力下,人工智能技术在有限的数据源下是准确的。从多种形式(文本,声音,图像等)同时进行。本白皮书的目的是了解人工智能的未来技术进步及其对创造性产业日益增长的影响。本文讨论了以下问题:AI在创意产业中的运作方式?它的作用是什么? AI将如何在未来十年内转变创意产业?本白皮书旨在提供关于创意产业中人工智能行为范围的现实视角,提出该技术如何为此类背景下的研究和开发工作做出贡献的愿景,并确定研究和发展挑战。
translated by 谷歌翻译
基于时间延迟的储层计算设置在实验和模拟方面取得了巨大成功。它允许构建只有很少组件的大型超晶形计算系统。然而,到目前为止,尚未对不同时间尺度的相互作用进行彻底调查。在本手稿中,我们研究了一般模型的时间延迟和时钟周期之间不匹配的影响。通常,这两个时间尺度被认为是相等的。在这里,我们表明等时间相关的时间延迟和时钟周期的情况可能是积极有害的,并导致储层的近似误差的增加。特别地,我们可以证明这些时间尺度的非共振比具有最大的记忆容量。我们通过将周期性驱动的延迟动力系统转换为等效网络来实现这一目标。从具有共振延迟时间和时钟周期的系统中产生的网络无法充分利用它们的所有自由度,这导致其性能的下降。
translated by 谷歌翻译
在多目标优化算法领域,除了进化的多目标优化算法(EMOA)之外,多目标贝叶斯全局优化(MOBGO)是一个重要的分支。 MOBGO利用从先前的目标函数评估中学习的高斯过程模型,通过最大化或最小化infillcriterion来确定下一个评估站点。 MOBGO的一个共同标准是预期的超级体积改进(EHVI),它在广泛的问题上表现出良好的性能,涉及勘探和开发。然而,到目前为止,有效地计算精确的EHVI值一直是一个挑战。在本文中,提出了一种用于计算一般情况的精确EHVI的有效算法。这种有效的算法基于将积分体积划分为一组轴平行切片。从理论上讲,上限时间复杂度从之前的$ O(n ^ 2)$和$ O(n ^ 3)$分别改为$ 2和$ 3目标问题$ $ Theta(n \ log n)$,是偶然的最佳。本文通过利用D {\“a} chert等人,EJOR,2017提出的新的超盒分解技术,在更高维的情况下概括了该方案。它还利用了多层集成方案的推广,该方案在多个集合方案中线性扩展。速度对比表明,本文提出的算法显着缩短了计算时间,最后将该分解技术应用于改进概率(PoI)的计算中。
translated by 谷歌翻译
本文提出了一种简单的方法,通过稀疏诱导正则化导出学习多个组件的有效误差范围。实际上,对于这样的正则化方案,可以以更有效的方式使用已知的对组件的复杂性的Rademacher分解,从而在不需要太多努力的情况下产生更严格的界限。我们给出了切换回归和基于中心的聚类/矢量量化的应用实例。然后,在子空间聚类问题上说明了完整的工作流程,对于该问题,分解结果以前不可用。对于所有这些问题,所提出的方法产生了对组件数量的轻微依赖性的风险界限,并完全消除了以前方法无法处理的非凸正则化方案的这种依赖性。
translated by 谷歌翻译
对于我们提交到ZeroSpeech 2019挑战,我们将离散的变量神经网络应用于未标记的语音,并将发现的单元用于语音合成。无监督离散子字建模可用于婴儿语音类别学习的研究或需要符号输入的低资源语言技术。我们使用具有中间离散化的自动编码器(AE)架构。我们通过调整AE的解码器来训练扬声器身份,从而将声学单元发现与扬声器建模分离。在测试时,对来自未见扬声器的语音进行单元发现,然后以已知目标扬声器为条件进行单元解码,以获得重建的滤波器组。该输出被馈送到神经调节器以合成目标讲话者的语音中的语音。对于离散化,分类变量自动编码器(CatVAE),矢量量化VAE(VQ-VAE)和直通估计在两种语言的不同压缩级别进行比较。我们的最终模型使用卷积编码,VQ-VAE分散,反卷积解码和FFTNet声码器。我们表明,耦合扬声器调节本质上改善了离散声学表示,与挑战基线相比产生了竞争性合成质量。
translated by 谷歌翻译
由于城市车队中摩托车的大量增长以及对其行为的研究的增长以及该车辆如何影响交通流量的必要性,开发了与常规车辆不同的工具和技术以确定其在交通流中的存在并且是能够提取您的信息。该文章试图通过组合LBP技术以创建特征向量和分类技术LinearSVC来执行预测来生成摩托车图像库并开发和校准摩托车分类器,从而有助于对这种类型的车辆的研究。通过这种方式,本研究中开发的摩托车类型的分类器可以对两类摩托车和非摩托车之间的监控视频提取的车辆的图像进行分类,精度和精度优于0.9。
translated by 谷歌翻译
直线是人造环境中的常见特征。它们比点更具有特征性,因为它们产生更多关于环境的信息(这些是一度特征而不是零度点)。此外,它们更容易在图像传感器中检测和跟踪。具有对从图像测量的线的3D参数的稳健估计对于诸如视觉伺服的若干控制应用是有利的。在这项工作中,提出了模拟移动相机图像中线条的明显运动的经典动力系统。为了获得线的三维结构,提出了一种非线性观测器。然而,为了保证收敛,动力系统必须与代数方程耦合。这是通过使用球面坐标来表示线的矩向量和基础的变化来实现的,这允许直接在系统的动态上引入代数约束。最后,提出了一种试图优化观察者收敛行为的控制律。这种方法经过了验证,并且配备了带有摄像头的真实机器人平台。
translated by 谷歌翻译