Deep embeddings answer one simple question: How similar are two images?Learning these embeddings is the bedrock of verification, zero-shot learning,and visual search. The most prominent approaches optimize a deep convolutionalnetwork with a suitable loss function, such as contrastive loss or tripletloss. While a rich line of work focuses solely on the loss functions, we showin this paper that selecting training examples plays an equally important role.We propose distance weighted sampling, which selects more informative andstable examples than traditional approaches. In addition, we show that a simplemargin based loss is sufficient to outperform all other loss functions. Weevaluate our approach on the Stanford Online Products, CAR196, and theCUB200-2011 datasets for image retrieval and clustering, and on the LFW datasetfor face verification. Our method achieves state-of-the-art performance on allof them.
translated by 谷歌翻译
我们研究了为\ emph {sets}定义的机器学习任务的模型设计问题。与在固定维向量上操作的传统方法相比,我们考虑在不同于排列的集合上定义的目标函数。这些问题很普遍,包括对人口统计数据的估计,以及堤坝的压力计数据中的异常检测\引用{Jung15Exploration},tocosmology \ cite {Ntampaka16Dynamical,Ravanbakhsh16ICML1}。我们的主要定理描述了置换不变函数,并提供了任何置换不变目标函数必须属于的族函数。这个函数族具有一种特殊的结构,使我们能够设计出可以在集合上运行且可以在各种上部署的陡峭网络体系结构。场景包括无监督和有监督的学习任务。我们还得出了深部模型中置换等变性的充分必要条件。我们证明了我们的方法在人口统计估计,点云分类,集合扩展和异常检测方面的适用性。
translated by 谷歌翻译
我们提出了一种解决同时检测和分割问题的新方法。使用分层结构,我们使用一个有效且准确的过程,利用Locacy Sensitive Hashing利用层次结构特征信息。我们建立在最近的工作基础上,利用卷积神经网络来检测图像中的边界框,然后在散列后使用最适合每个边界框的顶级相似的分层区域,我们采用这种方法进行iSegmentation。然后,我们通过自动层次结构修剪来优化我们的最终分割结果。 iSegmentation为Hypercolumns引入了免费替代品。我们对PASCAL VOC2012分割数据集进行了大量实验,表明iSegmentation提供了具有竞争力的最先进的对象分割。
translated by 谷歌翻译
下一代内核方法(KMNG)引入了一个框架,在小批量设置中使用kernelapproximates,使用SGD Optimizer作为深度学习的替代方案。 McKernel是KMNG ML大规模的C ++库。它包含FastFood算法的CPU优化实现,允许在对数线性时间内计算近似内核扩展。该算法需要计算Walsh Hadamard变换(WHT)矩阵的乘积。 Acache友好的SIMD Fast Walsh Hadamard变换(FWHT)已经开发出来,其速度快,并且优于当前最先进的方法。 McKernel允许获得非线性分类组合快速食品和线性分类器。
translated by 谷歌翻译
在针对非常大的问题进行风险最小化和凸出游戏时,在线学习算法具有令人印象深刻的收敛性。然而,它们在设计上具有内在的顺序性,这使它们无法利用现代多核架构。在本文中,我们证明了延迟更新的在线学习收敛良好,从而促进了并行在线学习。
translated by 谷歌翻译
We review machine learning methods employing positive definite kernels. Thesemethods formulate learning and estimation problems in a reproducing kernelHilbert space (RKHS) of functions defined on the data domain, expanded in termsof a kernel. Working in linear spaces of function has the benefit offacilitating the construction and analysis of learning algorithms while at thesame time allowing large classes of functions. The latter include nonlinearfunctions as well as functions defined on nonvectorial data. We cover a widerange of methods, ranging from binary classifiers to sophisticated methods forestimation with structured data.
translated by 谷歌翻译
预测自然图像中的显着区域需要检测场景中存在的对象。为了为这项具有挑战性的任务开发强大的表示,必须通过上下文信息提取和扩充多个空间尺度的高级视觉特征。然而,旨在解释人类固定图的现有模型并未明确地包含这样的机制。在这里,我们提出了一种基于在大规模图像分类任务上预训练的卷积神经网络的方法。该体系结构形成编码器 - 解码器结构,并包括具有不同扩张率的多个卷积层的模块,以并行捕获多尺度特征。此外,我们将得到的表示与全局场景信息相结合,以准确地预测视觉显着性。我们的模型在两个公共显着性基准上获得了竞争性结果,并且我们证明了所选方法的建议方法的有效性。该网络基于轻量级图像分类主干,因此为具有有限计算资源的应用程序提供了合适的选择,以便在复杂的自然场景中估计人类注视。
translated by 谷歌翻译
使用无干3D超声(US)进行心导管检查的快速准确的导管检测可以提高干预的效率和结果。然而,美国的低图像质量需要额外的训练forsonographers定位导管。在本文中,我们提出了一种基于预先训练的VGG网络的导管检测方法,该方法通过重新组织的横截面利用3D信息通过共同完全卷积网络(FCN)对导管进行分割,FCN称为方向融合FCN( DF-FCN)。基于DF-FCN的分割图像,可以通过模型拟合来定位导管。我们的实验表明,所提出的方法可以成功地在具有挑战性的离体3D USdataset中检测消融导管,该数据在猪心脏上收集。大量分析表明,与最先进的仪器检测方法相比,所提方法的Dice得分为57.7%,至少提高了11.8%。由于DF-FCN的分割性能得到改善,导管可以定位,误差仅为1.4 mm。
translated by 谷歌翻译
任务机器学习预测时间序列的片段需要使用来自时间序列的输入/输出对来估计ML模型的参数。使用统计数据同化和监督机器学习之间的等价,我们重新审视了这个任务。机器的训练方法利用精确退火方法来识别动作的全局最小值(-log [P])。通过这种方式,我们能够确定在时间序列中产生良好概括(预测)所需的训练对的数量。我们从标量时间序列$ s(t_n)开始; t_n = t_0 + n \ Delta t $并使用非线性时间序列分析的方法显示如何产生$ D_E> 1 $维度时间延迟嵌入空间,其中时间序列没有假邻居,观察到的$ s(t_n)$时间也是如此系列。在$ D_E $ -dimensional空间中,我们探索使用前馈多层感知器作为在$ D_E $ -dimensional输入和生成$ D_E $ -dimensional输出上运行的网络模型。
translated by 谷歌翻译
我们考虑了两组分类问题,并提出了一个基于最优评分框架的内核分类器。与以前的方法不同,我们为方法的预期风险一致性提供理论保证。我们还允许通过使用加权内核强加结构化稀疏性来进行特征选择。我们提出了用于选择所有调整参数的全自动方法,特别是针对岭参数选择调整核收缩思想。数值研究表明,与现有的非参数分类器相比,该方法具有优越的分类性能。
translated by 谷歌翻译