我们提出了一种新型的二次编程公式,用于估计群体同步中的损坏水平,并使用这些估计来解决此问题。我们的目标函数利用了组的循环一致性,因此我们将我们的方法称为结构一致性(DESC)的检测和估计。该一般框架可以扩展到其他代数和几何结构。我们的表述具有以下优势:它可以忍受与信息理论界限一样高的腐败,它不需要对小组元素的估计值进行良好的初始化,它具有简单的解释,在某些温和的条件下,我们的全球最小值目标函数准确恢复了腐败水平。我们证明了方法在旋转平均的合成和真实数据实验上的竞争精度。
translated by 谷歌翻译
我们开发了从运动管道的结构中恢复损坏的keypoint匹配的新统计信息。统计信息基于Keypoint匹配图的群集结构中出现的一致性约束。统计数据旨在为损坏的匹配和未损坏的匹配提供较小的值。这些新统计数据与迭代重新重量方案相结合以过滤关键点,然后可以将其从运动管道馈送到任何标准结构中。可以有效地实现该滤波方法并将其缩放到大规模的数据集,因为它仅需要稀疏矩阵乘法。我们展示了这种方法对来自运动数据集的合成和实际结构的功效,并表明它在这些任务中实现了最先进的准确性和速度。
translated by 谷歌翻译
在这项工作中,我们介绍了配备有明确性能的第一个初始化方法,该方法适用于姿势图同时定位和映射(SLAM)和旋转平均(RA)问题。 SLAM和旋转平均通常正义为大规模的非渗透点估计问题,具有许多糟糕的本地最小值,可以捕获通常应用的平滑优化方法来解决它们;因此,标准SLAM和RA算法的性能至关重要取决于用于初始化该本地搜索的估计的质量。虽然在文献中出现了SLAM和RA的许多初始化方法,但通常可以获得纯粹的启发式近似值,这使得难以确定是否(或在什么情况下)这些技术可以可靠地部署这些技术。相比之下,在这项工作中,我们研究通过光谱松弛镜头初始化的问题。具体而言,我们推出了SLAM和RA的简单谱弛豫,其形式使我们能够利用经典的线性代数技术(特征向量扰动界限)来控制从我们的光谱估计到(未知)地基实际和该距离作为测量噪声的函数的估计问题的全局最小化器。我们的结果揭示了测量网络在控制估计精度下播放的光谱图 - 理论性能的关键作用;此外,作为我们分析的副产物,我们在估计误差上获得了最大似然估计的估计误差,这可能具有独立兴趣。最后,我们在实验上展示了我们的光谱估计器在实践中非常有效,与现有的最先进技术相比,在较低的计算成本下生产可比或优异质量的初始化。
translated by 谷歌翻译
作为解决多视图注册问题的有效算法,已经对运动平均(MA)算法进行了广泛的研究,并引入了许多基于MA的算法。他们旨在从相对动作中恢复全球动作,并利用信息冗余到平均累积错误。但是,这些方法的一个属性是,它们使用ugas-newton方法来解决最小二乘问题以增加全球运动的增加,这可能会导致效率低下,并且对异常值的稳健性差。在本文中,我们提出了一个新的运动平均框架,用于使用Laplacian基于Laplacian的最大Correntropy Criterion(LMCC)进行多视图注册。利用Lie代数运动框架和CorrentRopy量度,我们提出了一种新的成本函数,该功能应考虑相对动作提供的所有约束。获得用于纠正全局动作的增量,可以进一步提出为旨在最大化成本函数的优化问题。凭借二次技术,可以通过分为两个子问题来解决优化问题,即根据当前残差计算每个相对运动的重量,并解决二阶锥体程序问题(SOCP)以增加下一个迭代。我们还提供了一种新的策略来确定内核宽度,以确保我们的方法可以有效利用许多异常值的相对运动提供的信息冗余。最后,我们将提出的方法与其他基于MA的多视图注册方法进行比较,以验证其性能。关于合成和实际数据的实验测试表明,我们的方法在效率,准确性和鲁棒性方面取得了卓越的性能。
translated by 谷歌翻译
Outier-bubust估计是一个基本问题,已由统计学家和从业人员进行了广泛的研究。在过去的几年中,整个研究领域的融合都倾向于“算法稳定统计”,该统计数据的重点是开发可拖动的异常体 - 固定技术来解决高维估计问题。尽管存在这种融合,但跨领域的研究工作主要彼此断开。本文桥接了有关可认证的异常抗衡器估计的最新工作,该估计是机器人技术和计算机视觉中的几何感知,并在健壮的统计数据中并行工作。特别是,我们适应并扩展了最新结果对可靠的线性回归(适用于<< 50%异常值的低外壳案例)和列表可解码的回归(适用于>> 50%异常值的高淘汰案例)在机器人和视觉中通常发现的设置,其中(i)变量(例如旋转,姿势)属于非convex域,(ii)测量值是矢量值,并且(iii)未知的异常值是先验的。这里的重点是绩效保证:我们没有提出新算法,而是为投入测量提供条件,在该输入测量值下,保证现代估计算法可以在存在异常值的情况下恢复接近地面真相的估计值。这些条件是我们所谓的“估计合同”。除了现有结果的拟议扩展外,我们认为本文的主要贡献是(i)通过指出共同点和差异来统一平行的研究行,(ii)在介绍先进材料(例如,证明总和证明)中的统一行为。对从业者的可访问和独立的演讲,(iii)指出一些即时的机会和开放问题,以发出异常的几何感知。
translated by 谷歌翻译
变换同步是从给定的一组相对运动中恢复绝对变换的问题。尽管有其有用,但由于嘈杂和异常相对运动的影响,问题仍然具有挑战性,以及模拟分析并抑制它们高保真的难度。在这项工作中,我们避免了手工强大的损失功能,并建议使用图形神经网络(GNN)来学习转换同步。与使用复杂的多阶段管道的先前作品不同,我们使用迭代方法,其中每个步骤由单个重量共享消息传递层组成,通过预测切线空间中的增量更新,从前一个迭代中改进绝对姿势。为了减少异常值的影响,在聚合之前将加权消息。我们的迭代方法减轻了对明确初始化步骤的需求,并使用身份初始姿势进行良好。虽然我们的方法很简单,但我们表明它通过SO(3)和SE(3)同步的实验来对现有的手工和学习的同步方法进行有利的。
translated by 谷歌翻译
相关聚类是基于成对相似性和不同分数的数据集的框架,并且已用于生物信息学,社交网络分析和计算机视觉中的不同应用。尽管已经为该问题设计了许多近似算法,但是最好的理论结果依赖于通过昂贵的线性编程松弛获得下限。在本文中,我们证明了与强三合会封闭原理相关的相关聚类问题与边缘标签问题的新关系。我们使用这些连接来开发新的近似算法,用于具有确定性恒因子近似保证并避免规范线性编程放松的相关聚类。我们的方法还扩展到称为集群删除的相关聚类的变体,严格禁止将负边缘放入簇中。我们的结果包括基于简化的线性程序的集群删除和相关聚类的4个近似算法,其限制的限制性远远超过规范放松。更重要的是,我们基于在某些辅助图和超图中的计算最大匹配基于计算最大匹配来发展纯组合的更快技术。这导致组合6 - 近似用于完整的未加权关联聚类,这是任何不依赖线性编程的方法的最佳确定性结果。我们还介绍了集群删除的第一个组合常数因子近似。
translated by 谷歌翻译
我们研究了估计多元高斯分布中的精度矩阵的问题,其中所有部分相关性都是非负面的,也称为多变量完全阳性的顺序阳性($ \ mathrm {mtp} _2 $)。近年来,这种模型得到了重大关注,主要是由于有趣的性质,例如,无论底层尺寸如何,最大似然估计值都存在于两个观察。我们将此问题作为加权$ \ ell_1 $ -norm正常化高斯的最大似然估计下$ \ mathrm {mtp} _2 $约束。在此方向上,我们提出了一种新颖的预计牛顿样算法,该算法包含精心设计的近似牛顿方向,这导致我们具有与一阶方法相同的计算和内存成本的算法。我们证明提出的预计牛顿样算法会聚到问题的最小值。从理论和实验中,我们进一步展示了我们使用加权$ \ ell_1 $ -norm的制剂的最小化器能够正确地恢复基础精密矩阵的支持,而无需在$ \ ell_1 $ -norm中存在不连贯状态方法。涉及合成和实世界数据的实验表明,我们所提出的算法从计算时间透视比最先进的方法显着更有效。最后,我们在金融时序数据中应用我们的方法,这些数据对于显示积极依赖性,在那里我们在学习金融网络上的模块间值方面观察到显着性能。
translated by 谷歌翻译
我们考虑分布式姿势图优化(PGO)的问题,该问题在多机器人同时定位和映射(SLAM)中具有重要的应用。我们提出了用于分布式PGO($ \ mathsf {mm \!\!\!\!\!pgo} $)的大量最小化方法(mm)方法,该方法适用于一类宽类强大的损失内核。 $ \ mathsf {mm \!\! - \!\!pgo} $方法可以在轻度条件下收敛到一阶关键点。此外,请注意$ \ mathsf {mm \!\! - ! - \!\!pgo} $方法是让人联想到近端方法,我们利用Nesterov的方法并采用自适应重启来加速收敛。生成的分布式PGO的加速MM方法 - 既有网络中的主节点($ \ Mathsf {amm \!\!\!\!\!\! ! - \!\!pgo}^{#} $) - 与$ \ mathsf {mm \!\!\! - \!\!pgo} $相比,收敛速度更快,而无需牺牲理论保证。特别是,$ \ mathsf {amm \!\!\! - \!\! $ \ mathsf {amm \!\!\!\!pgo}^*$使用主节点从所有其他节点汇总信息。这项工作的功效通过对2D和3D SLAM基准数据集的广泛应用以及与现有最新方法的全面比较来验证,这表明我们的MM方法更快地收敛,并为分布式PGO提供更好的解决方案。
translated by 谷歌翻译
社区检测和正交组同步是科学和工程中各种重要应用的基本问题。在这项工作中,我们考虑了社区检测和正交组同步的联合问题,旨在恢复社区并同时执行同步。为此,我们提出了一种简单的算法,该算法由频谱分解步骤组成,然后是彼此枢转的QR分解(CPQR)。所提出的算法与数据点数线性有效且缩放。我们还利用最近开发的“休闲一淘汰”技术来建立近乎最佳保证,以确切地恢复集群成员资格,并稳定地恢复正交变换。数值实验证明了我们算法的效率和功效,并确认了我们的理论表征。
translated by 谷歌翻译
给定数据点之间的一组差异测量值,确定哪种度量表示与输入测量最“一致”或最能捕获数据相关几何特征的度量是许多机器学习算法的关键步骤。现有方法仅限于特定类型的指标或小问题大小,因为在此类问题中有大量的度量约束。在本文中,我们提供了一种活跃的集合算法,即项目和忘记,该算法使用Bregman的预测,以解决许多(可能是指数)不平等约束的度量约束问题。我们提供了\ textsc {project and Hoses}的理论分析,并证明我们的算法会收敛到全局最佳解决方案,并以指数速率渐近地渐近地衰减了当前迭代的$ L_2 $距离。我们证明,使用我们的方法,我们可以解决三种类型的度量约束问题的大型问题实例:一般体重相关聚类,度量近距离和度量学习;在每种情况下,就CPU时间和问题尺寸而言,超越了艺术方法的表现。
translated by 谷歌翻译
This paper is about a curious phenomenon. Suppose we have a data matrix, which is the superposition of a low-rank component and a sparse component. Can we recover each component individually? We prove that under some suitable assumptions, it is possible to recover both the low-rank and the sparse components exactly by solving a very convenient convex program called Principal Component Pursuit; among all feasible decompositions, simply minimize a weighted combination of the nuclear norm and of the 1 norm. This suggests the possibility of a principled approach to robust principal component analysis since our methodology and results assert that one can recover the principal components of a data matrix even though a positive fraction of its entries are arbitrarily corrupted. This extends to the situation where a fraction of the entries are missing as well. We discuss an algorithm for solving this optimization problem, and present applications in the area of video surveillance, where our methodology allows for the detection of objects in a cluttered background, and in the area of face recognition, where it offers a principled way of removing shadows and specularities in images of faces.
translated by 谷歌翻译
我们提供了传递用于使用图形模型推断的新消息传递算法。我们的方法是为最困难的推理问题而设计的,即循环信念传播和其他启发式方法无法融合。当基础图形模型是无环时,信念的传播可以保证会收敛,但是当基础图具有复杂的拓扑结构时,可能会收敛,并且对初始化敏感。本文描述了对标准信念传播算法的修改,这些算法导致方法会收敛到具有任意拓扑和潜在功能的图形模型上的独特解决方案。
translated by 谷歌翻译
我们提出了一种用于多旋转平均的新型等级方法,称为Hara。我们的方法基于Triplet支持的层次逐渐初始化旋转图。关键的想法是通过利用许多强三联网支持的边缘和逐渐添加具有较弱和更少支持的边缘来构建生成树。这降低了在生成树中添加异常值的风险。因此,我们获得了一个强大的初始解决方案,使我们能够在非线性优化之前过滤异常值。通过更新的修改,我们的方法还可以集成有效的2D-2D对应关系的数量。我们对合成和实际数据集进行广泛的评估,证明了最先进的结果。
translated by 谷歌翻译
我们在高维批处理设置中提出了统计上健壮和计算高效的线性学习方法,其中功能$ d $的数量可能超过样本量$ n $。在通用学习环境中,我们采用两种算法,具体取决于所考虑的损失函数是否为梯度lipschitz。然后,我们将我们的框架实例化,包括几种应用程序,包括香草稀疏,群 - 帕克斯和低升级矩阵恢复。对于每种应用,这导致了有效而强大的学习算法,这些算法在重尾分布和异常值的存在下达到了近乎最佳的估计率。对于香草$ S $ -SPARSITY,我们能够以重型尾巴和$ \ eta $ - 腐败的计算成本与非企业类似物相当的计算成本达到$ s \ log(d)/n $速率。我们通过开放源代码$ \ mathtt {python} $库提供了有效的算法实现文献中提出的最新方法。
translated by 谷歌翻译
K-Subspaces(KSS)方法是用于子空间聚类的K-均值方法的概括。在这项工作中,我们介绍了KSS的本地收敛分析和恢复保证,假设数据是由Smari-random的子空间模型生成的,其中$ n $点是从$ k \ ge 2 $重叠子空间随机采样的。我们表明,如果KSS方法的初始分配位于真实聚类的邻域内,则它以高等的速率收敛,并在$ \ theta(\ log \ log \ log n)$迭代中找到正确的群集。此外,我们提出了一种基于阈值的基于内部产品的光谱方法来初始化,并证明它在该社区中产生了一个点。我们还提出了研究方法的数值结果,以支持我们的理论发展。
translated by 谷歌翻译
本文提出了一种以直接非凸起的方式解决社区检测和组同步问题的广义电力方法(GPM)。在随机组块模型(SGBM)下,理论分析表明该算法能够在$ O(n \ log ^ 2n)$ time中完全恢复地面真相,急剧优化了SEMIDEfinite编程(SDP)的基准方法O(n ^ {3.5})$时间。此外,参数的下限作为精确恢复GPM的必要条件。新界违反了随机块模型(SBM)下纯社区检测的信息 - 理论阈值,从而展示了我们在连续执行两个任务的琐碎的两级方法上的同时优化算法的优越性。我们还对GPM和SDP进行了数值实验,以证据和补充我们的理论分析。
translated by 谷歌翻译
我们考虑使用共享结构估算两个功能无向图形模型之间的差异的问题。在许多应用中,数据自然被认为是随机函数的向量而不是标量的矢量。例如,脑电图(EEG)数据更适当地被视为时间函数。在这样的问题中,不仅可以每个样本测量的函数数量大,而且每个功能都是自身是无限尺寸对象,使估计模型参数具有挑战性。这进一步复杂于曲线通常仅在离散时间点观察到。我们首先定义一个功能差异图,捕获两个功能图形模型之间的差异,并在功能性差分图定义良好时正式表征。然后,我们提出了一种方法,软件,直接估计功能差异图,而不首先估计每个图形。这在各个图形是密集的情况下,这是特别有益的,但差分图是稀疏的。我们表明,融合始终估计功能差图,即使在全面观察和离散的功能路径的高维设置中也是如此。我们通过仿真研究说明了我们方法的有限样本性质。我们还提出了一种竞争方法,该方法是关节功能图形套索,它概括了关节图形套索到功能设置。最后,我们将我们的方法应用于EEG数据,以揭示一群含有酒精使用障碍和对照组的个体之间的功能性脑连接的差异。
translated by 谷歌翻译
在机器学习中调用多种假设需要了解歧管的几何形状和维度,理论决定了需要多少样本。但是,在应用程序数据中,采样可能不均匀,歧管属性是未知的,并且(可能)非纯化;这意味着社区必须适应本地结构。我们介绍了一种用于推断相似性内核提供数据的自适应邻域的算法。从本地保守的邻域(Gabriel)图开始,我们根据加权对应物进行迭代率稀疏。在每个步骤中,线性程序在全球范围内产生最小的社区,并且体积统计数据揭示了邻居离群值可能违反了歧管几何形状。我们将自适应邻域应用于非线性维度降低,地球计算和维度估计。与标准算法的比较,例如使用K-Nearest邻居,证明了它们的实用性。
translated by 谷歌翻译
线性神经网络层的模棱两可。在这项工作中,我们放宽了肩variance条件,只有在投影范围内才是真实的。特别是,我们研究了投射性和普通的肩那样的关系,并表明对于重要的例子,这些问题实际上是等效的。3D中的旋转组在投影平面上投影起作用。在设计用于过滤2D-2D对应的网络时,我们在实验上研究了旋转肩位的实际重要性。完全模型的模型表现不佳,虽然简单地增加了不变的特征,从而在强大的基线产量中得到了改善,但这似乎并不是由于改善的均衡性。
translated by 谷歌翻译