通过图形反馈的在线学习问题已经在文献中进行了广泛的研究,因为它的一般性和对各种学习任务进行建模的潜力。现有作品主要研究对抗和随机反馈。如果对反馈机制的先验知识是不可用的或错误的,那么这种专门设计的算法可能会遭受巨大的损失。为了避免此问题,\ citet {ererez2021towards}尝试针对两个环境进行优化。但是,他们认为反馈图是无方向性的,每个顶点都有一个自循环,这会损害框架的通用性,并且在应用程序中可能无法满足。有了一般的反馈图,在拉动该手臂时可能无法观察到手臂,这使得探索更加昂贵,并且在两种环境中最佳性能的算法更具挑战性。在这项工作中,我们通过新的权衡机制克服了这一困难,并精心设计的探索和剥削比例。我们证明了所提出的算法同时实现$ \ mathrm {poly} \ log t $在随机设置中的遗憾,而在$ versarial设置中,$ \ tilde {o} $ \ tilde {o}的最小值遗憾t $是地平线,$ \ tilde {o} $隐藏参数独立于$ t $以及对数项。据我们所知,这是通用反馈图的第一个最佳世界结果。
translated by 谷歌翻译
汤普森抽样(TS)吸引了对强盗区域的兴趣。它在20世纪30年代介绍,但近年来尚未经过理论上证明。其在组合多武装强盗(CMAB)设置中的所有分析都需要精确的Oracle来提供任何输入的最佳解决方案。然而,这种Oracle通常是不可行的,因为许多组合优化问题是NP - 硬,并且只有近似oracles可用。一个例子(王和陈,2018)已经表明TS的失败来学习近似Oracle。但是,此Oracle罕见,仅用于特定问题实例。它仍然是一个开放的问题,无论TS的收敛分析是否可以扩展到CMAB中的精确oracle。在本文中,我们在贪婪的Oracle下研究了这个问题,这是一个常见的(近似)Oracle,具有理论上的保证来解决许多(离线)组合优化问题。我们提供了一个问题依赖性遗憾的遗憾下限为$ \ omega(\ log t / delta ^ 2)$,以量化Ts的硬度来解决贪婪的甲骨文的CMAB问题,其中$ T $是时间范围和$ Delta $是一些奖励差距。我们还提供几乎匹配的遗憾上限。这些是TS解决CMAB与常见近似甲骨文的第一个理论结果,并打破TS无法使用近似神谕的误解。
translated by 谷歌翻译
广义procrustes分析(GPA)是通过估计转换将多种形状带入共同参考的问题。 GPA已广泛研究了欧几里得和仿射转化。我们引入了具有可变形转换的GPA,这形成了一个更广泛和困难的问题。我们专门研究了称为线性基扭曲(LBW)的一类转换,该转换包含仿射转换和大多数常规变形模型,例如薄板样条(TPS)。具有变形的GPA是一个无凸的不受限制问题。我们使用两个形状约束来解决可变形GPA的基本歧义,这需要形状协方差的特征值。这些特征值可以独立计算为先验或后部。我们根据特征值分解给出了可变形GPA的封闭形式和最佳解决方案。该解决方案处理正则化,有利于平滑的变形场。它要求转换模型满足自由翻译的基本属性,该译本断言该模型可以实施任何翻译。我们表明,幸运的是,对于大多数常见的转换模型,包括仿射模型和TPS模型,这一属性是正确的。对于其他模型,我们为GPA提供了另一种封闭式解决方案,该解决方案与自由翻译模型的第一个解决方案完全吻合。我们提供用于计算解决方案的伪代码,导致提出的DEFPA方法,该方法快速,全球最佳且广泛适用。我们验证了我们的方法并将其与以前的六个不同2D和3D数据集的工作进行比较,并特别注意从交叉验证中选择超参数。
translated by 谷歌翻译
用户有权由第三方学习的系统删除其数据,这是由最近立法(例如《通用数据保护法规》(GDPR)和《加利福尼亚州消费者隐私法》(CCPA)编纂的。这样的数据删除可以通过全面的重新训练来实现,但是这为现代机器学习模型带来了高的计算成本。为了避免这种成本,已经开发了许多近似数据删除方法用于监督学习。相比之下,无监督的学习在很大程度上仍然是一个开放的问题,即(近似或精确)有效的数据删除。在本文中,我们为生成模型提出了一个基于密度比率的框架。使用此框架,我们引入了一种快速方法,用于近似数据删除和统计测试,以估算是否已删除培训点。我们在各种学习者假设下提供理论保证,并在各种生成方法中证明我们的方法。
translated by 谷歌翻译
已知大型预训练的生成模型偶尔提供出于各种原因可能不希望的样品。减轻这种情况的标准方法是以不同的方式重新培养模型。在这项工作中,我们采用了一种不同,更友好的方法,并调查了如何在训练后将模型置于模型之后,以便忘记某些样本。我们为gan提供了三种不同的算法,这些算法在描述了遗忘的样本方面有所不同。对现实世界图像数据集的广泛评估表明,我们的算法能够忘记数据,同时以全面重新训练成本的一小部分保留高生成质量。
translated by 谷歌翻译
人类骨骼数据由于其背景鲁棒性和高效率而受到行动识别的越来越多。在基于骨架的动作识别中,图形卷积网络(GCN)已成为主流方法。本文分析了基于GCN的模型的基本因素 - 邻接矩阵。我们注意到,大多数基于GCN的方法基于人类天然骨架结构进行其邻接矩阵。根据我们以前的工作和分析,我们建议人类的自然骨骼结构邻接矩阵不适合基于骨架的动作识别。我们提出了一个新的邻接矩阵,该矩阵放弃了所有刚性邻居的连接,但使该模型可以适应地学习关节的关系。我们对两个基于骨架的动作识别数据集(NTURGBD60和FINEGYM)进行了验证模型进行广泛的实验和分析。全面的实验结果和分析表明,1)最广泛使用的人类天然骨骼结构邻接矩阵在基于骨架的动作识别中不适合; 2)所提出的邻接矩阵在模型性能,噪声稳健性和可传递性方面表现出色。
translated by 谷歌翻译
基于范围视图的LIDAR分割方法由于其直接继承了有效的2D CNN体系结构,因此对实际应用具有吸引力。在文献中,大多数基于范围的方法都遵循每个像素分类范式。最近,在图像分割域中,另一个范式将分割作为面具分类问题,并实现了出色的性能。这提出了一个有趣的问题:掩码分类范式是否可以使基于范围的LIDAR分割受益并获得比每个像素范式对应的更好的性能?为了回答这个问题,我们为基于范围视图的LIDAR语义和全景分段提出了一个统一的面膜分类模型MaskRange。除了新的范式外,我们还提出了一种新型的数据增强方法,以应对过度拟合,上下文依赖和班级不平衡问题。大量实验是在Semantickitti基准测试上进行的。在所有基于范围视图的方法中,我们的面具以$ 66.10 $ MIOU的语义细分和有希望的结果以$ 53.10 $ pq的pq pq in Panoptic细分,以高效的效率达到了最新的性能。我们的代码将发布。
translated by 谷歌翻译
交通信号控制(TSC)是一个高风险域,随着交通量在全球的增长而增长。越来越多的作品将加固学习(RL)应用于TSC;RL可以利用大量的流量数据来提高信号效率。但是,从未部署基于RL的信号控制器。在这项工作中,我们提供了对TSC进行RL之前必须解决的挑战的首次审查。我们专注于四个涉及(1)检测不确定性的挑战,(2)通信的可靠性,(3)合规性和解释性以及(4)异构道路使用者。我们表明,基于RL的TSC的文献在应对每个挑战方面取得了一些进展。但是,更多的工作应采用系统思维方法,以考虑其他管道组件对RL的影响。
translated by 谷歌翻译
各种优化问题采用最​​小规范优化的形式。在本文中,我们研究了两个逐步构建的最小规范优化问题之间最佳值的变化,第二个测量值包括新的测量。我们证明了一个精确的方程式来计算线性最小规范优化问题中最佳值的变化。通过本文的结果,可以将最佳值的更改预先计算为指导在线决策的指标,而无需解决第二个优化问题,只要解决了第一个优化问题的解决方案和协方差。该结果可以扩展到线性最小距离优化问题,并通过线性化对(非线性)平等约束进行非线性最小距离优化。本文中的这一推论为RA-L 2018 Bai等人所示的经验观察提供了理论上的自我解释。作为另一个贡献,我们提出了另一个优化问题,即以给定姿势对齐两个轨迹,以进一步演示如何使用度量标准。用数值示例验证了度量的准确性,这通常是令人满意的(请参阅RA-L 2018 Bai等人}中的实验),除非在某些极其不利的情况下。最后但并非最不重要的一点是,通过提议的度量计算最佳值的速度至少要比直接解决相应的优化问题快一点。
translated by 谷歌翻译
估计看不见对象的6D姿势对许多现实世界应用非常有需求。但是,当前的最新姿势估计方法只能处理以前训练的对象。在本文中,我们提出了一项新任务,以使算法能够估计测试过程中新颖对象的6D姿势估计。我们收集一个具有真实图像和合成图像的数据集,并且在测试集中最多可见48个看不见的对象。同时,我们提出了一个名为infimum Add(IADD)的新指标,这是对具有不同类型姿势歧义的对象的不变测量。还提供了针对此任务的两个阶段基线解决方案。通过训练端到端的3D对应网络,我们的方法可以准确有效地找到看不见的对象和部分视图RGBD图像之间的相应点。然后,它使用算法鲁棒到对象对称性从对应关系中计算6D姿势。广泛的实验表明,我们的方法的表现优于几个直观基线,从而验证其有效性。所有数据,代码和模型都将公开可用。项目页面:www.graspnet.net/unseen6d
translated by 谷歌翻译