网络系统中的一个重要问题是检测和删除所谓的恶意节点。在这种情况下,一个关键的考虑因素是检测中的不确定性,加上对网络连接的考虑,这会导致错误地移除良性节点以及无法移除恶意节点而产生间接成本。最近提出的解决这个问题的方法直接解决了这些问题,但具有显着的局限性:它假定决策者对网络上节点的联合恶意概率有准确的了解。这在实践中显然不是这种情况,这种分布有限的证据是最好的估计。为了解决这个问题,我们提出了用于最佳节点移除的分布式鲁棒框架。虽然问题是NP-Hard,但我们提出了一种原理算法技术,可以基于二元性与半定规划松弛相结合来近似解决它。综合使用理论和实证分析,使用合成数据和实际数据,提供了强有力的证据证明非算法方法非常有效,特别是比现有技术更强大。
translated by 谷歌翻译
持续学习旨在使机器学习模型能够以顺序方式学习过去和未来任务的通用解决方案空间。 Conventionalmodels在学习新任务时倾向于忘记先前任务的知识,这种现象称为灾难性遗忘。当在持续学习中使用贝叶斯模型时,可以在两个方面保留以前任务的知识:1)。参数的后验分布,包含先前任务中推理的知识,然后作为后续任务的先验; 2)。核心集,包含以前任务的数据分布知识。在这里,我们通过分别使用自然梯度和斯坦梯度表明贝叶斯连续学习可以通过这两种方式得到促进。
translated by 谷歌翻译
视频对象移除在视频处理中是一项具有挑战性的任务,通常需要大量的人力。给定每个帧中前景对象的掩码,目标是完成(绘制)对象区域并生成目标对象的视频。虽然最近基于深度学习的方法在图像修复任务中取得了巨大成功,但是当应用于视频时,它们经常导致帧之间的结果不一致。在这项工作中,我们提出了一种新颖的基于学习的视频对象去除网络(VORNet),通过结合光流翘曲和基于图像的修复模型,以时空一致的方式解决视频对象去除任务。实验在我们的合成视频上完成基于YouTube-VOS视频分割数据集的对象移除(SVOR)数据集,客观和主观评估表明,与现有方法相比,我们的VORNet生成更多空间和时间上一致的视频。
translated by 谷歌翻译
我们通过$ \ ell_1 $ -minimization研究从一组信号中全局恢复字典的问题。我们假设信号是asi.i.d生成的。来自完整参考字典$ D ^ * \ in \ mathbb R ^ {K \ times K} $的$ K $原子的随机线性组合,其中线性组合系数来自伯努利型模型或精确稀疏模型。首先,我们获得必要且充分的规范条件,引用的字典$ D ^ * $是预期的$ \ ell_1 $目标函数的一个尖锐的局部最小值。我们的结果大大扩展了Wu和Yu(2015)的结果,并允许组合系数是非负的。其次,我们在所引用的字典的目标值最小的区域上获得显式绑定。第三,我们证明了参考字典是唯一的尖锐局部最小值,从而建立了第一个已知的$ \ ell_1 $ -minimization字典学习的全局属性。在理论结果的推动下,我们引入了基于扰动的测试来确定adictionary是否是目标函数的尖锐局部最小值。此外,我们还提出了一种新的基于Block CoordinateDescent的字典学习算法,称为DL-BCD,保证具有单调收敛性。模拟研究表明DL-BCD在恢复率方面具有竞争性,与许多状态相比。 -art字典学习算法。
translated by 谷歌翻译
能够解释来自实时视频流的场景的视觉算法对于计算机辅助手术系统来实现上下文感知行为是必要的。在腹腔镜手术中,这种系统所需的一种特定算法是手术阶段的识别,对于该手术阶段,现有技术是基于CNN-LSTM的模型。许多使用此类模型的先前工作已经以完全监督的方式训练它们,需要完全注释的数据集。相反,我们的工作面临着在提供大量注释数据(低于所有可用视频录像的25%)的情况下学习手术阶段识别的问题。我们提出了ateacher / student类型的方法,其中一个称为教师的强预测器,事先在一个关于地面实况注释视频的小数据集上进行训练,为更大的数据集生成合成注释,另一个模型 - 学生 - 从中​​学习。在我们的案例中,教师采用了新颖的CNN-biLSTM-CRF架构,仅用于离线推理。另一方面,学生是能够进行实时预测的CNN-LSTM。各种数量的手动注释视频的结果证明了新CNN-biLSTM-CRF预测器的优越性以及使用针对未注释视频生成的合成标签从CNN-LSTMtrained获得的改进性能。对于离线和在线手术阶段识别,只有很少的注释记录可用,这种新的教师/学生策略通过有效地利用未注释的数据提供了有价值的性能改进。
translated by 谷歌翻译
Kernel Bayesian inference is a principled approach to nonparametric inference in probabilistic graphical models, where probabilistic relationships between variables are learned from data in a nonparametric manner. Various algorithms of kernel Bayesian inference have been developed by combining kernelized basic probabilistic operations such as the kernel sum rule and kernel Bayes' rule. However, the current framework is fully nonparametric, and it does not allow a user to flexibly combine nonparametric and model-based inferences. This is inefficient when there are good probabilistic models (or simulation models) available for some parts of a graphical model; this is in particular true in scientific fields where "models" are the central topic of study. Our contribution in this paper is to introduce a novel approach, termed the model-based kernel sum rule (Mb-KSR), to combine a probabilistic model and kernel Bayesian inference. By combining the Mb-KSR with the existing kernelized probabilistic rules, one can develop various algorithms for hybrid (i.e., nonparametric and model-based) inferences. As an illustrative example, we consider Bayesian filtering in a state space model, where typically there exists an accurate probabilistic model for the state transition process. We propose a novel filtering method that combines model-based inference for 2 Yu Nishiyama et al. the state transition process and data-driven, nonparametric inference for the observation generating process. We empirically validate our approach with synthetic and real-data experiments, the latter being the problem of vision-based mobile robot localization in robotics, which illustrates the effectiveness of the proposed hybrid approach.
translated by 谷歌翻译
Heterogeneous network embedding (HNE) is a challenging task due to the diverse node types and/or diverse relationships between nodes. Existing HNE methods are typically unsupervised. To maximize the profit of utilizing the rare and valuable supervised information in HNEs, we develop a novel Active Heterogeneous Network Embedding (Ac-tiveHNE) framework, which includes two components: Discriminative Heterogeneous Network Embedding (DHNE) and Active Query in Heterogeneous Networks (AQHN). In DHNE, we introduce a novel semi-supervised heterogeneous network embedding method based on graph convolutional neu-ral network. In AQHN, we first introduce three active selection strategies based on uncertainty and representativeness, and then derive a batch selection method that assembles these strategies using a multi-armed bandit mechanism. ActiveHNE aims at improving the performance of HNE by feeding the most valuable supervision obtained by AQHN into DHNE. Experiments on public datasets demonstrate the effectiveness of ActiveHNE and its advantage on reducing the query cost.
translated by 谷歌翻译
多人姿势估计是计算机视觉的基本但具有挑战性的任务。需要丰富的上下文信息和空间信息以精确地定位图像中所有人的关键点。本文提出了一种新颖的上下文空间感知网络(CSANet),它集成了上下文感知路径和空间感知路径,以获取涉及上下文信息和空间信息的有效特征。具体来说,我们设计了一个具有结构的上下文感知路径。监督策略和空间金字塔汇集策略,以增强背景信息。同时,提出了一种空间感知路径来保存空间信息,同时缩短了从低级特征到高级特征的信息传播路径。在这两条路径的基础上,我们采用重头路径进一步有效地进一步组合和增强功能。实验上,我们提出的网络在COCO关键点基准测试中优于最先进的方法,验证了我们的方法的有效性,并进一步证实了以上命题。
translated by 谷歌翻译
在这项工作中,我们提出了一种强化学习算法,可以找到由任务奖励函数给出的任务的各种策略(新策略)。我们的方法通过创建第二个奖励函数来实现这一点,该函数识别先前看到的状态序列并通过新颖性来奖励那些,这是使用已经在状态序列上训练的自动编码器测量的。我们提出了一种两个目标的政策梯度算法更新技术,其中政策的每次更新都是在改善任务奖励和改进新颖奖励之间的折衷。使用这种方法,我们最终得到一系列策略,这些策略解决了给定的任务以及执行彼此不同的动作序列。我们在迷宫导航任务上展示这种方法,对于模拟的机器人手臂来说是一个达到的任务,以及一个用于料斗的运动任务。我们还证明了我们的方法在欺骗性任务中的有效性,其中政策梯度方法经常被卡住。
translated by 谷歌翻译
交通信号控制是一种新兴的应用场景,用于加强学习。除了作为影响人们通勤日常生活的重要问题之外,交通信号控制在适应动态交通环境和协调包括车辆和行人在内的数千名代理人方面对于强化学习提出了独特的挑战。现代强化学习成功的关键因素依赖于商品模拟器来生成大量用于学习的数据样本。然而,最常用的开源流量模拟器SUMO不能扩展到大型公路网和大流量,这阻碍了对交通场景的强化学习的研究。这促使我们创建一个新的流量模拟器CityFlow,它具有基本优化的数据结构和高效的算法。 CityFlow可以根据合成和真实数据支持灵活的道路网络和交通流量定义。它还提供了用户友好的强化学习界面。最重要的是,CityFlow比SUMO快20多倍,并且能够通过交互式渲染形式监控来支持全市范围的交通模拟。除了交通信号控制,CityFlow还可以作为其他交通研究的基础,并为智能交通领域的测试机器学习方法创造新的可能性。
translated by 谷歌翻译