智能论文笔记

Comprehensive Graph Gradual Pruning for Sparse Training in Graph Neural Networks

Chuang Liu , Xueqi Ma , Yinbing Zhan , Liang Ding , Dapeng Tao , Bo Du , Wenbin Hu , Danilo Mandic

分类：机器学习 | 人工智能

2022-07-18

图形神经网络（GNNS）由于图形数据的规模和模型参数的数量呈指数增长，因此限制了它们在实际应用中的效用，因此往往会遭受高计算成本。为此，最近的一些作品着重于用彩票假设（LTH）稀疏GNN，以降低推理成本，同时保持绩效水平。但是，基于LTH的方法具有两个主要缺点：1）它们需要对密集模型进行详尽且迭代的训练，从而产生了极大的训练计算成本，2）它们仅修剪图形结构和模型参数，但忽略了节点功能维度，存在大量冗余。为了克服上述局限性，我们提出了一个综合的图形渐进修剪框架，称为CGP。这是通过在一个训练过程中设计在训练图周期修剪范式上进行动态修剪GNN来实现的。与基于LTH的方法不同，提出的CGP方法不需要重新训练，这大大降低了计算成本。此外，我们设计了一个共同策略，以全面地修剪GNN的所有三个核心元素：图形结构，节点特征和模型参数。同时，旨在完善修剪操作，我们将重生过程引入我们的CGP框架，以重新建立修剪但重要的连接。提出的CGP通过在6个GNN体系结构中使用节点分类任务进行评估，包括浅层模型（GCN和GAT），浅但深度散发模型（SGC和APPNP）以及Deep Models（GCNII和RESGCN），总共有14个真实图形数据集，包括来自挑战性开放图基准的大规模图数据集。实验表明，我们提出的策略在匹配时大大提高了训练和推理效率，甚至超过了现有方法的准确性。

translated by 谷歌翻译

UMAD: Universal Model Adaptation under Domain and Category Shift

Jian Liang , Dapeng Hu , Jiashi Feng , Ran He

分类：计算机视觉 | 机器学习

2021-12-16

学习目标域中的未知样本（不存在于源类中）对于无监督域适应（UDA）相当重要。存在两个典型的UDA方案，即开放式和开放式集合，后者假定目标域中并非所有源类都显示在内。但是，大多数先前的方法都是为一个UDA场景而设计的，并且始终在其他UDA方案上表现差。此外，它们还需要在适应过程中标记的源数据，限制其在数据隐私敏感应用中的可用性。为了解决这些问题，本文提出了一种通用模型适应（UMAD）框架，其处理了UDA方案，而无需访问源数据，也不是关于域之间类别的类别的知识。具体而言，我们的目标是使用优雅设计的双头分类器来学习源模型，并将其提供给目标域。在适应期间，我们开发了一种信息丰富的一致性分数，以帮助区分从已知样品中的未知样本。为了在目标域中实现双边适应，我们进一步最大化了局部化的相互信息，以将已知的样本与源分类器对齐，并采用熵丢失，以便分别推动远离源分类边界的未知样本。开放式和开放式的UDA方案的实验表明，umad作为无需访问源数据的统一方法，展示与最先进的数据相关方法的可比性。

translated by 谷歌翻译

How Well Does Self-Supervised Pre-Training Perform with Streaming Data?

Dapeng Hu , Shipeng Yan , Qizhengqiu Lu , Lanqing Hong , Hailin Hu , Yifan Zhang , Zhenguo Li , Xinchao Wang , Jiashi Feng

分类：机器学习 | 计算机视觉

2021-04-25

先前的关于自我监督预训练的研究重点是联合培训方案，在该场景中，假定大量未标记的数据一次性地将其作为输入，只有那时才受过培训的学习者。不幸的是，这种问题设置通常是不切实际的，即使不是不可行的，因为许多现实世界的任务依赖于顺序学习，例如，数据是以流方式分散或收集的。在本文中，我们对通过流数据进行了对自我监督的预训练进行了首次彻底而专门的研究，旨在阐明这种被忽视的设置下的模型行为。具体而言，我们在来自ImageNet和域内的四类预训练流数据数据上预先培训超过500个模型，并在三种类型的下游任务和12个不同的下游数据集上对其进行评估。我们的研究表明，以某种方式超出了我们的期望，通过简单的数据重播或参数正则化，顺序的自我监督预训练的预训练证明是联合预训练的有效替代方法，因为前者的性能主要与这些培训相同后者。此外，灾难性的遗忘是顺序监督学习中的一个常见问题，在顺序的自学学习（SSL）中得到了极大的缓解，这是通过我们对损失景观中最小值的表示和敏锐度的全面经验分析来很好地证明的。因此，我们的发现表明，在实践中，对于SSL，可以主要通过顺序学习来代替繁琐的联合培训，这反过来又可以更广泛的潜在应用方案。

translated by 谷歌翻译

DINE: Domain Adaptation from Single and Multiple Black-box Predictors

Jian Liang , Dapeng Hu , Jiashi Feng , Ran He

分类：计算机视觉 | 机器学习

2021-04-04

为了缓解标签的负担，无监督的域适应（UDA）旨在将知识传输到新的未标记数据集（目标）中的标记数据集（源）。尽管进展令人印象深刻，但先前的方法总是需要访问原始源数据，并开发数据相关的对准方法以以转换的学习方式识别目标样本，这可能会从源头中提高隐私问题。几个最近的研究通过利用来自源域的训练有素的白盒模型来替代解决方案，然而，它仍可能通过生成的对抗性学习泄漏原始数据。本文研究了UDA的实用和有趣的设置，其中仅在目标域中的适应期间提供了黑盒源模型（即，仅可用网络预测）。为了解决这个问题，我们提出了一个名为蒸馏和微调（用餐）的新的两步知识适应框架。考虑到目标数据结构，用餐首先将知识从源预测器蒸馏到定制的目标模型，然后微调蒸馏模型以进一步适合目标域。此外，神经网络不需要在用餐中的域中相同，甚至允许有效地适应低资源设备。三个UDA场景（即单源，多源和部分集）的经验结果确认，与最先进的数据相关的方法相比，该用途达到了高竞争力的性能。代码可用于\ url {https://github.com/tim-learn/dine/}。

translated by 谷歌翻译

Source Data-absent Unsupervised Domain Adaptation through Hypothesis Transfer and Labeling Transfer

Jian Liang , Dapeng Hu , Yunbo Wang , Ran He , Jiashi Feng

分类：计算机视觉 | 机器学习

2020-12-14

无监督域适应（UDA）旨在将知识从相关但不同的良好标记的源域转移到新的未标记的目标域。大多数现有的UDA方法需要访问源数据，因此当数据保密而不相配在隐私问题时，不适用。本文旨在仅使用培训的分类模型来解决现实设置，而不是访问源数据。为了有效地利用适应源模型，我们提出了一种新颖的方法，称为源假设转移（拍摄），其通过将目标数据特征拟合到冻结源分类模块（表示分类假设）来学习目标域的特征提取模块。具体而言，拍摄挖掘出于特征提取模块的信息最大化和自我监督学习，以确保目标特征通过同一假设与看不见的源数据的特征隐式对齐。此外，我们提出了一种新的标签转移策略，它基于预测的置信度（标签信息），然后采用半监督学习来将目标数据分成两个分裂，然后提高目标域中的较为自信预测的准确性。如果通过拍摄获得预测，我们表示标记转移为拍摄++。关于两位数分类和对象识别任务的广泛实验表明，拍摄和射击++实现了与最先进的结果超越或相当的结果，展示了我们对各种视域适应问题的方法的有效性。代码可用于\ url {https：//github.com/tim-learn/shot-plus}。

translated by 谷歌翻译

Domain Adaptation with Auxiliary Target Domain-Oriented Classifier

Jian Liang , Dapeng Hu , Jiashi Feng

分类：计算机视觉 | 机器学习

2020-07-08

域适应（DA）旨在将知识从标签富裕但异构的域转移到标签恐慌域，这减轻了标签努力并吸引了相当大的关注。与以前的方法不同，重点是学习域中的特征表示，一些最近的方法存在通用半监督学习（SSL）技术，直接将它们应用于DA任务，甚至实现竞争性能。最受欢迎的SSL技术之一是伪标记，可通过标记数据训练的分类器为每个未标记数据分配伪标签。但是，它忽略了DA问题的分布偏移，并且不可避免地偏置为源数据。要解决此问题，我们提出了一个名为辅助目标域导向的分类器（ATDOC）的新伪标签框架。 ATDOC通过为目标数据引入辅助分类器来缓解分类器偏置，以提高伪标签的质量。具体地，我们使用内存机制并开发两种类型的非参数分类器，即最近的质心分类器和邻域聚合，而不引入任何其他网络参数。尽管在伪分类目标中具有简单性，但具有邻域聚集的ATDOC显着优于域对齐技术和现有的SSL技术，以及甚至瘢痕标记的SSL任务。

translated by 谷歌翻译

Adversarial Domain Adaptation with Prototype-Based Normalized Output Conditioner

Dapeng Hu , Jian Liang , Qibin Hou , Hanshu Yan , Yunpeng Chen

分类：计算机视觉

2020-03-30

在这项工作中，我们试图通过设计简单和紧凑的条件领域的逆势培训方法来解决无监督的域适应。我们首先重新审视简单的级联调节策略，其中特征与输出预测连接为鉴别器的输入。我们发现倾斜策略遭受了弱势调节力量。我们进一步证明扩大连接预测的规范可以有效地激励条件域对齐。因此，我们通过将输出预测标准化具有相同的特征的输出预测来改善连接调节，并且派生方法作为归一化输出调节器〜（名词）。然而，对域对齐的原始输出预测的调理，名词遭受目标域的不准确预测。为此，我们建议将原型空间中的跨域特征对齐方式而不是输出空间。将新的原型基于原型的调节与名词相结合，我们将增强方法作为基于原型的归一化输出调节器〜（代词）。对象识别和语义分割的实验表明，名词可以有效地对准域跨域的多模态结构，甚至优于最先进的域侵犯训练方法。与基于原型的调节一起，代词进一步提高了UDA的多个对象识别基准上的名词的适应性能。

translated by 谷歌翻译

Do We Really Need to Access the Source Data? Source Hypothesis Transfer for Unsupervised Domain Adaptation

Jian Liang , Dapeng Hu , Jiashi Feng

分类：

2020-02-20

Unsupervised domain adaptation (UDA) aims to leverage the knowledge learned from a labeled source dataset to solve similar tasks in a new unlabeled domain. Prior UDA methods typically require to access the source data when learning to adapt the model, making them risky and inefficient for decentralized private data. This work tackles a practical setting where only a trained source model is available and investigates how we can effectively utilize such a model without source data to solve UDA problems. We propose a simple yet generic representation learning framework, named Source HypOthesis Transfer (SHOT). SHOT freezes the classifier module (hypothesis) of the source model and learns the target-specific feature extraction module by exploiting both information maximization and selfsupervised pseudo-labeling to implicitly align representations from the target domains to the source hypothesis. To verify its versatility, we evaluate SHOT in a variety of adaptation cases including closed-set, partial-set, and open-set domain adaptation. Experiments indicate that SHOT yields state-of-the-art results among multiple domain adaptation benchmarks.

translated by 谷歌翻译

FedTiny: Pruned Federated Learning Towards Specialized Tiny Models

Hong Huang , Lan Zhang , Chaoyue Sun , Ruogu Fang , Xiaoyong Yuan , Dapeng Wu

分类：机器学习 | 人工智能

2022-12-05

Neural network pruning has been a well-established compression technique to enable deep learning models on resource-constrained devices. The pruned model is usually specialized to meet specific hardware platforms and training tasks (defined as deployment scenarios). However, existing pruning approaches rely heavily on training data to trade off model size, efficiency, and accuracy, which becomes ineffective for federated learning (FL) over distributed and confidential datasets. Moreover, the memory- and compute-intensive pruning process of most existing approaches cannot be handled by most FL devices with resource limitations. In this paper, we develop FedTiny, a novel distributed pruning framework for FL, to obtain specialized tiny models for memory- and computing-constrained participating devices with confidential local data. To alleviate biased pruning due to unseen heterogeneous data over devices, FedTiny introduces an adaptive batch normalization (BN) selection module to adaptively obtain an initially pruned model to fit deployment scenarios. Besides, to further improve the initial pruning, FedTiny develops a lightweight progressive pruning module for local finer pruning under tight memory and computational budgets, where the pruning policy for each layer is gradually determined rather than evaluating the overall deep model structure. Extensive experimental results demonstrate the effectiveness of FedTiny, which outperforms state-of-the-art baseline approaches, especially when compressing deep models to extremely sparse tiny models.

translated by 谷歌翻译

S3E: A Large-scale Multimodal Dataset for Collaborative SLAM

Dapeng Feng , Yuhua Qi , Shipeng Zhong , Zhiqiang Chen , Yudu Jiao , Qiming Chen , Tao Jiang , Hongbo Chen

分类：机器人 | 计算机视觉

2022-10-25

With the advanced request to employ a team of robots to perform a task collaboratively, the research community has become increasingly interested in collaborative simultaneous localization and mapping. Unfortunately, existing datasets are limited in the scale and variation of the collaborative trajectories, even though generalization between inter-trajectories among different agents is crucial to the overall viability of collaborative tasks. To help align the research community's contributions with realistic multiagent ordinated SLAM problems, we propose S3E, a large-scale multimodal dataset captured by a fleet of unmanned ground vehicles along four designed collaborative trajectory paradigms. S3E consists of 7 outdoor and 5 indoor sequences that each exceed 200 seconds, consisting of well temporal synchronized and spatial calibrated high-frequency IMU, high-quality stereo camera, and 360 degree LiDAR data. Crucially, our effort exceeds previous attempts regarding dataset size, scene variability, and complexity. It has 4x as much average recording time as the pioneering EuRoC dataset. We also provide careful dataset analysis as well as baselines for collaborative SLAM and single counterparts. Data and more up-to-date details are found at https://github.com/PengYu-Team/S3E.

translated by 谷歌翻译