智能论文笔记

An Efficient Federated Distillation Learning System for Multi-task Time Series Classification

Huanlai Xing , Zhiwen Xiao , Rong Qu , Zonghai Zhu , Bowen Zhao

分类：机器学习 | 人工智能

2021-12-30

本文提出了一种有效的联邦蒸馏学习系统（EFDLS），用于多任务时间序列分类（TSC）。 EFDL由中央服务器和多个移动用户组成，不同的用户可能运行不同的TSC任务。 EFDLS有两种新型组件，即基于特征的学生 - 教师（FBST）框架和基于距离的权重匹配（DBWM）方案。在每个用户中，FBST框架通过知识蒸馏将教师隐藏层的知识转移到学生的隐藏层，与具有相同网络结构的教师和学生。对于每个连接的用户，其学生模型的隐藏层的权重定期上传到EFDLS服务器。 DBWM方案部署在服务器上，具有最小的方距离，用于测量两个给定模型的权重之间的相似性。该方案为每个连接的用户找到合作伙伴，使得用户及其伴侣的权重是上载的所有权重中最接近的权重。服务器交换并将其伙伴的权重发送给这两个用户，然后将所接收的权重加载到其教师隐藏的层。实验结果表明，所提出的EFDLS在一组选择的UCR2018数据集上实现了卓越的性能，这是一个精度的精度。

translated by 谷歌翻译

Federated Selective Aggregation for Knowledge Amalgamation

Donglin Xie , Ruonan Yu , Gongfan Fang , Jie Song , Zunlei Feng , Xinchao Wang , Li Sun , Mingli Song

分类：计算机视觉

2022-07-27

在本文中，我们探讨了一个新的知识障碍问题，称为联合选择性聚合（FEDSA）。 FEDSA的目的是在几位分散的教师的帮助下培训学生模型，以完成一项新任务，他们的预培训任务和数据是不同且不可知的。我们调查此类问题设置的动机源于最近的模型共享困境。许多研究人员或机构已经在培训大型且称职的网络上花费了巨大的资源。由于隐私，安全或知识产权问题，他们也无法分享自己的预培训模型，即使他们希望为社区做出贡献。拟议的FEDSA提供了解决这一困境的解决方案，并使其更进一步，因为学识渊博的学生可以专门从事与所有老师不同的新任务。为此，我们提出了一种处理FEDSA的专门战略。具体而言，我们的学生培训过程是由一种新型的基于显着性的方法驱动的，该方法可以适应教师作为参与者，并将其代表性能力融入到学生中。为了评估FEDSA的有效性，我们在单任务和多任务设置上进行实验。实验结果表明，FEDSA有效地将分散模型的知识融合在一起，并将竞争性能达到集中式基准。

translated by 谷歌翻译

Resource-aware Federated Learning using Knowledge Extraction and Multi-model Fusion

Sixing Yu , Wei Qian , Ali Jannesari

分类：机器学习

2022-08-16

随着对用户数据隐私的越来越关注，联合学习（FL）已被开发为在边缘设备上训练机器学习模型的独特培训范式，而无需访问敏感数据。传统的FL和现有方法直接在云服务器的同一型号和培训设备的所有边缘上采用聚合方法。尽管这些方法保护了数据隐私，但它们不能具有模型异质性，甚至忽略了异质的计算能力，也可以忽略陡峭的沟通成本。在本文中，我们目的是将资源感知的FL汇总为从边缘模型中提取的本地知识的集合，而不是汇总每个本地模型的权重，然后将其蒸馏成一个强大的全局知识，作为服务器模型通过知识蒸馏。通过深入的相互学习，将本地模型和全球知识提取到很小的知识网络中。这种知识提取使Edge客户端可以部署资源感知模型并执行多模型知识融合，同时保持沟通效率和模型异质性。经验结果表明，在异质数据和模型中的通信成本和概括性能方面，我们的方法比现有的FL算法有了显着改善。我们的方法将VGG-11的沟通成本降低了102美元$ \ times $和Resnet-32，当培训Resnet-20作为知识网络时，最多可达30美元$ \ times $。

translated by 谷歌翻译

MetaFed: Federated Learning among Federations with Cyclic Knowledge Distillation for Personalized Healthcare

Yiqiang Chen , Wang Lu , Xin Qin , Jindong Wang , Xing Xie

分类：机器学习

2022-06-17

联邦学习吸引了人们对建筑模型的越来越多的关注，而无需访问原始用户数据，尤其是在医疗保健方面。在实际应用中，由于可能的原因（例如数据异质性和中央服务器的不信任/不存在），不同的联合会很少合作。在本文中，我们提出了一个名为Metafed的新型框架，以促进不同联合会之间可信赖的FL。 METAFED通过提出的循环知识蒸馏为每个联邦提供一个个性化模型。具体而言，metafed将每个联盟视为元分布，并以环状方式汇总对每个联邦的知识。培训分为两个部分：常识的积累和个性化。在三个基准测试基准上进行的全面实验表明，与最先进的方法相比，无需服务器的METAFEF可以实现更好的准确性（例如，与PAMAP2的基线相比，沟通成本较少的基线相比，10％+的准确性提高了。

translated by 谷歌翻译

Cross-domain Federated Object Detection

Shangchao Su , Bin Li , Chengzhi Zhang , Mingzhao Yang , Xiangyang Xue

分类：计算机视觉

2022-06-30

一方（服务器）培训的检测模型可能会在分发给其他用户（客户）时面临严重的性能降解。例如，在自主驾驶场景中，不同的驾驶环境可能会带来明显的域移动，从而导致模型预测的偏见。近年来出现的联合学习可以使多方合作培训无需泄漏客户数据。在本文中，我们专注于特殊的跨域场景，其中服务器包含大规模数据，并且多个客户端仅包含少量数据。同时，客户之间的数据分布存在差异。在这种情况下，传统的联合学习技术不能考虑到所有参与者的全球知识和特定客户的个性化知识的学习。为了弥补这一限制，我们提出了一个跨域联合对象检测框架，名为FedOD。为了同时学习不同领域的全球知识和个性化知识，拟议的框架首先执行联合培训，以通过多教老师蒸馏获得公共全球汇总模型，并将汇总模型发送给每个客户端以供应其个性化的个性化模型本地模型。经过几轮沟通后，在每个客户端，我们可以对公共全球模型和个性化本地模型进行加权合奏推理。通过合奏，客户端模型的概括性能可以胜过具有相同参数量表的单个模型。我们建立了一个联合对象检测数据集，该数据集具有基于多个公共自主驾驶数据集的显着背景差异和实例差异，然后在数据集上进行大量实验。实验结果验证了所提出的方法的有效性。

translated by 谷歌翻译

FjORD: Fair and Accurate Federated Learning under heterogeneous targets with Ordered Dropout

Samuel Horvath , Stefanos Laskaridis , Mario Almeida , Ilias Leontiadis , Stylianos I. Venieris , Nicholas D. Lane

分类：机器学习

2021-02-26

联邦学习（FL）一直在不同的ML任务中获得显着的牵引力，从视野到键盘预测。在大规模的部署中，客户异质性是一个事实，并构成公平，培训性能和准确性的主要问题。虽然已经进行了统计数据异质性的重大努力，但是作为系统异质性称为客户端的处理能力和网络带宽的多样性仍然很大程度上是未开发的。当前解决方案无论是忽略大部分可用的设备，也无限制地设定均匀限制，由最低能力的参与者限制。在这项工作中，我们介绍了有序的辍学，这是一种机制，实现了深度神经网络（DNN）中的有序，嵌套的知识表示，并且能够在不需要再培训的情况下提取较低的脚印子模型。我们进一步表明，对于线性地图，我们的订购辍学等同于SVD。我们采用这种技术，以及一种自蒸馏方法，在一个叫做峡湾的框架中。 Fjord通过将模型宽度定制到客户端的功能来减轻客户体系异质性的问题。在各种方式上对CNN和RNN的广泛评估表明，峡湾始终如一地导致最先进的基线的显着性能，同时保持其嵌套结构。

translated by 谷歌翻译

Scalable Collaborative Learning via Representation Sharing

Frédéric Berdoz , Abhishek Singh , Martin Jaggi , Ramesh Raskar

分类：机器学习 | 人工智能

2022-11-20

Privacy-preserving machine learning has become a key conundrum for multi-party artificial intelligence. Federated learning (FL) and Split Learning (SL) are two frameworks that enable collaborative learning while keeping the data private (on device). In FL, each data holder trains a model locally and releases it to a central server for aggregation. In SL, the clients must release individual cut-layer activations (smashed data) to the server and wait for its response (during both inference and back propagation). While relevant in several settings, both of these schemes have a high communication cost, rely on server-level computation algorithms and do not allow for tunable levels of collaboration. In this work, we present a novel approach for privacy-preserving machine learning, where the clients collaborate via online knowledge distillation using a contrastive loss (contrastive w.r.t. the labels). The goal is to ensure that the participants learn similar features on similar classes without sharing their input data. To do so, each client releases averaged last hidden layer activations of similar labels to a central server that only acts as a relay (i.e., is not involved in the training or aggregation of the models). Then, the clients download these last layer activations (feature representations) of the ensemble of users and distill their knowledge in their personal model using a contrastive objective. For cross-device applications (i.e., small local datasets and limited computational capacity), this approach increases the utility of the models compared to independent learning and other federated knowledge distillation (FD) schemes, is communication efficient and is scalable with the number of clients. We prove theoretically that our framework is well-posed, and we benchmark its performance against standard FD and FL on various datasets using different model architectures.

translated by 谷歌翻译

Combined Federated and Split Learning in Edge Computing for Ubiquitous Intelligence in Internet of Things: State of the Art and Future Directions

Qiang Duan , Shijing Hu , Ruijun Deng , Zhihui Lu

分类：机器学习

2022-07-20

联合学习（FL）和分裂学习（SL）是两种新兴的协作学习方法，可能会极大地促进物联网（IoT）中无处不在的智能。联合学习使机器学习（ML）模型在本地培训的模型使用私人数据汇总为全球模型。分裂学习使ML模型的不同部分可以在学习框架中对不同工人进行协作培训。联合学习和分裂学习，每个学习都有独特的优势和各自的局限性，可能会相互补充，在物联网中无处不在的智能。因此，联合学习和分裂学习的结合最近成为一个活跃的研究领域，引起了广泛的兴趣。在本文中，我们回顾了联合学习和拆分学习方面的最新发展，并介绍了有关最先进技术的调查，该技术用于将这两种学习方法组合在基于边缘计算的物联网环境中。我们还确定了一些开放问题，并讨论了该领域未来研究的可能方向，希望进一步引起研究界对这个新兴领域的兴趣。

translated by 谷歌翻译

A Survey on Federated Learning Systems: Vision, Hype and Reality for Data Privacy and Protection

Qinbin Li , Zeyi Wen , Zhaomin Wu , Sixu Hu , Naibo Wang , Yuan Li , Xu Liu , Bingsheng He

分类：机器学习 | (统计)机器学习

2019-07-23

联邦学习一直是一个热门的研究主题，使不同组织的机器学习模型的协作培训在隐私限制下。随着研究人员试图支持更多具有不同隐私方法的机器学习模型，需要开发系统和基础设施，以便于开发各种联合学习算法。类似于Pytorch和Tensorflow等深度学习系统，可以增强深度学习的发展，联邦学习系统（FLSS）是等效的，并且面临各个方面的面临挑战，如有效性，效率和隐私。在本调查中，我们对联合学习系统进行了全面的审查。为实现流畅的流动和引导未来的研究，我们介绍了联合学习系统的定义并分析了系统组件。此外，我们根据六种不同方面提供联合学习系统的全面分类，包括数据分布，机器学习模型，隐私机制，通信架构，联合集市和联合的动机。分类可以帮助设计联合学习系统，如我们的案例研究所示。通过系统地总结现有联合学习系统，我们展示了设计因素，案例研究和未来的研究机会。

translated by 谷歌翻译

Resource-Aware Heterogeneous Federated Learning using Neural Architecture Search

Sixing Yu , Phuong Nguyen , Waqwoya Abebe , Justin Stanley , Pablo Munoz , Ali Jannesari

分类：机器学习 | 计算机视觉

2022-11-09

Federated Learning (FL) is extensively used to train AI/ML models in distributed and privacy-preserving settings. Participant edge devices in FL systems typically contain non-independent and identically distributed~(Non-IID) private data and unevenly distributed computational resources. Preserving user data privacy while optimizing AI/ML models in a heterogeneous federated network requires us to address data heterogeneity and system/resource heterogeneity. Hence, we propose \underline{R}esource-\underline{a}ware \underline{F}ederated \underline{L}earning~(RaFL) to address these challenges. RaFL allocates resource-aware models to edge devices using Neural Architecture Search~(NAS) and allows heterogeneous model architecture deployment by knowledge extraction and fusion. Integrating NAS into FL enables on-demand customized model deployment for resource-diverse edge devices. Furthermore, we propose a multi-model architecture fusion scheme allowing the aggregation of the distributed learning results. Results demonstrate RaFL's superior resource efficiency compared to SoTA.

translated by 谷歌翻译

The OARF Benchmark Suite: Characterization and Implications for Federated Learning Systems

Sixu Hu , Yuan Li , Xu Liu , Qinbin Li , Zhaomin Wu , Bingsheng He

分类：机器学习 | (统计)机器学习

2020-06-14

本文提出并表征了联合学习（OARF）的开放应用程序存储库，是联合机器学习系统的基准套件。以前可用的联合学习基准主要集中在合成数据集上，并使用有限数量的应用程序。 OARF模仿更现实的应用方案，具有公开的数据集，如图像，文本和结构数据中的不同数据孤岛。我们的表征表明，基准套件在数据大小，分布，特征分布和学习任务复杂性中多样化。与参考实施的广泛评估显示了联合学习系统的重要方面的未来研究机会。我们开发了参考实现，并评估了联合学习的重要方面，包括模型准确性，通信成本，吞吐量和收敛时间。通过这些评估，我们发现了一些有趣的发现，例如联合学习可以有效地提高端到端吞吐量。

translated by 谷歌翻译

Label driven Knowledge Distillation for Federated Learning with non-IID Data

Minh-Duong Nguyen , Quoc-Viet Pham , Dinh Thai Hoang , Long Tran-Thanh , Diep N. Nguyen , Won-Joo Hwang

分类：机器学习 | 人工智能

2022-09-29

在现实世界应用中，联合学习（FL）遇到了两个挑战：（1）可伸缩性，尤其是应用于大型物联网网络时；（2）如何使用异质数据对环境进行健全。意识到第一个问题，我们旨在设计一个名为Full-Stack FL（F2L）的新型FL框架。更具体地说，F2L使用层次结构架构，使扩展FL网络可以访问而无需重建整个网络系统。此外，利用层次网络设计的优势，我们在全球服务器上提出了一种新的标签驱动知识蒸馏（LKD）技术来解决第二个问题。与当前的知识蒸馏技术相反，LKD能够训练学生模型，该模型由所有教师模型的良好知识组成。因此，我们提出的算法可以有效地提取区域数据分布（即区域汇总模型）的知识，以减少客户在使用非独立分布数据的FL系统下操作时客户模型之间的差异。广泛的实验结果表明：（i）我们的F2L方法可以显着提高所有全球蒸馏的总体FL效率，并且（ii）F2L随着全球蒸馏阶段的发生而迅速达到收敛性，而不是在每个通信周期中提高。

translated by 谷歌翻译

TASKED: Transformer-based Adversarial learning for human activity recognition using wearable sensors via Self-KnowledgE Distillation

Sungho Suh , Vitor Fortes Rey , Paul Lukowicz

分类：计算机视觉 | 机器学习

2022-09-14

Wearable sensor-based human activity recognition (HAR) has emerged as a principal research area and is utilized in a variety of applications. Recently, deep learning-based methods have achieved significant improvement in the HAR field with the development of human-computer interaction applications. However, they are limited to operating in a local neighborhood in the process of a standard convolution neural network, and correlations between different sensors on body positions are ignored. In addition, they still face significant challenging problems with performance degradation due to large gaps in the distribution of training and test data, and behavioral differences between subjects. In this work, we propose a novel Transformer-based Adversarial learning framework for human activity recognition using wearable sensors via Self-KnowledgE Distillation (TASKED), that accounts for individual sensor orientations and spatial and temporal features. The proposed method is capable of learning cross-domain embedding feature representations from multiple subjects datasets using adversarial learning and the maximum mean discrepancy (MMD) regularization to align the data distribution over multiple domains. In the proposed method, we adopt the teacher-free self-knowledge distillation to improve the stability of the training procedure and the performance of human activity recognition. Experimental results show that TASKED not only outperforms state-of-the-art methods on the four real-world public HAR datasets (alone or combined) but also improves the subject generalization effectively.

translated by 谷歌翻译

FedDTG:Federated Data-Free Knowledge Distillation via Three-Player Generative Adversarial Networks

Zhenyuan Zhang

分类：机器学习

2022-01-10

将知识蒸馏应用于个性化的跨筒仓联合学习，可以很好地减轻用户异质性的问题。然而，这种方法需要一个代理数据集，这很难在现实世界中获得。此外，基于参数平均的全球模型将导致用户隐私的泄漏。我们介绍了一个分布式的三位玩家GaN来实现客户之间的DataFree共蒸馏。该技术减轻了用户异质性问题，更好地保护用户隐私。我们证实，GaN产生的方法可以使联合蒸馏更有效和稳健，并且在获得全球知识的基础上，共蒸馏可以为各个客户达到良好的性能。我们对基准数据集的广泛实验证明了与最先进的方法的卓越的泛化性能。

translated by 谷歌翻译

Designing ECG Monitoring Healthcare System with Federated Transfer Learning and Explainable AI

Ali Raza , Kim Phuc Tran , Ludovic Koehl , Shujun Li

分类：机器学习 | 人工智能

2021-05-26

深度学习在使用心电图（ECG）数据分类不同的心律失常方面发挥着重要作用。然而，培训深入学习模型通常需要大量数据，它可能导致隐私问题。不幸的是，无法从单个筒仓中容易地收集大量的医疗保健数据。此外，深度学习模型就像黑盒子，没有解释的预测结果，通常在临床医疗保健中需要。这限制了深度学习在现实世界卫生系统中的应用。在本文中，我们设计了一种基于ECG的医疗保健应用的联邦设置的新的可解释的人工智能（XAI）的深度学习框架。联合设置用于解决数据可用性和隐私问题等问题。此外，所提出的框架设置有效地根据卷积神经网络（CNN）使用AutoEncoder和分类器来分类心律失常。此外，我们提出了一个基于XAI的模块，在拟议的分类器的顶部上解释了分类结果，帮助临床从业者做出快速可靠的决策。拟议的框架是使用MIT-BIH心律失常数据库进行培训和测试。分类器可分别使用噪声和清洁数据进行高达94％和98％的精度，使用嘈杂和清洁数据，具有五倍的交叉验证。

translated by 谷歌翻译

Federated Robustness Propagation: Sharing Robustness in Heterogeneous Federated Learning

Junyuan Hong , Haotao Wang , Zhangyang Wang , Jiayu Zhou

分类：机器学习 | (统计)机器学习

2021-06-18

联合学习（FL）是一种流行的分布式学习模式，它可以从一组参与用户中学习模型而无需共享原始数据。 FL的一个主要挑战是异质用户，他们的分布不同（或非IID）数据和不同的计算资源。由于联合用户将使用该模型进行预测，因此他们经常要求训练有素的模型在测试时对恶意攻击者保持强大的态度。尽管对抗性培训（AT）为集中学习提供了一个合理的解决方案，但扩大对联合用户的使用范围已经引起了重大挑战，因为许多用户可能拥有非常有限的培训数据和严格的计算预算，以负担得起数据繁殖和成本高昂。在本文中，我们研究了一种新颖的FL策略：在联邦学习期间，从可负担得起的富裕用户的富裕用户传播对抗性的鲁棒性。我们表明，现有的FL技术不能与非IID用户之间稳健性的策略有效整合，并通过正确使用批处理规范化提出了有效的传播方法。我们通过广泛的实验证明了我们方法的合理性和有效性。特别是，即使只有一小部分用户在学习过程中，提出的方法也证明可以赋予联合模型出色的鲁棒性。源代码将发布。

translated by 谷歌翻译

FedICT: Federated Multi-task Distillation for Multi-access Edge Computing

Zhiyuan Wu , Sheng Sun , Yuwei Wang , Min Liu , Xuefeng Jiang , Bo Gao

分类：机器学习

2023-01-01

The growing interest in intelligent services and privacy protection for mobile devices has given rise to the widespread application of federated learning in Multi-access Edge Computing (MEC). Diverse user behaviors call for personalized services with heterogeneous Machine Learning (ML) models on different devices. Federated Multi-task Learning (FMTL) is proposed to train related but personalized ML models for different devices, whereas previous works suffer from excessive communication overhead during training and neglect the model heterogeneity among devices in MEC. Introducing knowledge distillation into FMTL can simultaneously enable efficient communication and model heterogeneity among clients, whereas existing methods rely on a public dataset, which is impractical in reality. To tackle this dilemma, Federated MultI-task Distillation for Multi-access Edge CompuTing (FedICT) is proposed. FedICT direct local-global knowledge aloof during bi-directional distillation processes between clients and the server, aiming to enable multi-task clients while alleviating client drift derived from divergent optimization directions of client-side local models. Specifically, FedICT includes Federated Prior Knowledge Distillation (FPKD) and Local Knowledge Adjustment (LKA). FPKD is proposed to reinforce the clients' fitting of local data by introducing prior knowledge of local data distributions. Moreover, LKA is proposed to correct the distillation loss of the server, making the transferred local knowledge better match the generalized representation. Experiments on three datasets show that FedICT significantly outperforms all compared benchmarks in various data heterogeneous and model architecture settings, achieving improved accuracy with less than 1.2% training communication overhead compared with FedAvg and no more than 75% training communication round compared with FedGKT.

translated by 谷歌翻译

FedMR: Fedreated Learning via Model Recombination

Ming Hu , Zhihao Yue , Zhiwei Ling , Xian Wei , Mingsong Chen

分类：机器学习

2022-08-16

作为一种有希望的隐私机器学习方法，联合学习（FL）可以使客户跨客户培训，而不会损害其机密的本地数据。但是，现有的FL方法遇到了不均分布数据的推理性能低的问题，因为它们中的大多数依赖于联合平均（FIDAVG）基于联合的聚合。通过以粗略的方式平均模型参数，FedAvg将局部模型的个体特征黯然失色，这极大地限制了FL的推理能力。更糟糕的是，在每一轮FL培训中，FedAvg向客户端向客户派遣了相同的初始本地模型，这很容易导致对最佳全局模型的局限性搜索。为了解决上述问题，本文提出了一种新颖有效的FL范式，名为FEDMR（联合模型重组）。与传统的基于FedAvg的方法不同，FEDMR的云服务器将收集到的本地型号的每一层层混合，并重组它们以实现新的模型，以供客户端培训。由于在每场FL比赛中进行了细粒度的模型重组和本地培训，FEDMR可以迅速为所有客户找出一个全球最佳模型。全面的实验结果表明，与最先进的FL方法相比，FEDMR可以显着提高推理准确性而不会引起额外的通信开销。

translated by 谷歌翻译

Edge-Cloud Polarization and Collaboration: A Comprehensive Survey

Jiangchao Yao , Shengyu Zhang , Yang Yao , Feng Wang , Jianxin Ma , Jianwei Zhang , Yunfei Chu , Luo Ji , Kunyang Jia , Tao Shen

分类：机器学习 | 人工智能

2021-11-11

受到深入学习的巨大成功通过云计算和边缘芯片的快速发展的影响，人工智能研究（AI）的研究已经转移到计算范例，即云计算和边缘计算。近年来，我们目睹了在云服务器上开发更高级的AI模型，以超越传统的深度学习模型，以造成模型创新（例如，变压器，净化家庭），训练数据爆炸和飙升的计算能力。但是，边缘计算，尤其是边缘和云协同计算，仍然在其初期阶段，因为由于资源受限的IOT场景，因此由于部署了非常有限的算法而导致其成功。在本调查中，我们对云和边缘AI进行系统审查。具体而言，我们是第一个设置云和边缘建模的协作学习机制，通过彻底的审查使能够实现这种机制的架构。我们还讨论了一些正在进行的先进EDGE AI主题的潜在和实践经验，包括预先训练模型，图形神经网络和加强学习。最后，我们讨论了这一领域的有希望的方向和挑战。

translated by 谷歌翻译

Parameterized Knowledge Transfer for Personalized Federated Learning

Jie Zhang , Song Guo , Xiaosong Ma , Haozhao Wang , Wencao Xu , Feijie Wu

分类：机器学习

2021-11-04

近年来，个性化联邦学习（PFL）引起了越来越关注其在客户之间处理统计异质性的潜力。然而，最先进的PFL方法依赖于服务器端的模型参数聚合，这需要所有模型具有相同的结构和大小，因此限制了应用程序以实现更多异构场景。要处理此类模型限制，我们利用异构模型设置的潜力，并提出了一种新颖的培训框架，为不同客户使用个性化模型。具体而言，我们将原始PFL中的聚合过程分为个性化组知识转移训练算法，即KT-PFL，这使得每个客户端能够在服务器端维护个性化软预测以指导其他人的本地培训。 KT-PFL通过使用知识系数矩阵的所有本地软预测的线性组合更新每个客户端的个性化软预测，这可以自适应地加强拥有类似数据分布的客户端之间的协作。此外，为了量化每个客户对他人的个性化培训的贡献，知识系数矩阵是参数化的，以便可以与模型同时培训。知识系数矩阵和模型参数在每轮梯度下降方式之后的每一轮中可替代地更新。在不同的设置（异构模型和数据分布）下进行各种数据集（EMNIST，Fashion \ _Mnist，CIFAR-10）的广泛实验。据证明，所提出的框架是第一个通过参数化群体知识转移实现个性化模型培训的联邦学习范例，同时实现与最先进的算法比较的显着性能增益。

translated by 谷歌翻译