智能论文笔记

Federated Semi-Supervised Domain Adaptation via Knowledge Transfer

Madhureeta Das , Xianhao Chen , Xiaoyong Yuan , Lan Zhang

分类：机器学习

2022-07-21

鉴于机器学习环境快速变化和昂贵的数据标记，当来自源域的标记数据与目标域的部分标记的数据在统计上不同时，必须进行半监督域的适应（SSDA）。大多数先前的SSDA研究都在集中进行，需要访问源和目标数据。但是，如今许多字段中的数据是由分布式终端设备生成的。由于隐私问题，数据可能是本地存储的，无法共享，从而导致现有SSDA研究的无效性。本文提出了一种创新的方法，以通过联合半监督域适应（FSSDA）命名的多个分布式和机密数据集实现SSDA。 FSSDA基于战略设计的知识蒸馏技术将SSDA与联合学习集成在一起，通过并行执行源和目标培训来提高效率。此外，FSSDA通过正确选择关键参数（即模仿参数）来控制跨域传输的知识量。此外，建议的FSSDA可以有效地推广到多源域适应方案。进行了广泛的实验，以证明FSSDA设计的有效性和效率。

translated by 谷歌翻译

Efficient Federated Learning for AIoT Applications Using Knowledge Distillation

Tian Liu , Jun Xia , Xian Wei , Ting Wang , Xin Fu , Mingsong Chen

分类：机器学习

2021-11-29

作为一个有前途的分布式机器学习范式，联合学习（FL）在不影响用户隐私的情况下培训具有分散数据的中央模型，这使得其被人工智能互联网（AIT）应用程序广泛使用。然而，传统的流体遭受了模型不准确，因为它会使用数据硬标签培训本地模型，并忽略与小概率不正确的预测的有用信息。虽然各种解决方案尽量解决传统流域的瓶颈，但大多数人都引入了显着的通信和记忆开销，使大规模的AIOT设备部署成为一个巨大的挑战。为了解决上述问题，本文提出了一种基于蒸馏的新型联合学习（DFL）架构，可实现AIT应用的高效准确。灵感来自知识蒸馏（KD），可以提高模型准确性，我们的方法将KD使用的软目标添加到FL模型培训，占用可忽略不计的网络资源。在每轮本地训练之后，通过每种充气设备的局部样品预测生成软目标，并用于下一轮模型训练。在DFL的本地培训期间，软目标和硬质标签都被用作模型预测的近似目标，以通过补充软目标的知识来提高模型准确性。为了进一步提高DFL模型的性能，我们设计了一种动态调整策略，用于调整KD中使用的两个损耗功能的比率，这可以最大限度地利用软目标和硬质标签。众所周知的基准测试的全面实验结果表明，我们的方法可以显着提高独立和相同分布（IID）和非IID数据的FL的模型精度。

translated by 谷歌翻译

Robust Semi-supervised Federated Learning for Images Automatic Recognition in Internet of Drones

Zhe Zhang , Shiyao Ma , Zhaohui Yang , Zehui Xiong , Jiawen Kang , Yi Wu , Kejia Zhang , Dusit Niyato

分类：机器学习 | 人工智能 | 计算机视觉

2022-01-03

空中接入网络已被识别为各种事物互联网（物联网）服务和应用程序的重要驾驶员。特别是，以无人机互联网为中心的空中计算网络基础设施已经掀起了自动图像识别的新革命。这种新兴技术依赖于共享地面真理标记的无人机（UAV）群之间的数据，以培训高质量的自动图像识别模型。但是，这种方法将带来数据隐私和数据可用性挑战。为了解决这些问题，我们首先向一个半监督的联邦学习（SSFL）框架提供隐私保留的UAV图像识别。具体而言，我们提出了模型参数混合策略，以改善两个现实场景下的FL和半监督学习方法的天真组合（标签 - 客户端和标签 - 服务器），其被称为联合混合（FEDMIX）。此外，在不同环境中使用不同的相机模块，在不同环境中使用不同的相机模块，在不同的相机模块，即统计异质性，存在显着差异。为了减轻统计异质性问题，我们提出了基于客户参与训练的频率的聚合规则，即FedFReq聚合规则，可以根据其频率调整相应的本地模型的权重。数值结果表明，我们提出的方法的性能明显优于当前基线的性能，并且对不同的非IID等级的客户数据具有强大。

translated by 谷歌翻译

Feature Distribution Matching for Federated Domain Generalization

Yuwei Sun , Ng Chong , Hideya Ochiai

分类：机器学习

2022-03-22

多源域的适应性已深入研究。特定域固有的特征的分布变化会导致负转移降低模型的一般性，从而看不见任务。在联合学习（FL）中，为了利用来自不同领域的知识，共享学习的模型参数以训练全球模型。但是，FL的数据机密性阻碍了需要先验了解不同域数据的传统领域适应方法的有效性。为此，我们提出了一种称为联合知识一致性（FEDKA）的新联合领域生成方法。 FEDKA利用全局工作区中的特征分布匹配，以便全局模型可以在未知域数据的约束下学习域不变的客户端功能。设计了一种联合投票机制，以基于促进全球模型微调的客户的共识来生成目标域伪标签。我们进行了广泛的实验，包括消融研究，以评估拟议方法在图像分类任务和基于具有不同复杂性的模型体系结构的文本分类任务中的有效性。经验结果表明，FEDKA可以分别在数字五和办公室-Caltech10中实现8.8％和3.5％的绩效增长，并且在亚马逊审查中获得了0.7％的增长，并且培训数据极为有限。

translated by 谷歌翻译

Data-Free Knowledge Transfer: A Survey

Yuang Liu , Wei Zhang , Jun Wang , Jianyong Wang

分类：机器学习 | 计算机视觉

2021-12-31

在过去的十年中，许多深入学习模型都受到了良好的培训，并在各种机器智能领域取得了巨大成功，特别是对于计算机视觉和自然语言处理。为了更好地利用这些训练有素的模型在域内或跨域转移学习情况下，提出了知识蒸馏（KD）和域适应（DA）并成为研究亮点。他们旨在通过原始培训数据从训练有素的模型转移有用的信息。但是，由于隐私，版权或机密性，原始数据并不总是可用的。最近，无数据知识转移范式吸引了吸引人的关注，因为它涉及从训练有素的模型中蒸馏宝贵的知识，而无需访问培训数据。特别是，它主要包括无数据知识蒸馏（DFKD）和源无数据域适应（SFDA）。一方面，DFKD旨在将域名域内知识从一个麻烦的教师网络转移到一个紧凑的学生网络，以进行模型压缩和有效推论。另一方面，SFDA的目标是重用存储在训练有素的源模型中的跨域知识并将其调整为目标域。在本文中，我们对知识蒸馏和无监督域适应的视角提供了全面的数据知识转移，以帮助读者更好地了解目前的研究状况和想法。分别简要审查了这两个领域的应用和挑战。此外，我们对未来研究的主题提供了一些见解。

translated by 谷歌翻译

Source-Free Unsupervised Domain Adaptation: A Survey

Yuqi Fang , Pew-Thian Yap , Weili Lin , Hongtu Zhu , Mingxia Liu

分类：计算机视觉 | 人工智能 | 机器学习

2022-12-31

Unsupervised domain adaptation (UDA) via deep learning has attracted appealing attention for tackling domain-shift problems caused by distribution discrepancy across different domains. Existing UDA approaches highly depend on the accessibility of source domain data, which is usually limited in practical scenarios due to privacy protection, data storage and transmission cost, and computation burden. To tackle this issue, many source-free unsupervised domain adaptation (SFUDA) methods have been proposed recently, which perform knowledge transfer from a pre-trained source model to unlabeled target domain with source data inaccessible. A comprehensive review of these works on SFUDA is of great significance. In this paper, we provide a timely and systematic literature review of existing SFUDA approaches from a technical perspective. Specifically, we categorize current SFUDA studies into two groups, i.e., white-box SFUDA and black-box SFUDA, and further divide them into finer subcategories based on different learning strategies they use. We also investigate the challenges of methods in each subcategory, discuss the advantages/disadvantages of white-box and black-box SFUDA methods, conclude the commonly used benchmark datasets, and summarize the popular techniques for improved generalizability of models learned without using source data. We finally discuss several promising future directions in this field.

translated by 谷歌翻译

FedDTG:Federated Data-Free Knowledge Distillation via Three-Player Generative Adversarial Networks

Zhenyuan Zhang

分类：机器学习

2022-01-10

将知识蒸馏应用于个性化的跨筒仓联合学习，可以很好地减轻用户异质性的问题。然而，这种方法需要一个代理数据集，这很难在现实世界中获得。此外，基于参数平均的全球模型将导致用户隐私的泄漏。我们介绍了一个分布式的三位玩家GaN来实现客户之间的DataFree共蒸馏。该技术减轻了用户异质性问题，更好地保护用户隐私。我们证实，GaN产生的方法可以使联合蒸馏更有效和稳健，并且在获得全球知识的基础上，共蒸馏可以为各个客户达到良好的性能。我们对基准数据集的广泛实验证明了与最先进的方法的卓越的泛化性能。

translated by 谷歌翻译

Do We Really Need to Access the Source Data? Source Hypothesis Transfer for Unsupervised Domain Adaptation

Jian Liang , Dapeng Hu , Jiashi Feng

分类：

2020-02-20

Unsupervised domain adaptation (UDA) aims to leverage the knowledge learned from a labeled source dataset to solve similar tasks in a new unlabeled domain. Prior UDA methods typically require to access the source data when learning to adapt the model, making them risky and inefficient for decentralized private data. This work tackles a practical setting where only a trained source model is available and investigates how we can effectively utilize such a model without source data to solve UDA problems. We propose a simple yet generic representation learning framework, named Source HypOthesis Transfer (SHOT). SHOT freezes the classifier module (hypothesis) of the source model and learns the target-specific feature extraction module by exploiting both information maximization and selfsupervised pseudo-labeling to implicitly align representations from the target domains to the source hypothesis. To verify its versatility, we evaluate SHOT in a variety of adaptation cases including closed-set, partial-set, and open-set domain adaptation. Experiments indicate that SHOT yields state-of-the-art results among multiple domain adaptation benchmarks.

translated by 谷歌翻译

Uncertainty Minimization for Personalized Federated Semi-Supervised Learning

Yanhang Shi , Siguang Chen , Haijun Zhang

分类：机器学习

2022-05-05

自从联合学习（FL）被引入具有隐私保护的分散学习技术以来，分布式数据的统计异质性是实现FL应用中实现稳健性能和稳定收敛性的主要障碍。已经研究了模型个性化方法来克服这个问题。但是，现有的方法主要是在完全标记的数据的先决条件下，这在实践中是不现实的，由于需要专业知识。由部分标记的条件引起的主要问题是，标记数据不足的客户可能会遭受不公平的性能增益，因为他们缺乏足够的本地分销见解来自定义全球模型。为了解决这个问题，1）我们提出了一个新型的个性化的半监督学习范式，该范式允许部分标记或未标记的客户寻求与数据相关的客户（助手代理）的标签辅助，从而增强他们对本地数据的认识； 2）基于此范式，我们设计了一个基于不确定性的数据关系度量，以确保选定的帮助者可以提供值得信赖的伪标签，而不是误导当地培训； 3）为了减轻助手搜索引入的网络过载，我们进一步开发了助手选择协议，以实现有效的绩效牺牲的有效沟通。实验表明，与其他具有部分标记数据的相关作品相比，我们提出的方法可以获得卓越的性能和更稳定的收敛性，尤其是在高度异质的环境中。

translated by 谷歌翻译

SSDA-YOLO: Semi-supervised Domain Adaptive YOLO for Cross-Domain Object Detection

Huayi Zhou , Fei Jiang , Hongtao Lu

分类：计算机视觉

2022-11-04

Domain adaptive object detection (DAOD) aims to alleviate transfer performance degradation caused by the cross-domain discrepancy. However, most existing DAOD methods are dominated by computationally intensive two-stage detectors, which are not the first choice for industrial applications. In this paper, we propose a novel semi-supervised domain adaptive YOLO (SSDA-YOLO) based method to improve cross-domain detection performance by integrating the compact one-stage detector YOLOv5 with domain adaptation. Specifically, we adapt the knowledge distillation framework with the Mean Teacher model to assist the student model in obtaining instance-level features of the unlabeled target domain. We also utilize the scene style transfer to cross-generate pseudo images in different domains for remedying image-level differences. In addition, an intuitive consistency loss is proposed to further align cross-domain predictions. We evaluate our proposed SSDA-YOLO on public benchmarks including PascalVOC, Clipart1k, Cityscapes, and Foggy Cityscapes. Moreover, to verify its generalization, we conduct experiments on yawning detection datasets collected from various classrooms. The results show considerable improvements of our method in these DAOD tasks. Our code is available on \url{https://github.com/hnuzhy/SSDA-YOLO}.

translated by 谷歌翻译

Cross-domain Federated Object Detection

Shangchao Su , Bin Li , Chengzhi Zhang , Mingzhao Yang , Xiangyang Xue

分类：计算机视觉

2022-06-30

一方（服务器）培训的检测模型可能会在分发给其他用户（客户）时面临严重的性能降解。例如，在自主驾驶场景中，不同的驾驶环境可能会带来明显的域移动，从而导致模型预测的偏见。近年来出现的联合学习可以使多方合作培训无需泄漏客户数据。在本文中，我们专注于特殊的跨域场景，其中服务器包含大规模数据，并且多个客户端仅包含少量数据。同时，客户之间的数据分布存在差异。在这种情况下，传统的联合学习技术不能考虑到所有参与者的全球知识和特定客户的个性化知识的学习。为了弥补这一限制，我们提出了一个跨域联合对象检测框架，名为FedOD。为了同时学习不同领域的全球知识和个性化知识，拟议的框架首先执行联合培训，以通过多教老师蒸馏获得公共全球汇总模型，并将汇总模型发送给每个客户端以供应其个性化的个性化模型本地模型。经过几轮沟通后，在每个客户端，我们可以对公共全球模型和个性化本地模型进行加权合奏推理。通过合奏，客户端模型的概括性能可以胜过具有相同参数量表的单个模型。我们建立了一个联合对象检测数据集，该数据集具有基于多个公共自主驾驶数据集的显着背景差异和实例差异，然后在数据集上进行大量实验。实验结果验证了所提出的方法的有效性。

translated by 谷歌翻译

Federated Selective Aggregation for Knowledge Amalgamation

Donglin Xie , Ruonan Yu , Gongfan Fang , Jie Song , Zunlei Feng , Xinchao Wang , Li Sun , Mingli Song

分类：计算机视觉

2022-07-27

在本文中，我们探讨了一个新的知识障碍问题，称为联合选择性聚合（FEDSA）。 FEDSA的目的是在几位分散的教师的帮助下培训学生模型，以完成一项新任务，他们的预培训任务和数据是不同且不可知的。我们调查此类问题设置的动机源于最近的模型共享困境。许多研究人员或机构已经在培训大型且称职的网络上花费了巨大的资源。由于隐私，安全或知识产权问题，他们也无法分享自己的预培训模型，即使他们希望为社区做出贡献。拟议的FEDSA提供了解决这一困境的解决方案，并使其更进一步，因为学识渊博的学生可以专门从事与所有老师不同的新任务。为此，我们提出了一种处理FEDSA的专门战略。具体而言，我们的学生培训过程是由一种新型的基于显着性的方法驱动的，该方法可以适应教师作为参与者，并将其代表性能力融入到学生中。为了评估FEDSA的有效性，我们在单任务和多任务设置上进行实验。实验结果表明，FEDSA有效地将分散模型的知识融合在一起，并将竞争性能达到集中式基准。

translated by 谷歌翻译

Label driven Knowledge Distillation for Federated Learning with non-IID Data

Minh-Duong Nguyen , Quoc-Viet Pham , Dinh Thai Hoang , Long Tran-Thanh , Diep N. Nguyen , Won-Joo Hwang

分类：机器学习 | 人工智能

2022-09-29

在现实世界应用中，联合学习（FL）遇到了两个挑战：（1）可伸缩性，尤其是应用于大型物联网网络时；（2）如何使用异质数据对环境进行健全。意识到第一个问题，我们旨在设计一个名为Full-Stack FL（F2L）的新型FL框架。更具体地说，F2L使用层次结构架构，使扩展FL网络可以访问而无需重建整个网络系统。此外，利用层次网络设计的优势，我们在全球服务器上提出了一种新的标签驱动知识蒸馏（LKD）技术来解决第二个问题。与当前的知识蒸馏技术相反，LKD能够训练学生模型，该模型由所有教师模型的良好知识组成。因此，我们提出的算法可以有效地提取区域数据分布（即区域汇总模型）的知识，以减少客户在使用非独立分布数据的FL系统下操作时客户模型之间的差异。广泛的实验结果表明：（i）我们的F2L方法可以显着提高所有全球蒸馏的总体FL效率，并且（ii）F2L随着全球蒸馏阶段的发生而迅速达到收敛性，而不是在每个通信周期中提高。

translated by 谷歌翻译

Simultaneous Deep Transfer Across Domains and Tasks

Eric Tzeng , Judy Hoffman , Trevor Darrell , Kate Saenko

分类：

2015-10-08

Recent reports suggest that a generic supervised deep CNN model trained on a large-scale dataset reduces, but does not remove, dataset bias. Fine-tuning deep models in a new domain can require a significant amount of labeled data, which for many applications is simply not available. We propose a new CNN architecture to exploit unlabeled and sparsely labeled target domain data. Our approach simultaneously optimizes for domain invariance to facilitate domain transfer and uses a soft label distribution matching loss to transfer information between tasks. Our proposed adaptation method offers empirical performance which exceeds previously published results on two standard benchmark visual domain adaptation tasks, evaluated across supervised and semi-supervised adaptation settings.

translated by 谷歌翻译

Source Data-absent Unsupervised Domain Adaptation through Hypothesis Transfer and Labeling Transfer

Jian Liang , Dapeng Hu , Yunbo Wang , Ran He , Jiashi Feng

分类：计算机视觉 | 机器学习

2020-12-14

无监督域适应（UDA）旨在将知识从相关但不同的良好标记的源域转移到新的未标记的目标域。大多数现有的UDA方法需要访问源数据，因此当数据保密而不相配在隐私问题时，不适用。本文旨在仅使用培训的分类模型来解决现实设置，而不是访问源数据。为了有效地利用适应源模型，我们提出了一种新颖的方法，称为源假设转移（拍摄），其通过将目标数据特征拟合到冻结源分类模块（表示分类假设）来学习目标域的特征提取模块。具体而言，拍摄挖掘出于特征提取模块的信息最大化和自我监督学习，以确保目标特征通过同一假设与看不见的源数据的特征隐式对齐。此外，我们提出了一种新的标签转移策略，它基于预测的置信度（标签信息），然后采用半监督学习来将目标数据分成两个分裂，然后提高目标域中的较为自信预测的准确性。如果通过拍摄获得预测，我们表示标记转移为拍摄++。关于两位数分类和对象识别任务的广泛实验表明，拍摄和射击++实现了与最先进的结果超越或相当的结果，展示了我们对各种视域适应问题的方法的有效性。代码可用于\ url {https：//github.com/tim-learn/shot-plus}。

translated by 谷歌翻译

Towards Federated Learning against Noisy Labels via Local Self-Regularization

Xuefeng Jiang , Sheng Sun , Yuwei Wang , Min Liu

分类：机器学习 | 人工智能

2022-08-25

联邦学习（FL）旨在以隐私的方式从大规模的分散设备中学习联合知识。但是，由于高质量标记的数据需要昂贵的人类智能和努力，因此带有错误标签的数据（称为嘈杂标签）无处不在，实际上不可避免地会导致性能退化。尽管提出了许多直接处理嘈杂标签的方法，但这些方法要么需要过多的计算开销，要么违反FL的隐私保护原则。为此，我们将重点放在FL上，目的是减轻嘈杂标签所产生的性能退化，同时保证数据隐私。具体而言，我们提出了一种局部自我调节方法，该方法通过隐式阻碍模型记忆噪声标签并明确地缩小了使用自我蒸馏之间的原始实例和增强实例之间的模型输出差异，从而有效地规范了局部训练过程。实验结果表明，我们提出的方法可以在三个基准数据集上的各种噪声水平中获得明显的抵抗力。此外，我们将方法与现有的最新方法集成在一起，并在实际数据集服装1M上实现卓越的性能。该代码可在https://github.com/sprinter1999/fedlsr上找到。

translated by 谷歌翻译

Knowledge Distillation for Federated Learning: a Practical Guide

Alessio Mora , Irene Tenison , Paolo Bellavista , Irina Rish

分类：机器学习

2022-11-09

Federated Learning (FL) enables the training of Deep Learning models without centrally collecting possibly sensitive raw data. This paves the way for stronger privacy guarantees when building predictive models. The most used algorithms for FL are parameter-averaging based schemes (e.g., Federated Averaging) that, however, have well known limits: (i) Clients must implement the same model architecture; (ii) Transmitting model weights and model updates implies high communication cost, which scales up with the number of model parameters; (iii) In presence of non-IID data distributions, parameter-averaging aggregation schemes perform poorly due to client model drifts. Federated adaptations of regular Knowledge Distillation (KD) can solve and/or mitigate the weaknesses of parameter-averaging FL algorithms while possibly introducing other trade-offs. In this article, we provide a review of KD-based algorithms tailored for specific FL issues.

translated by 谷歌翻译

Semi-supervised Domain Adaptation via Sample-to-Sample Self-Distillation

Jeongbeen Yoon , Dahyun Kang , Minsu Cho

分类：计算机视觉

2021-11-29

半监督域适应（SSDA）是将学习者调整到新域，只有一小组标记的数据集在源域上给出时，只有一小组标记的样本。在本文中，我们提出了一种基于对的SSDA方法，使用用样品对的自蒸馏来适应靶域的模型。每个样本对由来自标记数据集（即源或标记为目标）的教师样本以及来自未标记数据集的学生样本（即，未标记的目标）组成。我们的方法通过在教师和学生之间传输中间样式来生成助手功能，然后通过最小化学生和助手之间的输出差异来培训模型。在培训期间，助手逐渐弥合了两个域之间的差异，从而让学生容易地从老师那里学习。标准基准测试的实验评估表明，我们的方法有效地减少了域间和域内的差异，从而实现了对最近的方法的显着改进。

translated by 谷歌翻译

DINE: Domain Adaptation from Single and Multiple Black-box Predictors

Jian Liang , Dapeng Hu , Jiashi Feng , Ran He

分类：计算机视觉 | 机器学习

2021-04-04

为了缓解标签的负担，无监督的域适应（UDA）旨在将知识传输到新的未标记数据集（目标）中的标记数据集（源）。尽管进展令人印象深刻，但先前的方法总是需要访问原始源数据，并开发数据相关的对准方法以以转换的学习方式识别目标样本，这可能会从源头中提高隐私问题。几个最近的研究通过利用来自源域的训练有素的白盒模型来替代解决方案，然而，它仍可能通过生成的对抗性学习泄漏原始数据。本文研究了UDA的实用和有趣的设置，其中仅在目标域中的适应期间提供了黑盒源模型（即，仅可用网络预测）。为了解决这个问题，我们提出了一个名为蒸馏和微调（用餐）的新的两步知识适应框架。考虑到目标数据结构，用餐首先将知识从源预测器蒸馏到定制的目标模型，然后微调蒸馏模型以进一步适合目标域。此外，神经网络不需要在用餐中的域中相同，甚至允许有效地适应低资源设备。三个UDA场景（即单源，多源和部分集）的经验结果确认，与最先进的数据相关的方法相比，该用途达到了高竞争力的性能。代码可用于\ url {https://github.com/tim-learn/dine/}。

translated by 谷歌翻译

Resource-aware Federated Learning using Knowledge Extraction and Multi-model Fusion

Sixing Yu , Wei Qian , Ali Jannesari

分类：机器学习

2022-08-16

随着对用户数据隐私的越来越关注，联合学习（FL）已被开发为在边缘设备上训练机器学习模型的独特培训范式，而无需访问敏感数据。传统的FL和现有方法直接在云服务器的同一型号和培训设备的所有边缘上采用聚合方法。尽管这些方法保护了数据隐私，但它们不能具有模型异质性，甚至忽略了异质的计算能力，也可以忽略陡峭的沟通成本。在本文中，我们目的是将资源感知的FL汇总为从边缘模型中提取的本地知识的集合，而不是汇总每个本地模型的权重，然后将其蒸馏成一个强大的全局知识，作为服务器模型通过知识蒸馏。通过深入的相互学习，将本地模型和全球知识提取到很小的知识网络中。这种知识提取使Edge客户端可以部署资源感知模型并执行多模型知识融合，同时保持沟通效率和模型异质性。经验结果表明，在异质数据和模型中的通信成本和概括性能方面，我们的方法比现有的FL算法有了显着改善。我们的方法将VGG-11的沟通成本降低了102美元$ \ times $和Resnet-32，当培训Resnet-20作为知识网络时，最多可达30美元$ \ times $。

translated by 谷歌翻译