视频框架插值〜(VFI)算法近年来由于数据驱动算法及其实现的前所未有的进展,近年来有了显着改善。最近的研究引入了高级运动估计或新颖的扭曲方法,以解决具有挑战性的VFI方案。但是,没有发表的VFI作品认为插值误差(IE)的空间不均匀特征。这项工作引入了这样的解决方案。通过密切检查光流与IE之间的相关性,本文提出了新的错误预测指标,该指标将中间框架分为与不同IE水平相对应的不同区域。它基于IE驱动的分割,并通过使用新颖的错误控制损耗函数,引入了一组空间自适应插值单元的合奏,该单元逐步处理并集成了分段区域。这种空间合奏会产生有效且具有诱人的VFI解决方案。对流行视频插值基准测试的广泛实验表明,所提出的解决方案在当前兴趣的应用中优于当前最新(SOTA)。
translated by 谷歌翻译
很少有人提出了几乎没有阶级的课程学习(FSCIL),目的是使深度学习系统能够逐步学习有限的数据。最近,一位先驱声称,通常使用的基于重播的课堂学习方法(CIL)是无效的,因此对于FSCIL而言并不是首选。如果真理,这对FSCIL领域产生了重大影响。在本文中,我们通过经验结果表明,采用数据重播非常有利。但是,存储和重播旧数据可能会导致隐私问题。为了解决此问题,我们或建议使用无数据重播,该重播可以通过发电机综合数据而无需访问真实数据。在观察知识蒸馏的不确定数据的有效性时,我们在发电机培训中强加了熵正则化,以鼓励更不确定的例子。此外,我们建议使用单速样标签重新标记生成的数据。这种修改使网络可以通过完全减少交叉渗透损失来学习,从而减轻了在常规知识蒸馏方法中平衡不同目标的问题。最后,我们对CIFAR-100,Miniimagenet和Cub-200展示了广泛的实验结果和分析,以证明我们提出的效果。
translated by 谷歌翻译
联邦学习〜(FL)最近引起了学术界和行业的越来越多的关注,其最终目标是在隐私和沟通限制下进行协作培训。现有的基于FL算法的现有迭代模型需要大量的通信回合,以获得良好的模型,这是由于不同客户之间的极为不平衡和非平衡的I.D数据分配。因此,我们建议FedDM从多个本地替代功能中构建全球培训目标,这使服务器能够获得对损失格局的更全球视野。详细说明,我们在每个客户端构建了合成数据集,以在本地匹配从原始数据到分发匹配的损失景观。与笨拙的模型权重相比,FedDM通过传输更多信息和较小的合成数据来降低通信回合并提高模型质量。我们对三个图像分类数据集进行了广泛的实验,结果表明,在效率和模型性能方面,我们的方法可以优于其他FL的实验。此外,我们证明,FedDM可以适应使用高斯机制来保护差异隐私,并在相同的隐私预算下训练更好的模型。
translated by 谷歌翻译
随机卷积内核变换(火箭)是使用大量不同配置的大量独立的随机初始化的1-D卷积内核来提取时间序列的快速,高效和新颖的方法。每个时间序列上的卷积操作的输出由部分正值(PPV)表示。来自所有内核的PPV的串联是输入特征向量到脊回归分类器。与典型的深度学习模型不同,内核未经训练,内核或串联功能和分类器之间没有加权/训练的连接。由于这些核是随机生成的,因此这些核中的一部分可能不会在模型的性能中贡献积极贡献。因此,需要选择最重要的内核并修剪冗余且不重要的内核,对于降低计算复杂性并加速了火箭在边缘设备上应用的推理。这些内核的选择是组合优化问题。在本文中,我们提出了一种在保持分类性能的同时选择这些内核的方案。首先,原始型号已全额培训。然后,初始化了二元候选状态媒介的群体,其中矢量的每个元素代表核的主动/非活动状态。基于人群的优化算法会进化人口,以找到最佳的状态向量,该媒介可最大程度地减少活性内核的数量,同时最大程度地提高分类器的准确性。该激活函数是活性内核总数的线性组合以及预训练的分类器与活动核的分类精度。最后,使用最佳状态矢量中的选定核用于训练脊回归分类器与所选核。
translated by 谷歌翻译
With the rapid development of artificial intelligence (AI) in medical image processing, deep learning in color fundus photography (CFP) analysis is also evolving. Although there are some open-source, labeled datasets of CFPs in the ophthalmology community, large-scale datasets for screening only have labels of disease categories, and datasets with annotations of fundus structures are usually small in size. In addition, labeling standards are not uniform across datasets, and there is no clear information on the acquisition device. Here we release a multi-annotation, multi-quality, and multi-device color fundus image dataset for glaucoma analysis on an original challenge -- Retinal Fundus Glaucoma Challenge 2nd Edition (REFUGE2). The REFUGE2 dataset contains 2000 color fundus images with annotations of glaucoma classification, optic disc/cup segmentation, as well as fovea localization. Meanwhile, the REFUGE2 challenge sets three sub-tasks of automatic glaucoma diagnosis and fundus structure analysis and provides an online evaluation framework. Based on the characteristics of multi-device and multi-quality data, some methods with strong generalizations are provided in the challenge to make the predictions more robust. This shows that REFUGE2 brings attention to the characteristics of real-world multi-domain data, bridging the gap between scientific research and clinical application.
translated by 谷歌翻译
极端多标签文本分类(XMC)问题问题是从大型标签集查找输入文本实例的大多数相关标签。但是,XMC设置面临两个挑战:(1)不允许在动态环境中预测看不见的标签,(2)它需要大量监督(实例,标签)对,这可能难以获得新兴域名。最近,已经研究了广义零拍XMC(GZ-XMC)设置,并相应地提出了Zestxml以处理未经调整的标签,这仍需要大量注释(实例,标签)对。在本文中,我们考虑了一个更实际的场景,称为极端零拍摄XMC(EZ-XMC),其中不需要监督,并且只能访问实例的原始文本和标签。少量XMC(FS-XMC),还调查了具有有限监督的EZ-XMC的扩展。要学习实例的语义嵌入和标签与原始文本,我们建议预先列车基于变压器的编码器,具有自我监督的对比损失。具体而言,我们开发了一种预训练方法MACLR,它彻底利用了使用多尺度自适应聚类,标签正则化和具有伪正对的自我训练的技术的原始文本。四个公共EZ-XMC数据集的实验结果表明,与所有其他领先的基线方法相比,MaclR达到了卓越的性能,特别是平均精度和召回的预测约为5-10%。此外,我们还表明,当在训练中存在有限数量的地面真相阳性对时,我们的预训练编码器可以进一步提高FS-XMC。通过在这样的几滴子集中进行微调,Maclr仍然显着优于其他极端分类器。
translated by 谷歌翻译
This paper introduces a structure-deformable land-air robot which possesses both excellent ground driving and flying ability, with smooth switching mechanism between two modes. The elaborate coupled dynamics model of the proposed robot is established, including rotors, chassis, especially the deformable structures. Furthermore, taking fusion locomotion and complex near-ground situations into consideration, a model based controller is designed for landing and mode switching under various harsh conditions, in which we realise the cooperation between fused two motion modes. The entire system is implemented in ADAMS/Simulink simulation and in practical. We conduct experiments under various complex scenarios. The results show our robot can accomplish land-air switching swiftly and smoothly, and the designed controller can effectively improve the landing flexibility and reliability.
translated by 谷歌翻译
优化器的高效和自动化设计在全栈自动系统中起着至关重要的作用。但是,优化器搜索中的先前方法通常受其可扩展性,生成性或样品效率的限制。为了将优化器搜索的研究和应用民主化,我们提出了第一个有效,可扩展和可推广的框架,可以直接搜索感兴趣的任务。我们首先观察到优化器更新从根本上是数学表达式应用于梯度。受到基础数学表达式的先天树结构的启发,我们将优化器的空间重新安排到一个超树中,每个路径都编码优化器。这样,优化器搜索可以自然地作为路径找到问题,从而使各种建立的树遍历方法可以用作搜索算法。我们采用蒙特卡洛方法的改编来进行树木搜索,配备拒绝采样和等效形式检测,以利用优化器更新规则的特征来进一步提高样本效率。我们提供了一套多种任务,以基于我们的算法进行基准测试,并证明,只有128个评估,提出的框架可以发现超过人类设计的对应方和先前的优化器搜索方法的优化器。
translated by 谷歌翻译
分类器在实践中已被广泛实施,而如何正确评估它们仍然是一个问题。通常,基于混淆矩阵和损失函数分别使用两种类型的指标在灵活性和数学完整性方面具有不同的优势,而它们在不同的困境中挣扎,例如对轻微改进或在不同任务中缺乏可定制性的不敏感性。在本文中,我们提出了一个基于概率预测的抽象表示,以及用于处理多分类中负面类别的目标设计的新颖指标,称为Meta模式关注得分,并降低了度量的离散性,以实现的优势,以实现两种指标都避免了它们的弱点。我们的指标提供了定制性,可以在不同实践中选择特定要求的模型,并确保在传统指标下也可以很好地选择模型。四种模型和六个数据集的评估证明了我们的度量的有效性和效率,案例研究表明,它可以选择模型来减少0.53%的危险错误分类,仅牺牲0.04%的培训准确性。
translated by 谷歌翻译
深神经网络(DNN)分类器容易受到对抗攻击的影响。尽管现有的基于梯度的攻击在馈送前向模型和图像识别任务中取得了良好的性能,但在复发性神经网络(RNN)中的时间序列分类的扩展仍然是一个困境,因为RNN的周期性结构可防止直接模型差异化和模型差异化和对时间序列数据扰动的视觉敏感性挑战了传统的局部优化目标,以最大程度地减少扰动。在本文中,提出了一种有效且广泛的方法,称为TSFool,用于为RNN分类器制定高质量的对抗时间序列。我们提出了一个名为“伪装系数”的新型全球优化目标,以考虑对抗样本在类群中的掩盖程度,因此将高质量的对抗性攻击重新定义为多目标优化问题。我们还提出了一个新的想法,以使用干预的加权有限自动机(IWFA)捕获具有其他特征和潜在歧管之间具有其他性的深层嵌入式脆弱样本,以指导优化解决方案的近似值。进行了22个UCR数据集的实验,以确认TSFool是一种广泛有效,有效且高质量的方法,局部扰动减少了93.22%,全局伪装更好32.33%,对现有方法的加速速度为1.12倍。
translated by 谷歌翻译