智能论文笔记

View-Disentangled Transformer for Brain Lesion Detection

Haofeng Li , Junjia Huang , Guanbin Li , Zhou Liu , Yihong Zhong , Yingying Chen , Yunfei Wang , Xiang Wan

分类：计算机视觉

2022-09-20

深度神经网络（DNN）已在脑病变检测和分割中广泛采用。但是，在2D MRI切片中定位小病变是具有挑战性的，需要在3D上下文聚集的粒度和计算复杂性之间取得平衡。在本文中，我们提出了一种新型的视角变压器，以增强MRI特征的提取，以进行更准确的肿瘤检测。首先，所提出的变压器在3D脑扫描中收获了不同位置之间的远程相关性。其次，变压器将一堆切片功能堆叠为多个2D视图，并增强这些特征的视图，该功能大致以有效的方式实现了3D相关计算。第三，我们将提出的变压器模块部署在变压器主链中，该模块可以有效地检测到脑损伤周围的2D区域。实验结果表明，我们提出的观看式变压器在具有挑战性的大脑MRI数据集上对大脑病变检测表现良好。

translated by 谷歌翻译

Few-Shot Classification with Contrastive Learning

Zhanyuan Yang , Jinghua Wang , Yingying Zhu

分类：计算机视觉

2022-09-17

由顺序训练和元训练阶段组成的两阶段训练范式已广泛用于当前的几次学习（FSL）研究。这些方法中的许多方法都使用自我监督的学习和对比度学习来实现新的最新结果。但是，在FSL培训范式的两个阶段，对比度学习的潜力仍未得到充分利用。在本文中，我们提出了一个新颖的基于学习的框架，该框架将对比度学习无缝地整合到两个阶段中，以提高少量分类的性能。在预训练阶段，我们提出了特征向量与特征映射和特征映射与特征映射的形式的自我监督对比损失，该图形与特征映射使用全局和本地信息来学习良好的初始表示形式。在元训练阶段，我们提出了一种跨视图的情节训练机制，以对同一情节的两个不同视图进行最近的质心分类，并采用基于它们的距离尺度对比度损失。这两种策略迫使模型克服观点之间的偏见并促进表示形式的可转让性。在三个基准数据集上进行的广泛实验表明，我们的方法可以实现竞争成果。

translated by 谷歌翻译

RIBAC: Towards Robust and Imperceptible Backdoor Attack against Compact DNN

Huy Phan , Cong Shi , Yi Xie , Tianfang Zhang , Zhuohang Li , Tianming Zhao , Jian Liu , Yan Wang , Yingying Chen , Bo Yuan

分类：计算机视觉

2022-08-22

最近，后门攻击已成为对深神经网络（DNN）模型安全性的新兴威胁。迄今为止，大多数现有研究都集中于对未压缩模型的后门攻击。尽管在实际应用中广泛使用的压缩DNN的脆弱性尚未得到利用。在本文中，我们建议研究和发展针对紧凑型DNN模型（RIBAC）的强大和不可感知的后门攻击。通过对重要设计旋钮进行系统分析和探索，我们提出了一个框架，该框架可以有效地学习适当的触发模式，模型参数和修剪口罩。从而同时达到高触发隐形性，高攻击成功率和高模型效率。跨不同数据集的广泛评估，包括针对最先进的防御机制的测试，证明了RIBAC的高鲁棒性，隐身性和模型效率。代码可从https://github.com/huyvnphan/eccv2022-ribac获得

translated by 谷歌翻译

Multi-Forgery Detection Challenge 2022: Push the Frontier of Unconstrained and Diverse Forgery Detection

Jianshu Li , Man Luo , Jian Liu , Tao Chen , Chengjie Wang , Ziwei Liu , Shuo Liu , Kewei Yang , Xuning Shao , Kang Chen

分类：计算机视觉

2022-07-27

在本文中，我们提出了与IEEE计算机协会在CVPR 2022上同时与IEEE计算机协会研讨会同时举行的多手术检测挑战。我们的多手术检测挑战旨在检测自动图像操作，包括但不限于图像编辑，图像合成，图像合成，图像，图像，图像，图像合成，图像，图像编辑一代，图像Photoshop等。我们的挑战吸引了来自世界各地的674支团队，约有2000个有效的结果提交数量。我们邀请了前十支球队为挑战提供解决方案，其中三支球队在大结局中获得了奖项。在本文中，我们介绍了前三名团队的解决方案，以增强图像伪造检测领域的研究工作。

translated by 谷歌翻译

Deepfake Video Detection with Spatiotemporal Dropout Transformer

Daichi Zhang , Fanzhao Lin , Yingying Hua , Pengju Wang , Dan Zeng , Shiming Ge

分类：计算机视觉 | 人工智能

2022-07-14

尽管最近对Deepfake技术的滥用引起了严重的关注，但由于每个帧的光真逼真的合成，如何检测DeepFake视频仍然是一个挑战。现有的图像级方法通常集中在单个框架上，而忽略了深击视频中隐藏的时空提示，从而导致概括和稳健性差。视频级检测器的关键是完全利用DeepFake视频中不同框架的当地面部区域分布在当地面部区域中的时空不一致。受此启发，本文提出了一种简单而有效的补丁级方法，以通过时空辍学变压器促进深击视频检测。该方法将每个输入视频重组成贴片袋，然后将其馈入视觉变压器以实现强大的表示。具体而言，提出了时空辍学操作，以充分探索斑块级时空提示，并作为有效的数据增强，以进一步增强模型的鲁棒性和泛化能力。该操作是灵活的，可以轻松地插入现有的视觉变压器中。广泛的实验证明了我们对25种具有令人印象深刻的鲁棒性，可推广性和表示能力的最先进的方法的有效性。

translated by 谷歌翻译

YACLC: A Chinese Learner Corpus with Multidimensional Annotation

Yingying Wang , Cunliang Kong , Liner Yang , Yijun Wang , Xiaorong Lu , Renfen Hu , Shan He , Zhenghao Liu , Yun Chen , Erhong Yang

分类：自然语言处理

2021-12-30

学习者语料库收集L2学习者产生的语言数据，即第二或外语学习者。这种资源与第二语言采集研究，外语教学和自动语法纠错有关。但是，几乎没有焦点汉语作为外语（CFL）学习者的学习者语料库。因此，我们建议构建大规模的多维注释的中国学习者语料库。要构建语料库，我们首先获得CFL学习者生成的大量富有的富主题文本。然后我们设计一个注释方案，包括句子可接受性得分以及语法错误和基于流畅的校正。我们构建一个众群平台，有效地执行注释（https://yaclc.wenmind.net）。我们命名语料库yaclc（又一个中国学习者语料库）并将其释放为Cuge基准（http://cuge.baai.ac.cn）。通过分析语料库中的原始句子和注释，我们发现Yaclc具有相当大的尺寸和非常高的注释质量。我们希望这项语料库能够进一步加强中国国际教育和中国自动语法纠错的研究。

translated by 谷歌翻译

Hyperparameter Selection for Subsampling Bootstraps

Yingying Ma , Hansheng Wang

分类： (统计)机器学习

2020-06-02

巨大的数据分析变得越来越普遍，像BLB（小袋子袋）这样的数据采样方法用作评估大规模数据估算质量的强大工具。然而，对数据采样方法的性能受到调整参数的选择（例如，子集大小，每个子集的重建数）的影响。在本文中，我们开发了一个高参数选择方法，可用于选择用于子采样方法的调整参数。具体而言，通过仔细的理论分析，我们在各种子采样估算器的渐近效率与近双数目之间找到了分析简单而优雅的关系。这导致了普瑞达格的最佳选择。更具体地说，对于任意指定的超参数集，我们可以将其改进为一组新的超参数，没有额外的CPU时间成本，但结果估计的统计效率可以得到很大改善。仿真研究和实际数据分析都展示了我们方法的优势优势。

translated by 谷歌翻译

Optimal Nonparametric Inference with Two-Scale Distributional Nearest Neighbors

Emre Demirkaya , Yingying Fan , Lan Gao , Jinchi Lv , Patrick Vossler , Jingbo Wang

分类： (统计)机器学习 | 机器学习

2018-08-25

加权最近的邻居（WNN）估计量通常用作平均回归估计的灵活且易于实现的非参数工具。袋装技术是一种优雅的方式，可以自动生成最近邻居的重量的WNN估计器；我们将最终的估计量命名为分布最近的邻居（DNN），以便于参考。然而，这种估计器缺乏分布结果，从而将其应用于统计推断。此外，当平均回归函数具有高阶平滑度时，DNN无法达到最佳的非参数收敛率，这主要是由于偏差问题。在这项工作中，我们对DNN提供了深入的技术分析，我们建议通过线性将两个DNN估计量与不同的子采样量表进行线性相结合，从而提出了DNN估计量的偏差方法，从而导致新型的两尺度DNN（TDNN（TDNN））估计器。两尺度的DNN估计量具有等效的WNN表示，重量承认明确形式，有些则是负面的。我们证明，由于使用负权重，两尺度DNN估计器在四阶平滑度条件下估算回归函数时享有最佳的非参数收敛速率。我们进一步超出了估计，并确定DNN和两个规模的DNN均无渐进地正常，因为亚次采样量表和样本量差异到无穷大。对于实际实施，我们还使用二尺度DNN的Jacknife和Bootstrap技术提供方差估计器和分配估计器。可以利用这些估计器来构建有效的置信区间，以用于回归函数的非参数推断。建议的两尺度DNN方法的理论结果和吸引人的有限样本性能用几个数值示例说明了。

translated by 谷歌翻译

BDD100K: A Diverse Driving Dataset for Heterogeneous Multitask Learning

Fisher Yu , Haofeng Chen , Xin Wang , Wenqi Xian , Yingying Chen , Fangchen Liu , Vashisht Madhavan , Trevor Darrell

分类：

2018-05-12

Datasets drive vision progress, yet existing driving datasets are impoverished in terms of visual content and supported tasks to study multitask learning for autonomous driving. Researchers are usually constrained to study a small set of problems on one dataset, while real-world computer vision applications require performing tasks of various complexities. We construct BDD100K 1 , the largest driving video dataset with 100K videos and 10 tasks to evaluate the exciting progress of image recognition algorithms on autonomous driving. The dataset possesses geographic, environmental, and weather diversity, which is useful for training models that are less likely to be surprised by new conditions. Based on this diverse dataset, we build a benchmark for heterogeneous multitask learning and study how to solve the tasks together. Our experiments show that special training strategies are needed for existing models to perform such heterogeneous tasks. BDD100K opens the door for future studies in this important venue.

translated by 谷歌翻译

Mining the Factor Zoo: Estimation of Latent Factor Models with Sufficient Proxies

Runzhe Wan , Yingying Li , Wenbin Lu , Rui Song

分类：机器学习

2022-12-25

Latent factor model estimation typically relies on either using domain knowledge to manually pick several observed covariates as factor proxies, or purely conducting multivariate analysis such as principal component analysis. However, the former approach may suffer from the bias while the latter can not incorporate additional information. We propose to bridge these two approaches while allowing the number of factor proxies to diverge, and hence make the latent factor model estimation robust, flexible, and statistically more accurate. As a bonus, the number of factors is also allowed to grow. At the heart of our method is a penalized reduced rank regression to combine information. To further deal with heavy-tailed data, a computationally attractive penalized robust reduced rank regression method is proposed. We establish faster rates of convergence compared with the benchmark. Extensive simulations and real examples are used to illustrate the advantages.

translated by 谷歌翻译