智能论文笔记

Deep Temporal Contrastive Clustering

Ying Zhong , Dong Huang , Chang-Dong Wang

分类：机器学习

2022-12-29

Recently the deep learning has shown its advantage in representation learning and clustering for time series data. Despite the considerable progress, the existing deep time series clustering approaches mostly seek to train the deep neural network by some instance reconstruction based or cluster distribution based objective, which, however, lack the ability to exploit the sample-wise (or augmentation-wise) contrastive information or even the higher-level (e.g., cluster-level) contrastiveness for learning discriminative and clustering-friendly representations. In light of this, this paper presents a deep temporal contrastive clustering (DTCC) approach, which for the first time, to our knowledge, incorporates the contrastive learning paradigm into the deep time series clustering research. Specifically, with two parallel views generated from the original time series and their augmentations, we utilize two identical auto-encoders to learn the corresponding representations, and in the meantime perform the cluster distribution learning by incorporating a k-means objective. Further, two levels of contrastive learning are simultaneously enforced to capture the instance-level and cluster-level contrastive information, respectively. With the reconstruction loss of the auto-encoder, the cluster distribution loss, and the two levels of contrastive losses jointly optimized, the network architecture is trained in a self-supervised manner and the clustering result can thereby be obtained. Experiments on a variety of time series datasets demonstrate the superiority of our DTCC approach over the state-of-the-art.

translated by 谷歌翻译

Strongly Augmented Contrastive Clustering

Xiaozhi Deng , Dong Huang , Ding-Hua Chen , Chang-Dong Wang , Jian-Huang Lai

分类：机器学习 | 计算机视觉

2022-06-01

由于其通过深层神经网络的共同表示学习和聚类的能力，近年来，深层聚类引起了人们的关注。在其最新发展中，对比度学习已成为一种有效的技术，可实质性地提高深度聚类的性能。但是，现有的基于学习的基于对比的深层聚类算法主要集中于一些精心设计的增强（通常具有有限的转换以保留结构），被称为薄弱的增强，但不能超越弱化的增强，以探索更多的机会（随着更具侵略性的转变甚至严重的扭曲）。在本文中，我们提出了一种被称为强烈增强的对比聚类（SACC）的端到端深群集方法，该方法将传统的两夸大视图范式扩展到多种视图，并共同利用强大而弱的增强，以增强深层聚类。特别是，我们利用具有三重共享权重的骨干网络，在该网络中，强烈的增强视图和两个弱化的视图均融合在一起。基于主链产生的表示，弱进行弱化的视图对和强力视图对同时被利用用于实例级的对比度学习（通过实例投影仪）和群集级的对比度学习（通过群集投影仪），与主链一起可以以纯监督的方式共同优化。五个具有挑战性的图像数据集的实验结果表明，我们的SACC方法优于最先进的方法。该代码可在https://github.com/dengxiaozhi/sacc上找到。

translated by 谷歌翻译

Image Clustering with Contrastive Learning and Multi-scale Graph Convolutional Networks

Yuanku Xu , Dong Huang , Chang-Dong Wang , Jian-Huang Lai

分类：计算机视觉

2022-07-14

深度聚类最近引起了极大的关注。尽管取得了显着的进展，但以前的大多数深度聚类作品仍有两个局限性。首先，其中许多集中在某些基于分布的聚类损失上，缺乏通过对比度学习来利用样本（或增强）关系的能力。其次，他们经常忽略了间接样本结构信息，从而忽略了多尺度邻里结构学习的丰富可能性。鉴于这一点，本文提出了一种新的深聚类方法，称为图像聚类，其中包括对比度学习和多尺度图卷积网络（IcicleGCN），该网络（ICICELGCN）也弥合了卷积神经网络（CNN）和图形卷积网络（GCN）之间的差距。作为对比度学习与图像聚类任务的多尺度邻域结构学习之间的差距。所提出的IcicleGCN框架由四个主要模块组成，即基于CNN的主链，实例相似性模块（ISM），关节群集结构学习和实例重建模块（JC-SLIM）和多尺度GCN模块（M -GCN）。具体而言，在每个图像上执行了两个随机增强，使用两个重量共享视图的骨干网络用于学习增强样品的表示形式，然后将其馈送到ISM和JC-SLIM以进行实例级别和集群级别的对比度分别学习。此外，为了实施多尺度的邻域结构学习，通过（i）通过（i）层次融合的层相互作用和（ii）共同自适应学习确保他们的最后一层，同时对两个GCN和自动编码器进行了同时培训。层输出分布保持一致。多个图像数据集上的实验证明了IcicleGCN优于最先进的群集性能。

translated by 谷歌翻译

Vision Transformer for Contrastive Clustering

Hua-Bao Ling , Bowen Zhu , Dong Huang , Ding-Hua Chen , Chang-Dong Wang , Jian-Huang Lai

分类：计算机视觉 | 机器学习

2022-06-26

Vision Transformer（VIT）表明了其比卷积神经网络（CNN）的优势，其能够捕获全球远程依赖性以进行视觉表示学习。除了VIT，对比度学习是最近的另一个流行研究主题。尽管以前的对比学习作品主要基于CNN，但一些最新的研究试图共同对VIT进行建模和对比度学习，以增强自我监督的学习。尽管取得了很大的进步，但这些VIT和对比学习的组合主要集中在实例级对比度上，这些对比度通常忽略了全球聚类结构的对比度，并且缺乏直接学习聚类结果（例如图像）的能力。鉴于这一点，本文提出了一种端到端的深层图像聚类方法，称为对比群（VTCC）的视觉变压器（VTCC），据我们所知，该方法首次统一了变压器和对比度学习的对比度学习。图像聚类任务。具体而言，在微型批次中，在每个图像上执行了两个随机增强，我们利用具有两个重量分担视图的VIT编码器作为学习增强样品的表示形式。为了纠正VIT的潜在不稳定，我们结合了一个卷积茎，该卷积茎使用多个堆叠的小卷积而不是斑块投影层中的大卷积，将每个增强样品分为一系列斑块。通过通过主干学到的表示形式，实例投影仪和群集投影仪将进一步用于实例级对比度学习和全球聚类结构学习。在八个图像数据集上进行的广泛实验证明了VTCC的稳定性（在训练中）和优越性（在聚类性能中）比最先进的。

translated by 谷歌翻译

AUTOSHAPE: An Autoencoder-Shapelet Approach for Time Series Clustering

Guozhong Li , Byron Choi , Jianliang Xu , Sourav S Bhowmick , Daphne Ngar-yin Mah , Grace Lai-Hung Wong

分类：机器学习 | 人工智能

2022-08-06

时间序列形状是最近发现对时间序列聚类有效（TSC）有效的歧视子序列。形状方便地解释簇。因此，TSC的主要挑战是发现高质量的可变长度形状以区分不同的簇。在本文中，我们提出了一种新型的自动编码器窗帘方法（AutoShape），这是第一次利用自动编码器和塑形器以不受欢迎的方式确定形状的研究。自动编码器的专门设计用于学习高质量的形状。更具体地说，为了指导潜在的表示学习，我们采用了最新的自我监督损失来学习不同变量的可变长度塑形塑形（时间序列子序列）的统一嵌入，并提出多样性损失，以选择歧视嵌入的嵌入方式统一空间。我们介绍了重建损失，以在原始时间序列空间中恢复形状，以进行聚类。最后，我们采用Davies Bouldin指数（DBI），将学习过程中的聚类性能告知AutoShape。我们介绍了有关自动赛的广泛实验。为了评估单变量时间序列（UTS）的聚类性能，我们将AutoShape与使用UCR存档数据集的15种代表性方法进行比较。为了研究多元时间序列（MTS）的性能，我们使用5种竞争方法评估了30个UEA档案数据集的AutoShape。结果证明了AutoShape是所有比较的方法中最好的。我们用形状来解释簇，并可以在三个UTS案例研究和一个MTS案例研究中获得有关簇的有趣直觉。

translated by 谷歌翻译

A Comprehensive Survey on Deep Clustering: Taxonomy, Challenges, and Future Directions

Sheng Zhou , Hongjia Xu , Zhuonan Zheng , Jiawei Chen , Zhao li , Jiajun Bu , Jia Wu , Xin Wang , Wenwu Zhu , Martin Ester

分类：机器学习 | 人工智能

2022-06-15

聚类是一项基本的机器学习任务，在文献中已广泛研究。经典聚类方法遵循以下假设：数据通过各种表示的学习技术表示为矢量化形式的特征。随着数据变得越来越复杂和复杂，浅（传统）聚类方法无法再处理高维数据类型。随着深度学习的巨大成功，尤其是深度无监督的学习，在过去的十年中，已经提出了许多具有深层建筑的代表性学习技术。最近，已经提出了深层聚类的概念，即共同优化表示的学习和聚类，因此引起了社区的日益关注。深度学习在聚类中的巨大成功，最基本的机器学习任务之一以及该方向的最新进展的巨大成功所激发。 - 艺术方法。我们总结了深度聚类的基本组成部分，并通过设计深度表示学习和聚类之间的交互方式对现有方法进行了分类。此外，该调查还提供了流行的基准数据集，评估指标和开源实现，以清楚地说明各种实验设置。最后但并非最不重要的一点是，我们讨论了深度聚类的实际应用，并提出了应有的挑战性主题，应将进一步的研究作为未来的方向。

translated by 谷歌翻译

Dual Contrastive Attributed Graph Clustering Network

Tong Wang , Guanyu Yang , Junhua Wu , Qijia He , Zhenquan Zhang

分类：计算机视觉

2022-06-16

归因图群集是图形分析字段中最重要的任务之一，其目的是将具有相似表示的节点分组到没有手动指导的情况下。基于图形对比度学习的最新研究在处理图形结构数据方面取得了令人印象深刻的结果。但是，现有的基于图形学习的方法1）不要直接解决聚类任务，因为表示和聚类过程是分开的； 2）过多地取决于图数据扩展，这极大地限制了对比度学习的能力； 3）忽略子空间聚类的对比度消息。为了适应上述问题，我们提出了一个通用框架，称为双重对比归因于图形聚类网络（DCAGC）。在DCAGC中，通过利用邻里对比模块，将最大化邻居节点的相似性，并提高节点表示的质量。同时，对比度自我表达模块是通过在自我表达层重建之前和之后最小化节点表示形式来构建的，以获得用于光谱群集的区分性自我表达矩阵。 DCAGC的所有模块均在统一框架中训练和优化，因此学习的节点表示包含面向群集的消息。与16种最先进的聚类方法相比，四个属性图数据集的大量实验结果显示了DCAGC的优势。本文的代码可在https://github.com/wangtong627/dual-contrastive-attributed-graph-cluster-clustering-network上获得。

translated by 谷歌翻译

Dual Information Enhanced Multi-view Attributed Graph Clustering

Jia-Qi Lin , Man-Sheng Chen , Xi-Ran Zhu , Chang-Dong Wang , Haizhang Zhang

分类：人工智能

2022-11-28

Multi-view attributed graph clustering is an important approach to partition multi-view data based on the attribute feature and adjacent matrices from different views. Some attempts have been made in utilizing Graph Neural Network (GNN), which have achieved promising clustering performance. Despite this, few of them pay attention to the inherent specific information embedded in multiple views. Meanwhile, they are incapable of recovering the latent high-level representation from the low-level ones, greatly limiting the downstream clustering performance. To fill these gaps, a novel Dual Information enhanced multi-view Attributed Graph Clustering (DIAGC) method is proposed in this paper. Specifically, the proposed method introduces the Specific Information Reconstruction (SIR) module to disentangle the explorations of the consensus and specific information from multiple views, which enables GCN to capture the more essential low-level representations. Besides, the Mutual Information Maximization (MIM) module maximizes the agreement between the latent high-level representation and low-level ones, and enables the high-level representation to satisfy the desired clustering structure with the help of the Self-supervised Clustering (SC) module. Extensive experiments on several real-world benchmarks demonstrate the effectiveness of the proposed DIAGC method compared with the state-of-the-art baselines.

translated by 谷歌翻译

View-labels Are Indispensable: A Multifacet Complementarity Study of Multi-view Clustering

Chuanxing Geng , Aiyang Han , Songcan Chen

分类：机器学习 | 计算机视觉

2022-05-05

一致性和互补性是增强多视图聚类（MVC）的两种关键要素。最近，随着流行的对比学习的引入，MVC的观点一致性学习得到了进一步的增强，从而导致了有希望的表现。但是，相比之下，互补性尚未得到足够的关注，除了在功能方面，希尔伯特·施密特独立标准（HSIC）术语（HSIC）术语或通常采用独立的编码器网络以捕获特定视图信息。这促使我们从包括功能，视图标签和对比方面在内的多个方面全面地重新考虑对观点的互补学习，同时保持视图一致性。我们从经验上发现，所有方面都有助于互补学习，尤其是视图标签的方面，通常被现有方法忽略了。基于此，我们开发了一个小说\下划线{m} ultifacet \ usewissline {c} omplementarity学习框架\下划线{m} uldi- \ usepline {v} iew \ usew \ usew suespline {c} lustering（mcmvc），其中融合了多层配置配置。信息，尤其是明确嵌入视图标签信息的信息。据我们所知，这是第一次明确使用视图标签来指导视图的互补学习。与SOTA基线相比，MCMVC在$ 5.00 \％$ $ $ 5.00 \％$和$ 7.00 \％$中的平均利润率分别在CALTECH101-20上分别在CalTech101-20上分别取得了显着的进步，分别是三个评估指标。

translated by 谷歌翻译

Cross-view Graph Contrastive Representation Learning on Partially Aligned Multi-view Data

Yiming Wang , Dongxia Chang , Zhiqiang Fu , Jie Wen , Yao Zhao

分类：计算机视觉

2022-11-08

Multi-view representation learning has developed rapidly over the past decades and has been applied in many fields. However, most previous works assumed that each view is complete and aligned. This leads to an inevitable deterioration in their performance when encountering practical problems such as missing or unaligned views. To address the challenge of representation learning on partially aligned multi-view data, we propose a new cross-view graph contrastive learning framework, which integrates multi-view information to align data and learn latent representations. Compared with current approaches, the proposed method has the following merits: (1) our model is an end-to-end framework that simultaneously performs view-specific representation learning via view-specific autoencoders and cluster-level data aligning by combining multi-view information with the cross-view graph contrastive learning; (2) it is easy to apply our model to explore information from three or more modalities/sources as the cross-view graph contrastive learning is devised. Extensive experiments conducted on several real datasets demonstrate the effectiveness of the proposed method on the clustering and classification tasks.

translated by 谷歌翻译

Deep Graph Clustering via Dual Correlation Reduction

Yue Liu , Wenxuan Tu , Sihang Zhou , Xinwang Liu , Linxuan Song , Xihong Yang , En Zhu

分类：机器学习 | 人工智能 | 计算机视觉

2021-12-29

深图形聚类，旨在揭示底层的图形结构并将节点划分为不同的群体，近年来引起了密集的关注。然而，我们观察到，在节点编码的过程中，现有方法遭受表示崩溃，这倾向于将所有数据映射到相同的表示中。因此，节点表示的鉴别能力是有限的，导致不满足的聚类性能。为了解决这个问题，我们提出了一种新颖的自我监督的深图聚类方法，通过以双向还原信息相关性来称呼双重关联减少网络（DCRN）。具体而言，在我们的方法中，我们首先将暹罗网络设计为编码样本。然后通过强制跨视图样本相关矩阵和跨视图特征相关矩阵分别近似两个标识矩阵，我们减少了双级的信息相关性，从而提高了所得特征的判别能力。此外，为了减轻通过在GCN中过度平滑引起的表示崩溃，我们引入了传播正规化术语，使网络能够利用浅网络结构获得远程信息。六个基准数据集的广泛实验结果证明了提出的DCRN对现有最先进方法的有效性。

translated by 谷歌翻译

MHCCL: Masked Hierarchical Cluster-wise Contrastive Learning for Multivariate Time Series

Qianwen Meng , Hangwei Qian , Yong Liu , Yonghui Xu , Zhiqi Shen , Lizhen Cui

分类：机器学习 | 人工智能

2022-12-02

Learning semantic-rich representations from raw unlabeled time series data is critical for downstream tasks such as classification and forecasting. Contrastive learning has recently shown its promising representation learning capability in the absence of expert annotations. However, existing contrastive approaches generally treat each instance independently, which leads to false negative pairs that share the same semantics. To tackle this problem, we propose MHCCL, a Masked Hierarchical Cluster-wise Contrastive Learning model, which exploits semantic information obtained from the hierarchical structure consisting of multiple latent partitions for multivariate time series. Motivated by the observation that fine-grained clustering preserves higher purity while coarse-grained one reflects higher-level semantics, we propose a novel downward masking strategy to filter out fake negatives and supplement positives by incorporating the multi-granularity information from the clustering hierarchy. In addition, a novel upward masking strategy is designed in MHCCL to remove outliers of clusters at each partition to refine prototypes, which helps speed up the hierarchical clustering process and improves the clustering quality. We conduct experimental evaluations on seven widely-used multivariate time series datasets. The results demonstrate the superiority of MHCCL over the state-of-the-art approaches for unsupervised time series representation learning.

translated by 谷歌翻译

Self-supervised Image Clustering from Multiple Incomplete Views via Constrastive Complementary Generation

Jiatai Wang , Zhiwei Xu , Xuewen Yang , Dongjin Guo , Limin Liu

分类：计算机视觉

2022-09-24

不完整的多视图聚类旨在通过使用来自多种模式的数据来增强聚类性能。尽管已经提出了几种研究此问题的方法，但以下缺点仍然存在：1）很难学习潜在的互补性但不使用标签信息而保持一致性的潜在表示； 2）因此，当完整的数据稀缺时，在不完整的数据中未能充分利用不完整数据中的隐藏信息会导致次优群集性能。在本文中，我们提出了与生成对抗网络（CIMIC-GAN）的对比度不完整的多视图图像聚类，该网络使用GAN填充不完整的数据并使用双对比度学习来学习完整和不完整的数据的一致性。更具体地说，考虑到多种方式之间的多样性和互补信息，我们将完整和不完整数据的自动编码表示为双对比度学习，以实现学习一致性。将gan集成到自动编码过程中不仅可以充分利用不完整数据的新功能，而且可以在存在高数据缺失率的情况下更好地概括该模型。在\ textColor {black} {四}广泛使用的数据集上进行的实验表明，cimic-gan优于最先进的不完整的多视图聚类方法。

translated by 谷歌翻译

Exploring Non-Contrastive Representation Learning for Deep Clustering

Zhizhong Huang , Jie Chen , Junping Zhang , Hongming Shan

分类：计算机视觉

2021-11-23

现有的深度聚类方法依赖于对比学习的对比学习，这需要否定例子来形成嵌入空间，其中所有情况都处于良好分离状态。但是，否定的例子不可避免地引起阶级碰撞问题，损害了群集的表示学习。在本文中，我们探讨了对深度聚类的非对比表示学习，被称为NCC，其基于Byol，一种没有负例的代表性方法。首先，我们建议将一个增强的实例与嵌入空间中的另一个视图的邻居对齐，称为正抽样策略，该域避免了由否定示例引起的类碰撞问题，从而提高了集群内的紧凑性。其次，我们建议鼓励在所有原型中的一个原型和均匀性的两个增强视图之间的对准，命名的原型是原型的对比损失或protocl，这可以最大化簇间距离。此外，我们在期望 - 最大化（EM）框架中制定了NCC，其中E-Step利用球面K手段来估计实例的伪标签和来自目标网络的原型的分布，并且M-Step利用了所提出的损失优化在线网络。结果，NCC形成了一个嵌入空间，其中所有集群都处于分离良好，而内部示例都很紧凑。在包括ImageNet-1K的几个聚类基准数据集上的实验结果证明了NCC优于最先进的方法，通过显着的余量。

translated by 谷歌翻译

Multilayer Graph Contrastive Clustering Network

Liang Liu , Zhao Kang , Ling Tian , Wenbo Xu , Xixu He

分类：人工智能 | 计算机视觉 | 机器学习

2021-12-28

由于在建模相互依存系统中，由于其高效用，多层图已经在许多领域获得了大量的研究。然而，多层图的聚类，其旨在将图形节点划分为类别或社区，仍处于新生阶段。现有方法通常限于利用MultiView属性或多个网络，并忽略更复杂和更丰富的网络框架。为此，我们向多层图形聚类提出了一种名为Multidayer agal对比聚类网络（MGCCN）的多层图形聚类的通用和有效的AutoEncoder框架。 MGCCN由三个模块组成：（1）应用机制以更好地捕获节点与邻居之间的相关性以获得更好的节点嵌入。（2）更好地探索不同网络中的一致信息，引入了对比融合策略。（3）MGCCN采用自我监督的组件，可迭代地增强节点嵌入和聚类。对不同类型的真实图数据数据的广泛实验表明我们所提出的方法优于最先进的技术。

translated by 谷歌翻译

Contrast-reconstruction Representation Learning for Self-supervised Skeleton-based Action Recognition

Peng Wang , Jun Wen , Chenyang Si , Yuntao Qian , Liang Wang

分类：计算机视觉

2021-11-22

基于骨架的动作识别广泛用于各种区域，例如监视和人机相互作用。现有模型主要以监督方式学习，从而根据标签昂贵时可能是不可行的大规模标记数据。在本文中，我们提出了一种新的对比度重建表示学习网络（CRRL），其同时为无监督的基于骨架的动作识别捕获姿势和运动动力学。它主要由三部分组成：序列重建器，对比运动学习者和信息定影器。序列重建者通过重建学习从骨架坐标序列的表示，因此学习的表示倾向于聚焦在琐碎的姿势坐标上并且在运动学习中犹豫不决。为了增强运动的学习，对比运动学习者分别在从坐标序列和附加速度序列中学到的表示之间进行对比学习。最后，在信息定位器中，我们探讨了将序列重建器和对比运动学习者结合的各种策略，并建议通过基于知识蒸馏的融合策略同时捕获姿势和动作，从而将动作学习从对比运动学习者转移到序列中的序列重建者。在若干基准测试中，即NTU RGB + D 60，NTU RGB + D 120，CMU Mocap和NW-UCLA的实验结果证明了所提出的CRRL方法的承诺，到目前为止的现有方法。

translated by 谷歌翻译

Consistent Multiple Graph Embedding for Multi-View Clustering

Yiming Wang , Dongxia Chang , Zhiqiang Fu , Yao Zhao

分类：计算机视觉

2021-05-11

基于图形的多视图聚类，旨在跨多种视图获取数据分区，近年来接受了相当大的关注。虽然已经为基于图形的多视图群集进行了巨大努力，但它对各种视图融合特征仍然是一个挑战，以学习聚类的常见表示。在本文中，我们提出了一种新的一致多曲线图嵌入聚类框架（CMGEC）。具体地，设计了一种多图自动编码器（M-GAE），用于使用多图注意融合编码器灵活地编码多视图数据的互补信息。为了引导所学过的公共表示维护每个视图中相邻特征的相似性，引入了多视图相互信息最大化模块（MMIM）。此外，设计了一个图形融合网络（GFN），以探讨来自不同视图的图表之间的关系，并提供M-GAE所需的常见共识图。通过联合训练这些模型，可以获得共同的潜在表示，其从多个视图中编码更多互补信息，并更全面地描绘数据。三种类型的多视图数据集的实验表明CMGEC优于最先进的聚类方法。

translated by 谷歌翻译

A Clustering-guided Contrastive Fusion for Multi-view Representation Learning

Guanzhou Ke , Guoqing Chao , Xiaoli Wang , Chenyang Xu , Chang Xu , Yongqi Zhu , Yang Yu

分类：计算机视觉

2022-12-28

The past two decades have seen increasingly rapid advances in the field of multi-view representation learning due to it extracting useful information from diverse domains to facilitate the development of multi-view applications. However, the community faces two challenges: i) how to learn robust representations from a large amount of unlabeled data to against noise or incomplete views setting, and ii) how to balance view consistency and complementary for various downstream tasks. To this end, we utilize a deep fusion network to fuse view-specific representations into the view-common representation, extracting high-level semantics for obtaining robust representation. In addition, we employ a clustering task to guide the fusion network to prevent it from leading to trivial solutions. For balancing consistency and complementary, then, we design an asymmetrical contrastive strategy that aligns the view-common representation and each view-specific representation. These modules are incorporated into a unified method known as CLustering-guided cOntrastiVE fusioN (CLOVEN). We quantitatively and qualitatively evaluate the proposed method on five datasets, demonstrating that CLOVEN outperforms 11 competitive multi-view learning methods in clustering and classification. In the incomplete view scenario, our proposed method resists noise interference better than those of our competitors. Furthermore, the visualization analysis shows that CLOVEN can preserve the intrinsic structure of view-specific representation while also improving the compactness of view-commom representation. Our source code will be available soon at https://github.com/guanzhou-ke/cloven.

translated by 谷歌翻译

Beyond Just Vision: A Review on Self-Supervised Representation Learning on Multimodal and Temporal Data

Shohreh Deldari , Hao Xue , Aaqib Saeed , Jiayuan He , Daniel V. Smith , Flora D. Salim

分类：机器学习 | 计算机视觉

2022-06-06

最近，自我监督的表示学习（SSRL）在计算机视觉，语音，自然语言处理（NLP）以及最近的其他类型的模式（包括传感器的时间序列）中引起了很多关注。自我监督学习的普及是由传统模型通常需要大量通知数据进行培训的事实所驱动的。获取带注释的数据可能是一个困难且昂贵的过程。已经引入了自我监督的方法，以通过使用从原始数据自由获得的监督信号对模型进行判别预训练来提高训练数据的效率。与现有的对SSRL的评论不同，该评论旨在以单一模式为重点介绍CV或NLP领域的方法，我们旨在为时间数据提供对多模式自我监督学习方法的首次全面审查。为此，我们1）提供现有SSRL方法的全面分类，2）通过定义SSRL框架的关键组件来引入通用管道，3）根据其目标功能，网络架构和潜在应用程序，潜在的应用程序，潜在的应用程序，比较现有模型， 4）查看每个类别和各种方式中的现有多模式技术。最后，我们提出了现有的弱点和未来的机会。我们认为，我们的工作对使用多模式和/或时间数据的域中SSRL的要求有了一个观点

translated by 谷歌翻译

Self-supervised Learning in Remote Sensing: A Review

Yi Wang , Conrad M Albrecht , Nassim Ait Ali Braham , Lichao Mou , Xiao Xiang Zhu

分类：计算机视觉

2022-06-27

在深度学习研究中，自学学习（SSL）引起了极大的关注，引起了计算机视觉和遥感社区的兴趣。尽管计算机视觉取得了很大的成功，但SSL在地球观测领域的大部分潜力仍然锁定。在本文中，我们对在遥感的背景下为计算机视觉的SSL概念和最新发展提供了介绍，并回顾了SSL中的概念和最新发展。此外，我们在流行的遥感数据集上提供了现代SSL算法的初步基准，从而验证了SSL在遥感中的潜力，并提供了有关数据增强的扩展研究。最后，我们确定了SSL未来研究的有希望的方向的地球观察（SSL4EO），以铺平了两个领域的富有成效的相互作用。

translated by 谷歌翻译