智能论文笔记

Embedding Compression with Hashing for Efficient Representation Learning in Large-Scale Graph

Chin-Chia Michael Yeh , Mengting Gu , Yan Zheng , Huiyuan Chen , Javid Ebrahimi , Zhongfang Zhuang , Junpeng Wang , Liang Wang , Wei Zhang

分类：机器学习 | 人工智能

2022-08-11

图形神经网络（GNN）是专门为图形数据设计的深度学习模型，它们通常依靠节点特征作为第一层的输入。在没有节点功能的图形上应用这种类型的网络时，可以提取基于图的节点特征（例如，度数数）或在训练网络时学习输入节点表示（即嵌入）。训练节点嵌入的后一个方法更有可能导致性能更好，而与嵌入的参数数量与节点数量线性增长。因此，在处理工业规模的图形数据时，以端到端方式以端到端方式训练输入节点嵌入式（GPU）内存中的GNN是不切实际的。受到为自然语言处理（NLP）任务开发的嵌入压缩方法的启发，我们开发了一种节点嵌入压缩方法，其中每个节点都用一个位向量而不是浮点数向量表示。在压缩方法中使用的参数可以与GNN一起训练。我们表明，与替代方案相比，提出的节点嵌入压缩方法的性能优于性能。

translated by 谷歌翻译

NAFS: A Simple yet Tough-to-beat Baseline for Graph Representation Learning

Wentao Zhang , Zeang Sheng , Mingyu Yang , Yang Li , Yu Shen , Zhi Yang , Bin Cui

分类：机器学习

2022-06-17

最近，图形神经网络（GNN）通过利用图形结构和节点特征的知识来表现出图表表示的显着性能。但是，他们中的大多数都有两个主要限制。首先，GNN可以通过堆叠更多的层来学习高阶结构信息，但由于过度光滑的问题，无法处理较大的深度。其次，由于昂贵的计算成本和高内存使用情况，在大图上应用这些方法并不容易。在本文中，我们提出了节点自适应特征平滑（NAFS），这是一种简单的非参数方法，该方法构建了没有参数学习的节点表示。 NAFS首先通过特征平滑提取每个节点及其不同啤酒花的邻居的特征，然后自适应地结合了平滑的特征。此外，通过不同的平滑策略提取的平滑特征的合奏可以进一步增强构建的节点表示形式。我们在两个不同的应用程序方案上对四个基准数据集进行实验：节点群集和链接预测。值得注意的是，具有功能合奏的NAFS优于这些任务上最先进的GNN，并减轻上述大多数基于学习的GNN对应物的两个限制。

translated by 谷歌翻译

Simplifying approach to Node Classification in Graph Neural Networks

Sunil Kumar Maurya , Xin Liu , Tsuyoshi Murata

分类： (统计)机器学习 | 机器学习

2021-11-12

图形神经网络已成为从图形结构数据学习的不可缺少的工具之一，并且它们的实用性已在各种各样的任务中显示。近年来，建筑设计的巨大改进，导致各种预测任务的性能更好。通常，这些神经架构在同一层中使用可知的权重矩阵组合节点特征聚合和特征转换。这使得分析从各种跳过的节点特征和神经网络层的富有效力来挑战。由于不同的图形数据集显示在特征和类标签分布中的不同级别和异常级别，因此必须了解哪些特征对于没有任何先前信息的预测任务是重要的。在这项工作中，我们将节点特征聚合步骤和深度与图形神经网络分离，并经验分析了不同的聚合特征在预测性能中发挥作用。我们表明，并非通过聚合步骤生成的所有功能都很有用，并且通常使用这些较少的信息特征可能对GNN模型的性能有害。通过我们的实验，我们表明学习这些功能的某些子集可能会导致各种数据集的性能更好。我们建议使用Softmax作为常规器，并从不同跳距的邻居聚合的功能的“软选择器”;和L2 - GNN层的标准化。结合这些技术，我们呈现了一个简单浅的模型，特征选择图神经网络（FSGNN），并经验展示所提出的模型比九个基准数据集中的最先进的GNN模型实现了可比或甚至更高的准确性节点分类任务，具有显着的改进，可达51.1％。

translated by 谷歌翻译

BiFeat: Supercharge GNN Training via Graph Feature Quantization

Yuxin Ma , Ping Gong , Jun Yi , Zhewei Yao , Minjie Wang , Cheng Li , Yuxiong He , Feng Yan

分类：机器学习

2022-07-29

图形神经网络（GNN）是具有无核数据的应用的有前途的方法。但是，具有数亿节点的大规模图上的培训GNN既是资源又是耗时的。与DNN不同，GNN通常具有更大的内存足迹，因此GPU内存能力和PCIE带宽是GNN培训中的主要资源瓶颈。为了解决此问题，我们提出分叉：一种图形量化方法，通过显着减少内存足迹和PCIE带宽要求来加速GNN训练，以便GNN可以充分利用GPU计算功能。我们的关键见解是，与DNN不同，GNN不太容易发生量化引起的输入特征的信息丢失。我们确定图形特征量化中的主要准确性影响因素，从理论上证明，分叉训练会收敛到网络，在该网络中，损失在未压缩网络的最佳损失的$ \ epsilon $之内。我们使用几种流行的GNN模型和数据集对分叉进行了广泛的评估，包括最大的公共图数据集MAG240M上的图形。结果表明，分叉达到30以上的压缩率，并在边际准确性损失的情况下提高了GNN训练速度200％-320％。特别是，分叉在一小时内仅使用四个GPU在MAG240M上的训练图来实现记录。

translated by 谷歌翻译

PersonaSAGE: A Multi-Persona Graph Neural Network

Gautam Choudhary , Iftikhar Ahamath Burhanuddin , Eunyee Koh , Fan Du , Ryan A. Rossi

分类：机器学习

2022-12-28

Graph Neural Networks (GNNs) have become increasingly important in recent years due to their state-of-the-art performance on many important downstream applications. Existing GNNs have mostly focused on learning a single node representation, despite that a node often exhibits polysemous behavior in different contexts. In this work, we develop a persona-based graph neural network framework called PersonaSAGE that learns multiple persona-based embeddings for each node in the graph. Such disentangled representations are more interpretable and useful than a single embedding. Furthermore, PersonaSAGE learns the appropriate set of persona embeddings for each node in the graph, and every node can have a different number of assigned persona embeddings. The framework is flexible enough and the general design helps in the wide applicability of the learned embeddings to suit the domain. We utilize publicly available benchmark datasets to evaluate our approach and against a variety of baselines. The experiments demonstrate the effectiveness of PersonaSAGE for a variety of important tasks including link prediction where we achieve an average gain of 15% while remaining competitive for node classification. Finally, we also demonstrate the utility of PersonaSAGE with a case study for personalized recommendation of different entity types in a data management platform.

translated by 谷歌翻译

A Comprehensive Analytical Survey on Unsupervised and Semi-Supervised Graph Representation Learning Methods

Md. Khaledur Rahman , Ariful Azad

分类：机器学习

2021-12-20

图表表示学习是一种快速增长的领域，其中一个主要目标是在低维空间中产生有意义的图形表示。已经成功地应用了学习的嵌入式来执行各种预测任务，例如链路预测，节点分类，群集和可视化。图表社区的集体努力提供了数百种方法，但在所有评估指标下没有单一方法擅长，例如预测准确性，运行时间，可扩展性等。该调查旨在通过考虑算法来评估嵌入方法的所有主要类别的图表变体，参数选择，可伸缩性，硬件和软件平台，下游ML任务和多样化数据集。我们使用包含手动特征工程，矩阵分解，浅神经网络和深图卷积网络的分类法组织了图形嵌入技术。我们使用广泛使用的基准图表评估了节点分类，链路预测，群集和可视化任务的这些类别算法。我们在Pytorch几何和DGL库上设计了我们的实验，并在不同的多核CPU和GPU平台上运行实验。我们严格地审查了各种性能指标下嵌入方法的性能，并总结了结果。因此，本文可以作为比较指南，以帮助用户选择最适合其任务的方法。

translated by 谷歌翻译

Graph Condensation for Graph Neural Networks

Wei Jin , Lingxiao Zhao , Shichang Zhang , Yozen Liu , Jiliang Tang , Neil Shah

分类：机器学习 | 人工智能

2021-10-14

鉴于在现实世界应用中大规模图的流行率，训练神经模型的存储和时间引起了人们的关注。为了减轻关注点，我们提出和研究图形神经网络（GNNS）的图形凝结问题。具体而言，我们旨在将大型原始图凝结成一个小的，合成的和高度信息的图，以便在小图和大图上训练的GNN具有可比性的性能。我们通过优化梯度匹配损失并设计一种凝结节点期货和结构信息的策略来模仿原始图上的GNN训练轨迹，以解决凝结问题。广泛的实验证明了所提出的框架在将不同的图形数据集凝结成信息较小的较小图中的有效性。特别是，我们能够在REDDIT上近似于95.3％的原始测试准确性，Flickr的99.8％和CiteSeer的99.0％，同时将其图形尺寸降低了99.9％以上，并且可以使用冷凝图来训练各种GNN架构Code在https://github.com/chandlerbang/gcond上发布。

translated by 谷歌翻译

Are we really making much progress? Revisiting, benchmarking, and refining heterogeneous graph neural networks

Qingsong Lv , Ming Ding , Qiang Liu , Yuxiang Chen , Wenzheng Feng , Siming He , Chang Zhou , Jianguo Jiang , Yuxiao Dong , Jie Tang

分类：机器学习

2021-12-30

近年来，异构图形神经网络（HGNNS）一直在开花，但每个工作所使用的独特数据处理和评估设置会让他们的进步完全了解。在这项工作中，我们通过使用其官方代码，数据集，设置和超参数来展示12个最近的HGNN的系统再现，揭示了关于HGNN的进展的令人惊讶的结果。我们发现，由于设置不当，简单的均匀GNN，例如GCN和GAT在很大程度上低估了。具有适当输入的GAT通常可以匹配或优于各种场景的所有现有HGNN。为了促进稳健和可重复的HGNN研究，我们构建异构图形基准（HGB），由具有三个任务的11个不同数据集组成。 HGB标准化异构图数据分割，特征处理和性能评估的过程。最后，我们介绍了一个简单但非常强大的基线简单 - HGN - 这显着优于HGB上以前的所有模型 - 以加速未来HGNN的进步。

translated by 谷歌翻译

Network In Graph Neural Network

Xiang Song , Runjie Ma , Jiahang Li , Muhan Zhang , David Paul Wipf

分类：机器学习

2021-11-23

图形神经网络（GNNS）在学习的图形结构化数据中显示了包含节点/边缘特征信息的图表，应用于社交网络，推荐，欺诈检测和知识图形推理。在这方面，过去已经提出了各种策略，以改善GNN的富有效率。例如，一个简单的选项是通过扩展HID-DIN维度或增加GNN层的数量来简单地增加参数大小。然而，更宽的隐藏层可以容易地导致过度拟合，逐步添加更多GNN层可能导致过度的过度。在本文中，我们提出了一种模型 - 不可知方法，即图形神经网络（NGNN）中的网络，允许任意GNN模型通过使模型更深的模型来提高模型容量。然而，除了添加或加宽GNN层，NGNN通过在每个GNN层内插入非线性前馈神经网络层来加深GNN模型。在OGBN - 产品数据上应用于Graphsage基础GNN的NGNN分析表明它可以将模型保持对节点特征或图形结构扰动的稳定性。此外，对节点分类和链路预测任务的广泛评估结果表明，NGNN在不同的GNN架构上可靠地工作。对于实例，它可以提高OGBN-Products上的GraphSage的测试精度，并提高了@ 100分数ogbl-ppa上的密封率为7.08％，并且Propsage + Edge-Attr在ogbl-ppi上的Hits @ 20分数达到6.22％。在此提交时，它实现了OGB链路预测排行榜上的两个第一个位置。

translated by 谷歌翻译

MGAE: Masked Autoencoders for Self-Supervised Learning on Graphs

Qiaoyu Tan , Ninghao Liu , Xiao Huang , Rui Chen , Soo-Hyun Choi , Xia Hu

分类：机器学习

2022-01-07

我们介绍了一种新颖的屏蔽图AutoEncoder（MGAE）框架，以在图形结构数据上执行有效的学习。从自我监督学习中欣识见，我们随机掩盖了大部分边缘，并在训练期间尝试重建这些缺失的边缘。 Mgae有两个核心设计。首先，我们发现掩蔽了输入图结构的高比率，例如70 \％$，产生一个非凡和有意义的自我监督任务，使下游应用程序受益。其次，我们使用图形神经网络（GNN）作为编码器，以在部分掩蔽的图表上执行消息传播。为了重建大量掩模边缘，提出了一种定制的互相关解码器。它可以捕获多粒度的锚边的头部和尾部节点之间的互相关。耦合这两种设计使MGAE能够有效且有效地培训。在多个开放数据集（Planetoid和OGB基准测试）上进行了广泛的实验，证明MGAE通常比链接预测和节点分类更好地表现优于最先进的无监督竞争对手。

translated by 谷歌翻译

Cluster-GCN: An Efficient Algorithm for Training Deep and Large Graph Convolutional Networks

Wei-Lin Chiang , Xuanqing Liu , Si Si , Yang Li , Samy Bengio , Cho-Jui Hsieh

分类：

2019-05-20

Graph convolutional network (GCN) has been successfully applied to many graph-based applications; however, training a large-scale GCN remains challenging. Current SGD-based algorithms suffer from either a high computational cost that exponentially grows with number of GCN layers, or a large space requirement for keeping the entire graph and the embedding of each node in memory. In this paper, we propose Cluster-GCN, a novel GCN algorithm that is suitable for SGD-based training by exploiting the graph clustering structure. Cluster-GCN works as the following: at each step, it samples a block of nodes that associate with a dense subgraph identified by a graph clustering algorithm, and restricts the neighborhood search within this subgraph. This simple but effective strategy leads to significantly improved memory and computational efficiency while being able to achieve comparable test accuracy with previous algorithms. To test the scalability of our algorithm, we create a new Amazon2M data with 2 million nodes and 61 million edges which is more than 5 times larger than the previous largest publicly available dataset (Reddit). For training a 3-layer GCN on this data, Cluster-GCN is faster than the previous state-of-the-art VR-GCN (1523 seconds vs 1961 seconds) and using much less memory (2.2GB vs 11.2GB). Furthermore, for training 4 layer GCN on this data, our algorithm can finish in around 36 minutes while all the existing GCN training algorithms fail to train due to the out-of-memory issue. Furthermore, Cluster-GCN allows us to train much deeper GCN without much time and memory overhead, which leads to improved prediction accuracy-using a 5-layer Cluster-GCN, we achieve state-of-the-art test F1 score 99.36 on the PPI dataset, while the previous best result was 98.71 by [16]. Our codes are publicly available at https://github.com/google-research/google-research/ tree/master/cluster_gcn.

translated by 谷歌翻译

Comprehensive Graph Gradual Pruning for Sparse Training in Graph Neural Networks

Chuang Liu , Xueqi Ma , Yinbing Zhan , Liang Ding , Dapeng Tao , Bo Du , Wenbin Hu , Danilo Mandic

分类：机器学习 | 人工智能

2022-07-18

图形神经网络（GNNS）由于图形数据的规模和模型参数的数量呈指数增长，因此限制了它们在实际应用中的效用，因此往往会遭受高计算成本。为此，最近的一些作品着重于用彩票假设（LTH）稀疏GNN，以降低推理成本，同时保持绩效水平。但是，基于LTH的方法具有两个主要缺点：1）它们需要对密集模型进行详尽且迭代的训练，从而产生了极大的训练计算成本，2）它们仅修剪图形结构和模型参数，但忽略了节点功能维度，存在大量冗余。为了克服上述局限性，我们提出了一个综合的图形渐进修剪框架，称为CGP。这是通过在一个训练过程中设计在训练图周期修剪范式上进行动态修剪GNN来实现的。与基于LTH的方法不同，提出的CGP方法不需要重新训练，这大大降低了计算成本。此外，我们设计了一个共同策略，以全面地修剪GNN的所有三个核心元素：图形结构，节点特征和模型参数。同时，旨在完善修剪操作，我们将重生过程引入我们的CGP框架，以重新建立修剪但重要的连接。提出的CGP通过在6个GNN体系结构中使用节点分类任务进行评估，包括浅层模型（GCN和GAT），浅但深度散发模型（SGC和APPNP）以及Deep Models（GCNII和RESGCN），总共有14个真实图形数据集，包括来自挑战性开放图基准的大规模图数据集。实验表明，我们提出的策略在匹配时大大提高了训练和推理效率，甚至超过了现有方法的准确性。

translated by 谷歌翻译

A Comprehensive Survey on Graph Neural Networks

Zonghan Wu , Shirui Pan , Fengwen Chen , Guodong Long , Chengqi Zhang , Philip S. Yu

分类：

2019-01-03

Deep learning has revolutionized many machine learning tasks in recent years, ranging from image classification and video processing to speech recognition and natural language understanding. The data in these tasks are typically represented in the Euclidean space. However, there is an increasing number of applications where data are generated from non-Euclidean domains and are represented as graphs with complex relationships and interdependency between objects. The complexity of graph data has imposed significant challenges on existing machine learning algorithms. Recently, many studies on extending deep learning approaches for graph data have emerged. In this survey, we provide a comprehensive overview of graph neural networks (GNNs) in data mining and machine learning fields. We propose a new taxonomy to divide the state-of-the-art graph neural networks into four categories, namely recurrent graph neural networks, convolutional graph neural networks, graph autoencoders, and spatial-temporal graph neural networks. We further discuss the applications of graph neural networks across various domains and summarize the open source codes, benchmark data sets, and model evaluation of graph neural networks. Finally, we propose potential research directions in this rapidly growing field.

translated by 谷歌翻译

Open Graph Benchmark: Datasets for Machine Learning on Graphs

Weihua Hu , Matthias Fey , Marinka Zitnik , Yuxiao Dong , Hongyu Ren , Bowen Liu , Michele Catasta , Jure Leskovec

分类：

2020-05-02

We present the OPEN GRAPH BENCHMARK (OGB), a diverse set of challenging and realistic benchmark datasets to facilitate scalable, robust, and reproducible graph machine learning (ML) research. OGB datasets are large-scale, encompass multiple important graph ML tasks, and cover a diverse range of domains, ranging from social and information networks to biological networks, molecular graphs, source code ASTs, and knowledge graphs. For each dataset, we provide a unified evaluation protocol using meaningful application-specific data splits and evaluation metrics. In addition to building the datasets, we also perform extensive benchmark experiments for each dataset. Our experiments suggest that OGB datasets present significant challenges of scalability to large-scale graphs and out-of-distribution generalization under realistic data splits, indicating fruitful opportunities for future research. Finally, OGB provides an automated end-to-end graph ML pipeline that simplifies and standardizes the process of graph data loading, experimental setup, and model evaluation. OGB will be regularly updated and welcomes inputs from the community. OGB datasets as well as data loaders, evaluation scripts, baseline code, and leaderboards are publicly available at https://ogb.stanford.edu.

translated by 谷歌翻译

GraphMAE: Self-Supervised Masked Graph Autoencoders

Zhenyu Hou , Xiao Liu , Yukuo Cen , Yuxiao Dong , Hongxia Yang , Chunjie Wang , Jie Tang

分类：机器学习

2022-05-22

近年来，自我监督学习（SSL）已广泛探索。特别是，生成的SSL在自然语言处理和其他AI领域（例如BERT和GPT的广泛采用）中获得了新的成功。尽管如此，对比度学习 - 严重依赖结构数据的增强和复杂的培训策略，这是图SSL的主要方法，而迄今为止，生成SSL在图形上的进度（尤其是GAES）尚未达到潜在的潜力。正如其他领域所承诺的。在本文中，我们确定并检查对GAE的发展产生负面影响的问题，包括其重建目标，训练鲁棒性和错误指标。我们提出了一个蒙版的图形自动编码器Graphmae，该图可以减轻这些问题，以预处理生成性自我监督图。我们建议没有重建图形结构，而是提议通过掩盖策略和缩放余弦误差将重点放在特征重建上，从而使GraphMae的强大训练受益。我们在21个公共数据集上进行了大量实验，以实现三个不同的图形学习任务。结果表明，Graphmae-A简单的图形自动编码器具有仔细的设计-CAN始终在对比度和生成性最新基准相比，始终产生优于性的表现。这项研究提供了对图自动编码器的理解，并证明了在图上的生成自我监督预训练的潜力。

translated by 谷歌翻译

Benchmarking Graph Neural Networks

Vijay Prakash Dwivedi , Chaitanya K. Joshi , Anh Tuan Luu , Thomas Laurent , Yoshua Bengio , Xavier Bresson

分类：机器学习 | (统计)机器学习

2020-03-02

In the last few years, graph neural networks (GNNs) have become the standard toolkit for analyzing and learning from data on graphs. This emerging field has witnessed an extensive growth of promising techniques that have been applied with success to computer science, mathematics, biology, physics and chemistry. But for any successful field to become mainstream and reliable, benchmarks must be developed to quantify progress. This led us in March 2020 to release a benchmark framework that i) comprises of a diverse collection of mathematical and real-world graphs, ii) enables fair model comparison with the same parameter budget to identify key architectures, iii) has an open-source, easy-to-use and reproducible code infrastructure, and iv) is flexible for researchers to experiment with new theoretical ideas. As of December 2022, the GitHub repository has reached 2,000 stars and 380 forks, which demonstrates the utility of the proposed open-source framework through the wide usage by the GNN community. In this paper, we present an updated version of our benchmark with a concise presentation of the aforementioned framework characteristics, an additional medium-sized molecular dataset AQSOL, similar to the popular ZINC, but with a real-world measured chemical target, and discuss how this framework can be leveraged to explore new GNN designs and insights. As a proof of value of our benchmark, we study the case of graph positional encoding (PE) in GNNs, which was introduced with this benchmark and has since spurred interest of exploring more powerful PE for Transformers and GNNs in a robust experimental setting.

translated by 谷歌翻译

CatGCN: Graph Convolutional Networks with Categorical Node Features

Weijian Chen , Fuli Feng , Qifan Wang , Xiangnan He , Chonggang Song , Guohui Ling , Yongdong Zhang

分类：机器学习 | (统计)机器学习

2020-09-11

最近关于图表卷积网络（GCN）的研究表明，初始节点表示（即，第一次图卷积前的节点表示）很大程度上影响最终的模型性能。但是，在学习节点的初始表示时，大多数现有工作线性地组合了节点特征的嵌入，而不考虑特征之间的交互（或特征嵌入）。我们认为，当节点特征是分类时，例如，在许多实际应用程序中，如用户分析和推荐系统，功能交互通常会对预测分析进行重要信号。忽略它们将导致次优初始节点表示，从而削弱后续图表卷积的有效性。在本文中，我们提出了一个名为CatGCN的新GCN模型，当节点功能是分类时，为图表学习量身定制。具体地，我们将显式交互建模的两种方式集成到初始节点表示的学习中，即在每对节点特征上的本地交互建模和人工特征图上的全局交互建模。然后，我们通过基于邻域聚合的图形卷积来优化增强的初始节点表示。我们以端到端的方式训练CatGCN，并在半监督节点分类上展示它。来自腾讯和阿里巴巴数据集的三个用户分析的三个任务（预测用户年龄，城市和购买级别）的大量实验验证了CatGCN的有效性，尤其是在图表卷积之前执行特征交互建模的积极效果。

translated by 谷歌翻译

Structural Entropy Guided Graph Hierarchical Pooling

Junran Wu , Xueyuan Chen , Ke Xu , Shangzhe Li

分类：机器学习

2022-06-26

在非欧几里得空间上卷积成功之后，在有关图形的各种任务上也验证了相应的合并方法。但是，由于固定的压缩配额和逐步合并设计，这些层次池方法仍然遭受局部结构损害和次优问题的困扰。在这项工作的启发下，我们提出了一种层次的合并方法，即SEP解决这两个问题。具体而言，在不分配特定层的压缩配额的情况下，全局优化算法旨在生成一次集群分配矩阵以一次汇总。然后，我们介绍了在环和网格合成图的重建中先前方法中局部结构损害的例证。除SEP外，我们还将分别设计两个分类模型，分别用于图形分类和节点分类。结果表明，SEP在图形分类基准上优于最先进的图形合并方法，并在节点分类上获得了卓越的性能。

translated by 谷歌翻译

Streaming Encoding Algorithms for Scalable Hyperdimensional Computing

Anthony Thomas , Behnam Khaleghi , Gopi Krishna Jha , Nageen Himayat , Ravi Iyer , Nilesh Jain , Tajana Rosing

分类：机器学习 | 神经与进化计算

2022-09-20

高维计算（HDC）是用于数据表示和学习的范式，起源于计算神经科学。HDC将数据表示为高维，低精度向量，可用于学习或召回等各种信息处理任务。高维空间的映射是HDC中的一个基本问题，现有方法在输入数据本身是高维时会遇到可伸缩性问题。在这项工作中，我们探索了一个基于哈希的流媒体编码技术。我们正式表明，这些方法在学习应用程序的性能方面具有可比的保证，同时比现有替代方案更有效。我们在一个流行的高维分类问题上对这些结果进行了实验验证，并表明我们的方法很容易扩展到非常大的数据集。

translated by 谷歌翻译

Efficient and effective training of language and graph neural network models

Vassilis N. Ioannidis , Xiang Song , Da Zheng , Houyu Zhang , Jun Ma , Yi Xu , Belinda Zeng , Trishul Chilimbi , George Karypis

分类：机器学习 | 自然语言处理

2022-06-22

我们可以将异源图结构与文本结合在一起以学习高质量的语义和行为表示吗？图形神经网络（GNN）S编码数值节点属性和图形结构，以在各种监督的学习任务中实现令人印象深刻的性能。当前的GNN方法受到文本特征的挑战，文本特征通常需要编码为数值向量，然后再提供给GNN，这可能会导致一些信息损失。在本文中，我们提出了一个有效有效的框架，称为语言模型GNN（LM-GNN），以共同训练大型语言模型和图形神经网络。我们的框架中的有效性是通过首先使用异质图信息，然后使用GNN模型应用BERT模型的阶段微调来实现的。提出了几种系统和设计优化，以实现可扩展有效的培训。 LM-GNN可容纳节点和边缘分类以及链接预测任务。我们在不同数据集的性能中评估了LM-GNN框架，并展示了所提出方法的有效性。 LM-GNN在亚马逊查询购买应用程序中提供竞争结果。

translated by 谷歌翻译