转载自 机器之心 作者 paperWeekly

近年来,图神经网络的研究成为深度学习领域的热点,机器之心曾介绍过清华大学 朱文武等人综述的图网络。近日,清华大学孙茂松组在 arXiv 上发布预印版综述文章 Graph Neural Networks: A Review of Methods and Applications。

该文总结了近年来图神经网络领域的经典模型与典型应用,并提出了四个开放性问题。 对于希望快速了解这一领域的读者,不妨先从这篇文章看起。

除了这篇综述外,文章作者在 Github 中更新了该领域的参考文章列表( https://github.com/thunlp/GNNPapers),供各位读者参考查看。

引言

图是一种数据结构,它对一组对象(节点)及其关系(边)进行建模。近年来,由于图结构的强大表现力,用机器学习方法分析图的研究越来越受到重视。图神经网络(GNN)是一类基于深度学习的处理图域信息的方法。由于其较好的性能和可解释性,GNN 最近已成为一种广泛应用的图分析方法。

**GNN 的第一个动机源于卷积神经网络(CNN)。**CNN 的广泛应用带来了机器学习领域的突破并开启了深度学习的新时代。然而 CNN 只能在规则的 Euclidean 数据上运行,如图像(2 维网格)和文本(1 维序列)。如何将 CNN 应用于图结构这一非欧几里德空间,成为 GNN 模型重点解决的问题。

▲ 图1. 左:图像(欧几里得空间) 右:图(非欧几里德空间)

**GNN 的另一个动机来自图嵌入(Graph Embedding),它学习图中节点、边或子图的低维向量空间表示。**DeepWalk、LINE、SDNE 等方法在网络表示学习领域取得了很大的成功。然而,这些方法在计算上较为复杂并且在大规模上的图上并不是最优的,GNN 旨在解决这些问题。

这篇文章对图神经网络进行了广泛的总结,并做出了以下贡献:

  • 文章详细介绍了图神经网络的经典模型。主要包括其原始模型,不同的变体和几个通用框架。

  • 文章将图神经网络的应用系统地归类为结构化场景、非结构化场景和其他场景中,并介绍了不同场景中的主要应用。

  • 本文为未来的研究提出四个未解决的问题。文章对每个问题进行了详细分析,并提出未来的研究方向。

模型

在模型这一部分中,文章首先介绍了最经典的图神经网络模型 GNN,具体阐述了 GNN 的模型与计算方式,然而 GNN 模型仍然存在一定的限制,比如较高的计算复杂度以及表示能力不足等等。

后续的很多工作致力于解决 GNN 存在的种种问题,在 2.2 一节中文章详细介绍了 GNN 的不同变体。具体来说, 文章分别介绍了适应于不同图类型、采用不同的信息传递方式以及采用了不同的训练方法的变体。

▲ 图2. 不同的GNN变体

在 2.2.1 节中,文章介绍了处理不同图类型的 GNN 变体,包括有向图、异质图和具有边信息的图。在 2.2.2 节中, 文章对于采用不同信息传递方式的变体进行了总结与概括。主要分为以下四个类别:

卷积。 Graph Convolutional Network(GCN)希望将卷积操作应用在图结构数据上,主要分为Spectral Method和Sp