Day-21-Paper Reading -- Graph Representation Learning

Graph representation learning in bioinformatics: trends, methods and applications

這篇 paper 總共分成 5 個章節,分別是 Introduction、Graph Representation Learning: a brief overview、Applications in Bioinformatics、Challenges and Opportunities、Conclusion。

本篇 paper 主要的貢獻有三個:

  1. 分析了 graph embedding 和 graph neural network 的方法。並且將 graph embedding 的方法細分成 homogeneous graph embedding、heterogeneous graph embedding 和 attribute graph embedding。
  2. 總結了 graph representation learning 在 bioinformatics 的應用,從 molecular level 到 genomics、pharmaceutical 跟 healthcare systems 等等。
  3. 同時也整理了一些 open source 的 graph representation learning 的資源。


圖片來源:Graph representation learning in bioinformatics: trends, methods and applications(

這張圖的 (A) (B) 是在講 graph structure 跟一般 grid like structure 的差別,以及 graph embedding 的意思就是將 graph structure 嵌入到 embedding space。

(C) 跟 (D) 是在講 graph neural network 跟 graph generative model 的差別。

(C) graph neural network 是藉由多種的 message aggregation 以及 propagation 的方式來找到最佳的 embedding。

(D) graph generative model 是藉由輸入的 distribution 來生成 graph。

圖片來源:Graph representation learning in bioinformatics: trends, methods and applications(

這張圖是在講 graph embedding 跟 graph neural network 的差別。

從內文感覺上來說,graph embedding 比較像是資料前處理,處理完後的資料可以套用到其他的機器學習模型上。但是 graph neural netwrok 是一個 end-to-end 的模型,可以直接輸入 graph 並且輸出預測的結果。

Graph Representation Learning: a brief overview

圖片來源:Graph representation learning in bioinformatics: trends, methods and applications(

這篇 paper 跟上一篇 paper 最主要的差別就是這篇 paper 比較沒有特別把 objective function 寫出來,但是因為這篇是比較新的 paper,所以提到了許多新的 graph embedding 的方法。

其中,我對 heterogeneous graph 跟 attribute graph 的定義有點好奇差別在哪裡,所以著重在解釋這兩種 graph 的差別。其他介紹不同 embedding 的方法的部分就先跳過。

Heterogeneous graph embedding

node 跟 edge 都會有不同的屬性。

heterogeneous graph embedding 的方法大致可以分成三種:

  1. meta-path-based
    從內文看起來 meta-path-based 的方法應該是 random walk 的變體,主要的差別在於 meta-path 會限制住 random walk 的方向,減少在 heterogeneous graph 上的 traversal 的複雜度。
  2. decomposition-based
    把 heterogeneous graph 分解成比較小的 homogeneous 或是 bipartite graph。
  3. deep learning-based methods

Attribute graph embedding

node 會有不同的屬性,但是 edge 的屬性都是一樣的。

Open source resources


open-source implementations of graph representation learning algorithms


  1. homogenous - GraRep
  2. homogenous - HOPE
  3. homogenous - Deepwalk
  4. Heterogeneous - metapath2vec
  5. Heterogeneous - GATNE

