今天我們要看另一種 embedding 方式- graph-embedding。
如果我們有很大量的影片資料,又有很多的使用者,這時要做推薦、分類等操作,會非常耗時耗資源。若我們可以把高維的稀疏數據,轉為低維密向量,然後再給深度學或機器捀習算法進行構建模型,在實務上才是可以執行的推薦系統 。
DeepWalk方法2014年是提出了比較經典的圖嵌入法。
如果可以建出一張圖,我們設計一個小人可以在圖上隨機遊走,然後得到海量的節點序列,並把這些序列作為訓練樣本,輸入到模型裡進行訓練,可以得到 embedding 的向量結果。
這樣亂走方式,濃縮起來,就是精華。
核心演算法如下: