iT邦幫忙

2022 iThome 鐵人賽

DAY 28
0
AI & Data

親手打造推薦系統系列 第 28

Day28 - Deepwalk 亂走也能做推薦? - 親手打造推薦系統

  • 分享至 

  • xImage
  •  

今天我們要看另一種 embedding 方式- graph-embedding。

如果我們有很大量的影片資料,又有很多的使用者,這時要做推薦、分類等操作,會非常耗時耗資源。若我們可以把高維的稀疏數據,轉為低維密向量,然後再給深度學或機器捀習算法進行構建模型,在實務上才是可以執行的推薦系統 。

DeepWalk方法2014年是提出了比較經典的圖嵌入法。

思路

如果可以建出一張圖,我們設計一個小人可以在圖上隨機遊走,然後得到海量的節點序列,並把這些序列作為訓練樣本,輸入到模型裡進行訓練,可以得到 embedding 的向量結果。

這樣亂走方式,濃縮起來,就是精華。

Deepwalk算法的核心步驟分為4步:

  1. 抽取使用者的行為序列
  2. 將用使用者行為序列轉換成圖的表示方法
  3. 使用 RandomWalk 對圖中節點採樣,得到可能可以走的所有路徑。
  4. 使用Skip-Gram 學習出節點的Embedding表示。

核心演算法如下:
https://ithelp.ithome.com.tw/upload/images/20221013/20152556ie8GCRwejv.png

小結

  1. 圖嵌入的方法是想把數據的表現形式進行轉化。把高维度稀疏圖數據轉為低維度的稠密向量,從而使得可以並行處理,
    1. 在大数据场景下非常实用身
  2. 圖嵌入的技術可以看作特徵工程,在轉換後的數據可以直接用在機器學習 或神經網路上。
    1. 可用性和靈活性較好。
  3. DeepWalk算法是基于随機遊走提出的
    1. 思路比轉簡單,但在實際問題中,可以使用它進行求解,十分方便。

參考資料

  1. Perozzi B, Al-Rfou R, Skiena S. Deepwalk: Online learning of social representations[C]//Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining. ACM, 2014: 701-710.

上一篇
Day27 - 利用Gensim實作 item2vec 的動畫推薦 - 親手打造推薦系統
下一篇
Day 29 - 到底要蒐集哪些特徵資料給系統做學習呢? - 親手打造推薦系統
系列文
親手打造推薦系統30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言