iT邦幫忙

2022 iThome 鐵人賽

DAY 29
0
AI & Data

親手打造推薦系統系列 第 29

Day 29 - 到底要蒐集哪些特徵資料給系統做學習呢? - 親手打造推薦系統

  • 分享至 

  • xImage
  •  

在實作推薦系統時,會遇到一個問題:到底要蒐集哪些特徵資料給系統做學習呢?

這已經不是演算法的問題了,這是系統營運上的問題。這問題也考驗著推薦系統的設計者,到底有多了解系統的使用場景,以及有多了解自家產品的使用者。

影片推薦可能要蒐集哪些資料?

拿我們這系列一直以來要做的事:影片推薦來說,會有多少因素決定使用者看這部影片?

拿我自己當例子,會讓我想看這部影片的因素有:

  1. 網路上是不是有在討論?
  2. 家人朋友是不是有在討論?
  3. 劇情是不是吸引我?
  4. 海報劇照好不好看?
  5. 有沒有我喜歡的演員或導演?
  6. 我有看過嗎?或我有看過類似的影片嗎?

這樣,對應的特徵就有

  1. 影片在網路上的熱度
  2. 家人朋友是否有看過這部,或對這部影片進行過評論
  3. 劇情介紹文本 或 預告片內容
  4. 電影劇照
  5. 演員、導演資料
  6. 我的看電影記錄

那這樣就夠了嗎?

還可以記錄使用者在挑影片時的瀏覽軌跡

推薦系統常用的特徵

除了自己找特徵外,這邊也列出了常用的特徵,在設計系統時,可以提早蒐集。

  1. 使用者行為資料:
    1. 顯性行為:對影片按讚、評分、寫評論等等
    2. 隱性行為:瀏覽介紹、打開原本縮起來的介紹文字
  2. 使用者關聯
    1. 顯性行為:關注好友、建立好友關係
    2. 隱性行為:看同一部電影,住在附近
  3. Tag 標籤機制
  4. 內容類別資料
  5. 上下文資訊
  6. 統計類別特徵
    1. 透過統計方法計算出來的,如CRT、物品熱門度
  7. 組合類別
    1. 不同的特徵進行組合後,合成一個特徵,例如:年齡+性別,合成一個類別

以上在設計系統時,可以參考來設計

參考資料

  1. 帶你深度學習推薦系統 - 王喆 著

上一篇
Day28 - Deepwalk 亂走也能做推薦? - 親手打造推薦系統
下一篇
Day30 - 打造系統不是問題,打造有人用的系統才是問題!推薦系統要成功的非技術因素 - 親手打造推薦系統
系列文
親手打造推薦系統30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言