iT邦幫忙

2022 iThome 鐵人賽

DAY 10
0
AI & Data

親手打造推薦系統系列 第 10

Day 10 - ItemCF 和 UserCF 各適合用在哪裡?協作過濾法(CF)的優、缺點有哪些?還有與基於內容的推薦有哪些不同? - 親手打造推薦系統

  • 分享至 

  • xImage
  •  

這兩天我們介紹了 協作過濾法是什麼,昨天也說明了UserCF 和 Item CF 的演算法。但工具要使用,還得要看場合。只要場合對,任何演算法都是最佳演算法。

ItemCF 和 UserCF 各適合用在哪裡?協作過濾法(CF)的優、缺點有哪些?還有與基於內容的推薦有哪些不同?接下來我們一一來比較。

UserCF 和 Item CF 應用場景

UserCF 使用場景

  1. 因為是透過朋友的喜好做推薦,會推薦出以前沒接觸過的事物,適合在找新鮮感的使用者。
  2. 適合用在內容快速更新的場景,例如 youtube 、新聞網站這類,大家上來很大部份的原因是要來找有趣的內容。
  3. 例如:使用者若對「魔戒」有興趣,那系統可能會推薦雖和魔戒關係不大,但最近很紅的電影,並且這電影是使用者會喜歡的。
  4. 有很強的社交傾向,使用者可以快速得知與自己類似興趣的人,正在關注什麼,進而一起了解,一起討論。通常看的推薦理由是: XXX 的粉絲也看過 YYY ,就屬這一類。

ItemCF 使用場景

  1. 因為是基於物品評價的相似度做推薦的,適合協助深度挖掘某個領域,適合用在找某類電影、產品的使用者。
  2. 通常用在購物網站上,因為上網購物時,若是對某產品感興趣,通常就是要解決生活中的某個問題。
  3. 例如,鍵盤壞了上網找鍵盤,就希望從不同種鍵盤裡挑一個回來用,這時推薦衣服會令使用者很困擾,因為對他解決問題一點幫助也沒有。

協作過濾法(CF)的優、缺點

優點

  1. 直覺、可解釋性強。
  2. 有利用眾人的智慧(評分)來做個人化的推薦。
  3. 不需要去分析商品的內容:因為是透過評分去做推薦,所以對於難分析的事變得也可以做推薦。例如:電影、音樂、畫作等等。
  4. 可以幫助使用者找到會喜歡但沒見過的事,拓展新的興趣。

缺點

  1. 要維護很大的評分表,使用者和商品變多,系統效能會低得很快!
  2. 沒有相似的資料,就沒有用了。但通常一開始都沒有資料,誰和誰相似就做不出來了!
  3. 除了分數資訊外,沒有用到其它的特徵資料。例如:人的性別、年齡、地區分佈,也沒有用商品資訊、電影裡的內容資訊。
  4. 冷門的東西(沒人理的東西)就不會被推薦。和熱門東西以及和它相似的東西,就會被強力推薦(因為人們愛,資料多)。

基於內容過濾(CBF)和協作過濾(CF)的推薦演算法優缺點比較

協作過濾法

優點:

根據使用者的和系統的互動資料做推薦,跟商品的內容、屬性無關。沒用到其它商品的資料。

缺點:

  1. 沒有基本的用互動的歷史資料,就無法使用,需解決冷啓動問題。
  2. 商品或使用者大量增加的話,協同過濾評分表越難算

基於內容推薦

優點:

  1. 根據商品的內容進行推薦,沒有使用者的偏好資料也沒問題,所以無需解決冷啓動問題。

缺點:

  1. 需要透徹的內容分析,若內容不足或內容無法表達商品,那推薦便不準確。
  2. 因用內容分析,常受到同個詞有歧義(如蘋果,到底是手機?還是水果?)而影響推薦。
  3. 不能給使用者帶來驚喜,因為只是推薦內容相似的商品。

接下來呢?

到此,我們介紹了基於內容(CBF)及協作過濾(CF)2種推薦演算法。並且也說明了各種作法的優缺點,以及應用場景。

接下來會帶著大家實作,以及介紹其它的演算法來改善這幾個演算法的缺點。


上一篇
Day 09 - 就算媽祖沒有顯靈,我們也不能放棄希望。如何用 Collaborative Filtering 預測電影評分做推薦? - 親手打造推薦系統
下一篇
Day 11 矩陣分解演算法介紹 - 親手打造推薦系統
系列文
親手打造推薦系統30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言