iT邦幫忙

2022 iThome 鐵人賽

DAY 14
0
AI & Data

親手打造推薦系統系列 第 14

Day14 - 冷啟動有哪些對策? - 快速試探策略 - 親手打造推薦系統

  • 分享至 

  • xImage
  •  

昨天提到了冷啟動的2個對策,今天我們來說說另一個對策 - 快速試探策略

對策6:快速試探策略

  • 這方法是先隨機或用非個性化推薦,在使用者和系統做些互動後,馬上挖掘出他的興趣。新物品也隨機給使用者看,再觀察使用者反應。
  • 如果使用者有透漏出有興趣的樣子,例如有:觀看、購買、收藏、分享等等,後賣應該把東西推薦類行為的人。
  • 就這樣一次次的循環過 ,讓推薦系統快速度過冷啟動狀態。
  • 那要怎麼快速試探呢?這個問題就是多臂吃角子老虎機問題!

多臂吃角子老虎機問題

多臂吃角子老虎機 (multi-armed bandit) ,指的則是很多台吃角子老虎機給玩家選擇,每一台機器可以得到的期望報酬皆不一樣。站在玩家的立場,目標應該是透過機器的選擇,在遊戲中獲得最大「期望報酬」。

ε-優先 (ε-first) 策略

這種是最簡單也策基本的做法。

假設賭徒的錢,可以他玩1000次,那他可以拿十分之一出來去測試新的機器。等全部測完以後,知到哪些機器賺錢機率是高的 ,接下來 900 次,就全玩機率高的那些機器,以賺最大報酬。

ε-貪婪 (ε-greedy) 策略

ε-優先 (ε-first) 策略把解決多臂吃角子老虎機問題,分成兩步驟:探索及開發。沒有把這兩件事融合在一起。
如何兼顧探索與開發呢?

這方法是,每一次我們要選機台時,我們會有 ε 的機率去選我們沒用過的機台,其餘機會,全都去拉已知收益最高的機台。


上一篇
Day13 - 冷啟動問題有哪些對策?冷啟動問題(2) - 親手打造推薦系統
下一篇
Day15-如何用邏輯回歸(LR)解決推薦電影問題?-親手打造推薦系統
系列文
親手打造推薦系統30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言