iT邦幫忙

2022 iThome 鐵人賽

DAY 15
0
AI & Data

親手打造推薦系統系列 第 15

Day15-如何用邏輯回歸(LR)解決推薦電影問題?-親手打造推薦系統

  • 分享至 

  • xImage
  •  

邏輯回歸是機器學習裡要解決的基本問題。如下圖:

https://ithelp.ithome.com.tw/upload/images/20220930/20152556a46ld5NcUZ.png

就是給一個特徵向量及答案的組合,這些資料給機器作學習,未來可以拿某個特徵向量問機器,請它做答案的預測。

用在電影推薦上,我們可以把使用者和電影的及評分表給機器學習, 日後只要問機器,某使用者對某部電影評分的話,他會評幾分?只要能預測出來,我們就能夠知道一部電影要不要推薦給這個人了。

推薦問題變成可以用邏輯回歸來解決。

那要怎麼做?

原本的評分表

把之前的討論 協作過濾的評分表拿來做例子。評分表是2維的,一維是使用者,一維是電影,如下圖:

https://ithelp.ithome.com.tw/upload/images/20220930/20152556jPgrN8qKna.png

One Hot 編碼

將使用者編碼如下:

https://ithelp.ithome.com.tw/upload/images/20220930/20152556ygsZNBDwec.png

電影編碼如下:

https://ithelp.ithome.com.tw/upload/images/20220930/20152556woAp3rqjZJ.png

最後就可以變成

https://ithelp.ithome.com.tw/upload/images/20220930/20152556XRnSUvnV9j.png

評分若是5分的,這就變成分成5類問題。若把4~5分為一類,1~3分為一類,這樣就變成 2 分類的問題。

接著就可以用原本機器學習的方式,來預測某個人對某部電影會不會想看

用這個方法還有其它的好處

可以再把其它的特徵放進來訓練,例如:

  1. 把性別放進來:使用 one hot
  2. 把年齡放進來:就一個數字
    如此不放過任何可以當成線索的東西。

例如:

https://ithelp.ithome.com.tw/upload/images/20220930/20152556z1YNS6OZM8.png

接下來

今天,我們用用機器學習的方式,把特徵向量組合及最後的評分組合起來,讓推薦問題就變成了分類問題。
但,矩陣稀疏會影響效果,接下來會介紹其它的解法,進一步解決稀疏的影響。


上一篇
Day14 - 冷啟動有哪些對策? - 快速試探策略 - 親手打造推薦系統
下一篇
Day16 - 因數分解機簡介 - 搞定稀疏又非線性的回歸問題 - 親手打造推薦系統
系列文
親手打造推薦系統30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言