iT邦幫忙

2022 iThome 鐵人賽

DAY 1
0
AI & Data

親手打造推薦系統系列 第 1

打造給老婆的推薦系統 01 - 緣由與簡介

  • 分享至 

  • xImage
  •  

老婆:「怎麼轉來轉去,都找不到想看的影片~」
我:「都給你自己選片看了,選了10分鐘還找不到要看的?」
老婆:「對啊,好不容易有空了,就是找不到要看的嘛!」
我:「那你想看什麼?」
老婆:「隨便,反正就是我看到以後,是我覺得想要看的。」
我:「… 」

這就是我老婆。

老婆問題很多

找不到好看的影片,會問我有什麼好看的?
挑不到禮物,會問我該買什麼禮物好?
還有...也會問我,今天晚上要吃什麼?

總之,我每天都有回答不完的問題。

有一天我就想到我為什麼不用AI來回答這些問題呢?也許會找到一些從來沒有想過的答案,這樣生活就可以增加很多的樂趣。

其實她的問題大都是落在推薦系統可以處理的範圍裡面,那我是不是就可以打造一個推薦系統給老婆呢?

想到這裡,我就捲起袖子,開始動手。

接下來30天,我要打造出給老婆的推薦系統

我打算讓大家陪我一起打造出給老婆的推薦系統。起碼要讓她好選影片。然後我再看情況加其他的主題,也許是推薦禮物,或是推薦晚上要吃什麼也說不定,就看到時候看老婆大人有沒有什麼新的想法。

此外,實作任何的系統怎麼可能不踩坑?所以接下來大家不只可以看到我怎麼樣把系統做出來,也會讓大家陪著我一起踩坑,然後我們再一起把這個坑補起來。

至於會遇到什麼坑?我也不知道。就當它是一場冒險吧!

那會涵蓋哪些技術範圍呢?

在技術方面,我打算以分享以下內容:

  1. 基於內容相似的推薦系統
  2. 協作過濾法
  3. 因數分解機
  4. GBDT
  5. 冷啟動

其他更深入的內容就要看連載的狀況了(應該不會放棄連載吧...)。

真男人就要自己爬資料

為了打造出給老婆用的推薦系統,我不會去用別人準備好的資料集,因為那不是現在真實的狀況,我會自己爬最新的資料來做訓練。

因為是要做給老婆用的,所以收集的內容都會是臺灣看得到的資料。這也表示,我們要分析的資料都是臺灣用語的繁體中文。至於要怎麼處理?我們之後會跟大家說明。

另外,大家也別擔心我會用爬蟲來混篇數,我知道大家是為了瞭解推薦系統而來的(應該吧),所以我只和大家分享推薦系統,至於爬蟲的部份,我就不在此系列文章裡提。

此系列沒有高深的數學

我的目標是使做出推薦系統,會用到的工具早就被包裝在不同的函式庫裡了。我要分享的是要怎麼樣整合這些工具,把推薦系統做出來。所以一些奇怪的數學符號、數學算式,我是不會讓他出現在這一系列的文章裡。

雖然沒有高深的數學,但基本的數學知識仍然不可少,尤其是線性代數。我會將這些知識用最直覺的方式說明出來,所以不必怕會聽不懂。至於這些工具背後的數學原理,有興趣在研究就可以了,我這邊就不多做說明。

請每天來看看進展

這30天就像是一場說走就走的旅行,只有方向不知道終點,我也不確定會遇到什麼麻煩。

希望到最後,能夠拿出讓老婆滿意的推薦系統。

總之,就請每天來看看進展,你們的支持就是我的動力,有興趣的朋友就讓我們一起出發吧。


下一篇
親手打造推薦系統 Day 02 - 如何用一個晚上的時間復刻出 Netflix 的「類似影片」功能?
系列文
親手打造推薦系統30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言