iT邦幫忙

鐵人檔案

2022 iThome 鐵人賽
回列表
AI & Data

親手打造推薦系統 系列

老婆的問題很多。

找不到好看的影片,會問我有什麼好看的?
挑不到禮物,會問我該買什麼禮物好?
還有...今天晚上要吃什麼?

怎麼我每天都有回答不完的問題?
那就來打造可以回答老婆問題的推薦系統吧!

接下來30天,我打算讓大家陪我一起實做推薦系統。

我會從影片的推薦引擎開始,技術方面,我打算分享以下內容:

1. 基於內容相似的推薦系統
2. 協作過濾法
3. 因數分解機
4. GBDT

總之,就請每天來看看,讓我們一起出發吧!

鐵人鍊成 | 共 30 篇文章 | 12 人訂閱 訂閱系列文 RSS系列文
DAY 1

打造給老婆的推薦系統 01 - 緣由與簡介

老婆:「怎麼轉來轉去,都找不到想看的影片~」我:「都給你自己選片看了,選了10分鐘還找不到要看的?」老婆:「對啊,好不容易有空了,就是找不到要看的嘛!」我:「那...

2022-09-16 ‧ 由 資訊海 分享
DAY 2

親手打造推薦系統 Day 02 - 如何用一個晚上的時間復刻出 Netflix 的「類似影片」功能?

今天我們來用基於內容過濾(Content Based Filtering)的推薦,來復刻版像 Netflix 的類似影片功能,然後來看看我們與 Netflix...

2022-09-17 ‧ 由 資訊海 分享
DAY 3

Day 03 - 如何用 sklearn 算相似度?看懂這個蛋糕不見的故事就懂了! - 親手打造推薦系統

從前一天的文章(Day 02-如何用一個晚上的時間復刻出 Netflix 的「類似影片」功能?)裡面,我們知道要做出「類似影片」的功能,就要找出任兩部影片之間的...

2022-09-18 ‧ 由 資訊海 分享
DAY 4

Day 04 - 電影資訊要怎麼轉成特徵向量呢? - 親手打造推薦系統

在上一篇我們了解,只要東西能轉成特徵向量,那不論用歐幾里德距離或餘弦相似度,都可以找出兩個東西間「有多像」!今天來討論怎麼樣把電影資訊向量化。但電影的資訊又不是...

2022-09-19 ‧ 由 資訊海 分享
DAY 5

Day05 - 利用 sklearn 的 TfidfVectorizer 做電影資訊的向量化 - 親手打造推薦系統

今天我們要說明如何用sklearn 的 TfidfVectorizer 將電影資訊向量化。 要怎麼做呢?只要4個步驟。 第1步:準備好斷好的文章 我準備了111...

2022-09-20 ‧ 由 資訊海 分享
DAY 6

Day 06 - 用中研院 CKIP Transformers 做中文斷詞,台灣國語不再結巴 - 親手打造推薦系統

自然語言的處理常常要做斷詞,像是昨天說的做 tf-idf 。如果能夠在不失原意的情況下,把文章主要的內容詞彙找到,並刪掉沒有用的詞,後面的分析就會因為得到比較乾...

2022-09-21 ‧ 由 資訊海 分享
DAY 7

Day 07 - 推薦得到底對不對?從關鍵字下去看看 - 親手打造推薦系統

之前我們都在數學上打轉,看看相關影片是哪裡相關了?相關的理由有沒有直觀的看法呢?今天我們就不再做計算,我拿3個實際的影片推薦的例子來看看,這演算法到底是怎麼推薦...

2022-09-22 ‧ 由 資訊海 分享
DAY 8

Day 08 - 協作過濾(Collaborative Filtering)是什麼?UserCF和ItemCF有什麼差別?

如果有常去逛電商網站,就可能有看過網站推薦你:「購買了這本書的人還買了什麼?」或者,「誰的粉絲也看了什麼影片?」。這樣的推薦方式是什麼樣的推薦方式呢? 前幾天的...

2022-09-23 ‧ 由 資訊海 分享
DAY 9

Day 09 - 就算媽祖沒有顯靈,我們也不能放棄希望。如何用 Collaborative Filtering 預測電影評分做推薦? - 親手打造推薦系統

如果媽祖託夢,告訴我們每一個人對每部電影有多喜歡,喜歡程度從 1 星到 5 星,最後得到下表,那我們的推薦系統只要查表就好了,這樣變得非常簡單! 例如我們有一張...

2022-09-24 ‧ 由 資訊海 分享
DAY 10

Day 10 - ItemCF 和 UserCF 各適合用在哪裡?協作過濾法(CF)的優、缺點有哪些?還有與基於內容的推薦有哪些不同? - 親手打造推薦系統

這兩天我們介紹了 協作過濾法是什麼,昨天也說明了UserCF 和 Item CF 的演算法。但工具要使用,還得要看場合。只要場合對,任何演算法都是最佳演算法。...

2022-09-25 ‧ 由 資訊海 分享