讓AI懂你：實作電影推薦系統的核心技術

2024 iThome 鐵人賽

DAY 10

AI/ ML & Data

16th鐵人賽 ai

883 瀏覽

在第五天的內容我們提到了推薦系統，主要是計算「用戶」的相似度以及「項目」的相似度（稱為協同過濾），今天要來學習AI如何統整這些大量又複雜的數據、還有它們的評估標準又是什麼，才使得它可以快速又精準的推測我們的喜好。

一、矩陣分解技術

當我們處理協同過濾時，很多時候數據是非常稀疏的，因為不是每個用戶都對每個項目評分。矩陣分解可以幫助我們從這些零散的評分數據中推測出用戶對其他項目的潛在喜好，並提高模型的推薦精度。

SVD（Singular Value Decomposition）
將用戶-項目矩陣拆解為更小的矩陣：用戶矩陣、奇異值矩陣（代表數據特徵重要性順序）、以及項目矩陣，可以預測缺失的評分。
例如：有一張包含用戶對電影評分的表格，但不是每個人都對所有電影評分。SVD 就是幫你把這張表拆解成兩張更小的表，分別代表用戶和電影的特徵，而奇異值代表了數據中的重要性排序，如「喜劇」對推薦影響很大，那這個奇異值就會比較高。
NMF（Non-negative Matrix Factorization）
和SVD差不多但數據只能為正數

二、模型優化與評估指標

在優化推薦系統時，經常使用的評估指標包括：