在昨天的文章中,我們探討了 RAG(檢索增強生成)的準備階段 (Indexing)。了解到此準備工作如同為 AI 精心打造一本高品質、易於查閱的「參考書」。從載...
▋前言
由於競賽取得的資料不能對外公開,在接下來的系列文中,我們會開始利用開源語音資料集,來測試系統在不同場景下的表現。
▋內容
預計選用以下三個資料集,來...
前言
不管你做的是資料產品、內容網站、還是 side project app,最大的痛點通常不是技術,而是流程「接不起來」。從資料到上線,再到持續改善。原則只有...
前言
大多數推薦系統只學「你點了什麼」,很少理解「你當下的狀態」。但人在不同情緒下,偏好會位移:通勤路上想看輕鬆短內容,下班後才有耐心讀長文;焦慮時偏向保守選項...
🛠 工作項目
1) 特徵工程(Python, 本機)
原始欄位 → 特徵:
grade(A/B/C/D → one-hot 或 ordinal: A=3,B...
背景與目標
在 Day 15,我們統一了推薦輸出的格式,並存到 MLflow artifacts。今天我們來進行:
單一樣本解釋:看特定動畫的 genre/...