iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
AI & Data

從RAG到EmoRAG:讓AI真正聽懂你的心聲 系列

還記得那個深夜,你正在vibe coding的時候,ChatGPT突然把你精心調試的核心函數給「優化」了嗎?還記得你明明跟它說過「不要動這段程式碼」,結果下一回合它又犯同樣的錯誤嗎?如果你曾經對著螢幕咬牙切齒,心想「為什麼這些AI就是不懂我的意思?」——恭喜你,你並不孤單。

這些令人抓狂的時刻,其實正是我們開始這趟30天學習旅程的起點。
文章架構如下:
1.RAG基礎與檢索技術入門
2.向量化與語意檢索
3.生成式模型與RAG整合
4.進階RAG技術與優化
5.實際應用與部署

參賽天數 4 天 | 共 4 篇文章 | 2 人訂閱 訂閱系列文 RSS系列文
DAY 1

第1天:EmoRAG專案初始化與環境建置

筆者透過觀察身邊的人發現使用chatgpt做vibe coding上,最容易讓人暴怒的點就是ai擅自更改了不想被更改的程式碼,也不會告訴使用者,並且比較健忘,說...

2025-09-15 ‧ 由 XianYun 分享
DAY 2

第2天:文字預處理與基礎情緒辨識

文本預處理是指對原始文本資料進行清理和轉換,使其更適合進一步的分析與建模。它主要包括去除雜訊、標準化格式、分詞、詞性標註、去除停用詞、詞幹提取與詞形還原等步驟,...

2025-09-16 ‧ 由 XianYun 分享
DAY 3

第3天:關鍵字檢索實作與情緒標籤

語言模型會將單詞依據詞意、關聯性、頻率轉換成數字特徵的形式,這種轉換方式有分三種,一種是傳統機器學習使用的方式,使用規則與統計做one-hot編碼方式,又稱關鍵...

2025-09-17 ‧ 由 XianYun 分享
DAY 4

第4天:向量檢索與情緒嵌入

什麼是向量檢索? 向量檢索是現代RAG系統的核心技術之一。簡單來說,就是將文本轉換為高維向量表示,然後透過計算向量之間的相似度來找到最相關的文檔。 傳統的關鍵字...

2025-09-18 ‧ 由 XianYun 分享