昨天把 Indexing pipeline 跑過一遍:從資料載入、Chunking、Embeddings,到向量資料庫。要讓 RAG 找到「對的內容」,關鍵在第...
前言
昨天,我把 PDF 轉化為向量寶石,存入了我的魔法空間(Storage Layer)。今天,我迎來了一位全新的魔法夥伴:Ollama 模型。它是我的智慧問...
昨天有說到 RAG 的效能衡量可以分成兩大類,今天就是要先介紹檢索指標(Retrieval metrics)。我們不需要把檢索和生成混在一起看,而是可以單獨檢查...
在上一篇中,我們確定標註目標(情緒分類、主題分類)之後,下一步就是進行實際的資料標註。我們需要先決定要使用什麼標註工具以及標註的工作流程。
常見的標註工具選擇...
引言
升大四那年暑假在思考著人生的下一步時,偶然接觸到了「自然語言處理 NLP」這個 fancy 的名詞。當時一方面是被「外文系也能跟 AI 扯上關係」的噱頭燒...
同步至 medium
在開始進行我們的 AI 工具人的建立時,我們要先來理解一下一個東西,那就是 AI Framework,這裡我們先簡單聊聊我自已的想法 ~...