iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

0 Like 0 留言 885 瀏覽

鐵人賽 DevOps DAY 21

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 21 篇

技術 Day21 - LLM 應用快取實戰：成本改善 × 加速回應

🔹 前言昨天我們談到品質監控與幻覺偵測，就算模型輸出的答案正確，還要確保它「可靠、可信」。但即使模型回答正確，還有一個現實問題： 👉 為什麼我的 LLM...

Hazel ‧ 2025-10-05

0 Like 0 留言 294 瀏覽

鐵人賽 Modern Web DAY 20

前端工程師的AI應用開發實戰：30天從Prompt到Production - 以打造AI前端面試官為例系列第 20 篇

技術小小技術債處理：別讓以後的自己痛苦 Part 2

前言第二十天終於到了，這同時也表示旅程也將到終點了，照我的規劃，剩下的天數應該完全足夠把整個專案完成，並在最後一天做個總回顧跟一些可能的發展方向，理論上應該能...

windate3411 ‧ 2025-10-04

0 Like 0 留言 1447 瀏覽

鐵人賽 DevOps DAY 18

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 18 篇

技術 Day18 - 用 FastAPI 實作 LLM API Gateway：驗證、限流、觀測與實務選型

🔹 前言經過前面系列的文章，我們已經從零搭建出一條完整的 RAG Pipeline ，目前具備以下能力：文件清洗與 Chunking 把原始文件整理成乾...

Hazel ‧ 2025-10-02

0 Like 0 留言 337 瀏覽

鐵人賽 Modern Web DAY 17

前端工程師的AI應用開發實戰：30天從Prompt到Production - 以打造AI前端面試官為例系列第 17 篇

技術為 AI 植入短期記憶：實作對話上下文

前言歡迎來到第十七天！昨天我們為 Streaming 體驗加上了「打字機效果」和「取消功能」，讓 AI 面試官的互動感覺更流暢、更可控。整個通訊管道現在可以說...

windate3411 ‧ 2025-10-01

0 Like 0 留言 734 瀏覽

鐵人賽 AI & Data DAY 20

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 20 篇

技術 Day 20｜實戰 RAGAs：量化檢索與生成的表現

前面指標能介紹的都介紹完了，今天就開始我們的實作吧！要複習的話可以參考前幾天的內容，就讓我們開始ㄅ～ 1. 安裝環境這邊我們使用 Ollama + Mistr...

otterday ‧ 2025-10-04

0 Like 0 留言 388 瀏覽

鐵人賽 AI & Data DAY 19

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 19 篇

技術 Day 19｜RAG 評估指南（2/2）：RAG 特定指標（下）

昨天介紹了 RAGAs 當中的核心指標了，今天是主要討論跟總結。其實昨天只提到了最主要的核心部分，不過還有很多可以去仔細翻閱查看，這邊就留給大家學習了，絕對不是...

otterday ‧ 2025-10-03

0 Like 0 留言 602 瀏覽

鐵人賽 AI & Data DAY 18

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 18 篇

技術 Day 18｜RAG 評估指南（2/2）：RAG 特定指標（上）

前面有介紹過一些傳統的指標像是精確率、召回率那些，不過那些指標都不能完整的反應 RAG 的效能，因為 RAG 的系統同時會牽涉到「檢索」與「生成」兩個部分，所以...

otterday ‧ 2025-10-02

0 Like 0 留言 389 瀏覽

鐵人賽 AI & Data DAY 17

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 17 篇

技術 Day 17｜RAG 評估指南（1/2）：檢索指標（下）

今天只負責總結內容噢！如果需要看更詳細的內容就請回顧下面這兩天的： Day 15｜RAG 評估指南（1/2）：檢索指標（上） Day 16｜RAG 評估...

otterday ‧ 2025-10-01

0 Like 0 留言 663 瀏覽

鐵人賽 AI & Data DAY 16

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 16 篇

技術 Day 16｜RAG 評估指南（1/2）：檢索指標（中）

延續昨天的內容，如果想回顧其他指標的話可以看上一篇－－Day 15｜RAG 評估指南（1/2）：檢索指標（上）廢話不多說了，我們馬上開始！ 5. F1 分數...

otterday ‧ 2025-09-30

0 Like 0 留言 588 瀏覽

鐵人賽 AI & Data DAY 15

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 15 篇

技術 Day 15｜RAG 評估指南（1/2）：檢索指標（上）

昨天有說到 RAG 的效能衡量可以分成兩大類，今天就是要先介紹檢索指標（Retrieval metrics）。我們不需要把檢索和生成混在一起看，而是可以單獨檢查...

otterday ‧ 2025-09-29

0 Like 0 留言 600 瀏覽

鐵人賽 AI & Data DAY 14

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 14 篇

技術 Day 14｜RAG 評估方法概要：量化效能，避免幻覺

這次要講的內容是如何去評估 RAG 的效能。我們使用 RAG 的最大原因，就是希望能避免 LLM 產生幻覺，但問題是：即使結合了檢索，我們仍然不能百分之百保證...

otterday ‧ 2025-09-28

2 Like 0 留言 1245 瀏覽

鐵人賽 AI & Data DAY 13

Notion遇上LLM：30天打造我的AI知識管理系統系列第 13 篇

技術【Day 13】Chunking 策略：為 Embedding 做好準備

在 Day 12，我們理解了 Embedding 這個將「語意」轉化為「數學座標」的魔法。在我們迫不及待地想把所有筆記都向量化之前，還有一個極其重要、卻也最常被...

Nikki Chen ‧ 2025-09-27 ‧團隊三陳牛肉吉事堡

0 Like 0 留言 518 瀏覽

鐵人賽 AI & Data DAY 13

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 13 篇

技術 Day 13｜實戰 Generation Pipeline：Chroma 檢索 × Ollama 生成的完整流程

今天要實作的內容是 Generation pipeline 的部分，就是怎麼將提問跟 RAG 檢索到的資料全部丟到 LLM 給他做回應。因為這邊後面的實作內容...

otterday ‧ 2025-09-27

0 Like 0 留言 630 瀏覽

鐵人賽 DevOps DAY 12

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 12 篇

技術 Day12 - 知識庫資料管理：多來源整合 × 可追溯版本控制

🔹 前言經過前幾天（Day 8–11）的實作，我們已經完成了從文件清洗 → Chunking → 向量化 → 索引 → 查詢流程 → 上下文組裝的基礎。...

Hazel ‧ 2025-09-26

0 Like 0 留言 836 瀏覽

鐵人賽 AI & Data DAY 12

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 12 篇

技術 Day 12｜實戰向量資料庫：用 ChromaDB 查詢法規內容

昨天已經教學大家要怎麼做 Chunking 了，今天就是要教學如何把它放進一個可以用來查詢的資料庫，這邊我們也會試著提問，看產出。雖然我昨天的教學只有教你怎麼切...

otterday ‧ 2025-09-26

0 Like 0 留言 516 瀏覽

鐵人賽 AI & Data DAY 11

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 11 篇

技術 Day 11｜實戰 Chunking：從《資通安全管理法》學習切分技巧

今天就開始我們的實作，這次我取用的資料是資通安全管理法，這邊可以直接點擊網站下載。 1. 取得文件內的文字要處理這個文件前，要先取得這個檔案的內容。 # 要先安...

otterday ‧ 2025-09-25

0 Like 0 留言 449 瀏覽

鐵人賽 Modern Web DAY 9

前端工程師的AI應用開發實戰：30天從Prompt到Production - 以打造AI前端面試官為例系列第 9 篇

技術解鎖語意搜尋：親手計算向量的餘弦相似度

前言歡迎來到第九天！昨天我們透過了解了 RAG 的基本概念並透過 Gemini Embedding API 實際看到了文字是怎麼轉為向量陣列的，我自己相當喜歡...

windate3411 ‧ 2025-09-23

0 Like 0 留言 890 瀏覽

鐵人賽 AI & Data DAY 10

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 10 篇

技術 Day 10｜小總結 & 實作規劃——我的第一個 RAG Pipeline 要長什麼樣？

新來的朋友，建議可以先回顧前幾天的文章，之前已經分別聊過 RAG 的兩大流程： Indexing pipeline：資料怎麼被處理、切割、轉換成向量，最後存進...

otterday ‧ 2025-09-24

0 Like 0 留言 634 瀏覽

鐵人賽 Modern Web DAY 8

前端工程師的AI應用開發實戰：30天從Prompt到Production - 以打造AI前端面試官為例系列第 8 篇

技術 AI 的開卷考試：初探 RAG 與 Embedding

前言歡迎來到第二週！真虧你看完昨天那篇落落長的鬼東西還沒棄坑，真有你的！我打完看了一下字數約四萬字，自己也傻了一下，但為了系列文的完整度我又不能直接跳過那些程...

windate3411 ‧ 2025-09-22

0 Like 0 留言 431 瀏覽

鐵人賽 AI & Data DAY 9

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 9 篇

技術 Day 9｜Prompt Engineering——設計好問題，AI 才能給好答案

延續 Day 7｜Generation pipeline：AI 如何把知識取出來用的內容，這邊要講到 Prompt Engineering，這邊會很重要的原因...

otterday ‧ 2025-09-23

0 Like 0 留言 545 瀏覽

鐵人賽 AI & Data DAY 8

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 8 篇

技術 Day 8｜檢索方式——AI 應該怎麼樣選擇「誰來幫它找資料」呢？

在 Day 7｜Generation pipeline：AI 如何把知識取出來用有說到檢索方式其實有很多種，今天就來介紹幾種常見的檢索方式。 1. TF-...

otterday ‧ 2025-09-22

0 Like 0 留言 1645 瀏覽

鐵人賽 DevOps DAY 8

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 8 篇

技術 Day08 - RAG 資料預處理：文件清洗與 Chunking 切片策略

🔹 前言昨天我們做了一個最小可行的 QA Bot，但知識庫的單位是「整句 FAQ」，格式非常乾淨。然而真實情況下，文件來源可能包含： Word / PDF...

Hazel ‧ 2025-09-22

0 Like 0 留言 581 瀏覽

鐵人賽 AI & Data DAY 7

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 7 篇

技術 Day 7｜Generation pipeline：AI 如何把知識取出來用

之前我們已經討論過 Indexing pipeline 是怎麼把知識存進去，現在就要來看 Generation pipeline 如何把知識「取出來用」。這邊可...

otterday ‧ 2025-09-21

0 Like 0 留言 711 瀏覽

鐵人賽 DevOps DAY 7

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 7 篇

技術 Day07 - 最小可行的 RAG QA Bot（Web 版 MVP）

🔹 前言昨天 (Day 6) 我們第一次跑出 Minimal RAG QA Bot，流程是：使用者提問 → Embedding → 檢索 → LLM 回答。...

Hazel ‧ 2025-09-21

0 Like 0 留言 861 瀏覽

鐵人賽 DevOps DAY 6

30 天帶你實戰 LLMOps：從 RAG 到觀測與部署系列第 6 篇

技術 Day06 - RAG 檢索增強生成入門：最小可行 Demo 實作

🔹 前言前兩天我們分別搞定了 RAG 的兩個基礎拼圖： Day 4 向量資料庫 → 負責「存資料」以及「找尋片段」 Day 5 Embedding 模型...

Hazel ‧ 2025-09-20

0 Like 0 留言 602 瀏覽

鐵人賽 AI & Data DAY 6

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 6 篇

技術 Day 6｜只是存資料？——向量資料庫比你想的還厲害

新來的朋友，一樣先建議先回顧先前的文章，才會比較明白整個 Indexing pipeline 的流程以及這章是在哪個環節噢！文章在這：Day 3｜Indexin...

otterday ‧ 2025-09-20

0 Like 0 留言 421 瀏覽

鐵人賽 AI & Data DAY 5

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 5 篇

技術 Day 5｜射箭還是量尺？——AI 如何判斷文字的相似度

怕大家突然看到這篇會不知道為什麼跳到這部分，如果是新來的朋友想了解詳細流程，可以先回顧我之前第三天的文章：Day 3｜Indexing pipeline：如何為...

otterday ‧ 2025-09-19

0 Like 0 留言 575 瀏覽

鐵人賽 AI & Data DAY 4

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 4 篇

技術 Day 4｜Embedding 是什麼？——如何把文字變成數字空間

昨天把 Indexing pipeline 跑過一遍：從資料載入、Chunking、Embeddings，到向量資料庫。要讓 RAG 找到「對的內容」，關鍵在第...

otterday ‧ 2025-09-18

0 Like 0 留言 324 瀏覽

鐵人賽生成式 AI DAY 4

AI x Hardware 系列第 4 篇

技術 RAG 協作下的義診系統：在限制中尋找解方

硬體眾籌，參差不齊的起點當這個專案從「需求」走到「實作」的階段時，我們面臨的第一個現實問題，就是硬體來源。所有設備都是透過志工與善心人士眾籌而來的。這聽起來...

家誠 ‧ 2025-09-18

1 Like 0 留言 460 瀏覽

鐵人賽 AI & Data DAY 3

RAG × Agent：從知識檢索到智慧應用的30天挑戰系列第 3 篇

技術 Day 3｜Indexing pipeline：如何為 RAG 建立知識庫

昨天看到 RAG 架構，今天要更深入，看看如何建立知識庫。我們先看這張圖來逐一拆解他的步驟：來源:Build a Retrieval Augmented Ge...

otterday ‧ 2025-09-17