iT邦幫忙

rag相關文章
共有 73 則文章
鐵人賽 DevOps DAY 7

技術 Day07 — 最小可行的 RAG QA Bot(Web 版 MVP)

🔹 前言 昨天 (Day 6) 我們第一次跑出 Minimal RAG QA Bot,流程是: 使用者提問 → Embedding → 檢索 → LLM 回答。...

鐵人賽 DevOps DAY 6

技術 Day06 - 初探 RAG(Retrieval-Augmented Generation)

🔹 前言 前兩天我們分別搞定了 RAG 的兩個基礎拼圖: Day 4 向量資料庫 → 負責「存資料」以及「找尋片段」 Day 5 Embedding 模型...

鐵人賽 AI & Data DAY 4

技術 Day 4|Embedding 是什麼?——如何把文字變成數字空間

昨天把 Indexing pipeline 跑過一遍:從資料載入、Chunking、Embeddings,到向量資料庫。要讓 RAG 找到「對的內容」,關鍵在第...

鐵人賽 生成式 AI DAY 4
AI x Hardware 系列 第 4

技術 RAG 協作下的義診系統:在限制中尋找解方

硬體眾籌,參差不齊的起點 當這個專案從「需求」走到「實作」的階段時,我們面臨的第一個現實問題,就是硬體來源。 所有設備都是透過志工與善心人士眾籌而來的。這聽起來...

鐵人賽 AI & Data DAY 2

技術 Day 2|RAG 的基本架構

昨天我們提到 LLM 有三個限制:資料過時、資料來源有限,以及容易產生幻覺。今天要介紹的 RAG(Retrieval-Augmented Generation)...

鐵人賽 生成式 AI DAY 2

技術 Day 2: 為什麼要還要寫RAG? Fine-Tuning不香嗎?

在上一篇導論中,我們提到因簡單的RAG不足以處理實務問題,且有機敏資料你希望保護,所以需要在地端建立AgenticRAG。那就會有人問: "那為什麼公...

鐵人賽 生成式 AI DAY 2

技術 Day02 - OCR 知識:什麼是 RAG?它如何解決 LLM 的知識盲點

在進入 RAG(Retrieval-Augmented Generation,檢索增強生成)的世界前,讓我們先思考一個核心問題:為什麼大型語言模型(LLM)有時...

鐵人賽 AI & Data DAY 2

技術 【Day 2】打造 AI 知識助理的系統架構與功能地圖

在 「Notion 遇上 LLM:30 天打造我的 AI 知識管理系統」 系列裡,我的目標是把 Notion 從一個單純的筆記倉庫,進化為一個能理解內容、回答問...

鐵人賽 AI & Data DAY 1

技術 Day 1|什麼是 RAG?

在第一天,我想先從基礎先談起。大家可能都聽過生成式 AI 像是 (ChatGPT),有時候使用完他可能也是在「亂編答案」,不見得能夠一步到位就生成你想要的問題,...

鐵人賽 生成式 AI DAY 1

技術 Day 1: 為什麼要還要寫RAG? 又為什麼要從 RAG 到 Agentic RAG?

🔍 為什麼要寫這個系列? Hi 我是Seedfood,是一名DA轉DS轉MLE再轉AI的雜技Data人。 今年在強者我朋友們的力推下,勇敢地參加了這屆的鐵人賽,...

鐵人賽 生成式 AI DAY 1

技術 Day01 - 系列導讀:為什麼需要文件問答系統?RAG × OCR × Layout 的價值

在數位化浪潮下,企業紛紛擁抱生成式 AI,其中最常見的應用,無非是客服與知識管理。然而,在建置企業專屬的知識庫時,一個棘手問題浮現:如何讓 AI 正確解析各式各...

鐵人賽 AI & Data DAY 1

技術 【Day 1】系列開場 - Notion 遇上 LLM

歡迎來到本系列 歡迎來到 「Notion 遇上 LLM:30 天打造我的 AI 知識管理系統」。在接下來的一個月裡,我會帶你一步步實作,從需求分析、系統架構設計...

鐵人賽 Software Development DAY 4

技術 Day 4【核心概念】 認識 RAG 架構與其在對話機器人中的應用

HI!大家好,我是 Shammi 😊 在開發程式前也需要了解 AI 基本應用,一起來認識RAG架構是什麼吧!開始前,你有沒有想過,為什麼有些 AI 機器人會一本...

鐵人賽 生成式 AI DAY 24

技術 Day24-用 RAG 來比較 Fine Tune 的結果

今天我們終於要來做 RAG 了。我們很快就會看到其實在客服性質裡的場景,RAG 的效果會比 Fine Tune 好上很多。 我們接著來寫程式吧! 導入必要的套...

鐵人賽 生成式 AI DAY 19

技術 Day19-淺談 Retrieval-Augmented Generation (RAG) 的手法

Retrieval-Augmented Generation (RAG) 是一種結合了檢索技術和生成技術的強大方法,旨在提高大型語言模型(LLM)的回答準確性,...

鐵人賽 生成式 AI DAY 29
懶人救星:生成式AI 系列 第 29

技術 Day29-人工智慧搜尋引擎革命:Perplexity AI

Perplexity AI Perplexity AI 是一款先進的人工智慧搜尋引擎,結合了即時網路搜尋和自然語言處理技術。 功能 高品質答案🎯Perple...

鐵人賽 生成式 AI DAY 14

技術 Part1: Azure聊天機器人原理-架構回顧

▋Azure聊天機器人實例 從Day2初次看到這張Azure聊天機器人架構圖,到現在經過了各種層面的認識之後,重新再看一次這張圖大家可能已經有不同的感想了。今...

鐵人賽 生成式 AI DAY 27

技術 day27 智能架構圖生成器升級:雲端搜尋RAG與架構圖生成展示

前言 昨天我們利用LangChain驅動我們的生成雲端架構圖系統,成功輔以AWS Kendra的文件搜尋功能作為RAG技術的實現,那麼今天我們同樣的會改進我們的...

鐵人賽 生成式 AI DAY 26

技術 day26 AWS Kendra 智慧高效雲端搜尋:LangChain 驅動的雲端架構生成應用

前言 day25我們進行Kendra的創建以及S3文件的同步,我們可以即時的更新RAG資料,得以讓應用程式去搜尋,傳送給LLM得到精準回應,那麼今天就要進行La...

鐵人賽 生成式 AI DAY 25
懶人救星:生成式AI 系列 第 25

技術 Day25-測試你的 RAG Chatbot 到底行不行?幾個評估指標給你答案!

前言✨ LlamaIndex🦙 是一個強大的工具,可用於評估大型語言模型(LLM)的性能。評估和基準測試是 LLM 開發中的關鍵概念。要提高 LLM 應用程序(...

鐵人賽 生成式 AI DAY 25

技術 day25 結合AWS Kendra與RAG的詳細操作:解鎖雲端資料的智慧搜索能力

前言 昨天我們進行AgentBuilder的文件上傳與搜尋測試,那麼今天我們進行AWS Kendra的詳細操作和上傳文件過程解析 正文 S3啟用 參考資料:h...

鐵人賽 生成式 AI DAY 24
懶人救星:生成式AI 系列 第 24

技術 Day24-Text to SQL 的改進方法: DAIL-SQL 心得

前言✨ 在當前數位時代中,資料庫查詢已成為許多行業的核心任務,然而對於不具備 SQL 語法知識的人來說,查詢資料庫仍是一大挑戰。隨著生成式 AI 模型的進步,語...

鐵人賽 生成式 AI DAY 24

技術 day24 探索 GCP Agent Builder Search:實現文件上傳與搜尋測試的智能搜尋體驗

前言 day22、23介紹各種雲端搜尋服務,今天我們正式的會去操作 AgentBuilder做為示範,用於之後串接我們的生成架構圖系統,會選擇AgentBuil...

鐵人賽 生成式 AI DAY 8

技術 Day8 進階Prompt工程策略

大語言模型是由大量的資料訓練而成,但並非所有事情語言模型都能夠精確回答,當語言模型遇到不理解或不清楚的問題時,模型沒有資料可以進行回覆便有可能會「一本正經胡說八...

鐵人賽 生成式 AI DAY 23

技術 day23 RAG與雲端非向量搜尋服務:AWS Kendra與GCP AgentBuilder初探

前言 昨天我們介紹了AWS Bedrock Knowledge Bases和Azrue AI Search,這些都有提供將文件轉乘向量的功能,但是其實也有不轉成...

鐵人賽 生成式 AI DAY 10

技術 Day 10 - RAG 程式碼實作

每天的專案會同步到 GitLab 上,可以前往 GitLab 查看。有興趣的朋友歡迎留言 or 來信討論,我的信箱是 nickchen1998@gmail.co...

鐵人賽 生成式 AI DAY 9

技術 Day 09 - RAG 介紹

每天的專案會同步到 GitLab 上,可以前往 GitLab 查看。有興趣的朋友歡迎留言 or 來信討論,我的信箱是 nickchen1998@gmail.co...

鐵人賽 生成式 AI DAY 22

技術 day22 RAG加速資料檢索:雲端資料庫與雲端向量搜尋服務初探

前言 昨天我們進行LangChain結合Diagram as Code RAG生成雲端架構圖的初步展示,但對於文件管理來說,要在本地端管理越來越多的文件,實在難...

鐵人賽 生成式 AI DAY 23
懶人救星:生成式AI 系列 第 23

技術 Day23-Text to SQL 的改進方法: DIN-SQL 心得

前言✨ 隨著大數據時代的來臨,SQL Query 成為了各行各業不可或缺的必備技能。然而對於不熟悉 SQL 語法的使用者而言,將自然語言問題轉換為複雜的 SQL...

鐵人賽 生成式 AI DAY 22
懶人救星:生成式AI 系列 第 22

技術 Day22-LlamaIndex 黑科技圖解:讓你在無 SQL 技能下秒變查詢達人!

前言✨ 先前我們介紹了文檔檢索、查詢和聊天等功能。現今隨著企業數據量的激增,企業和組織越來越依賴數據來做出決策。然而許多用戶並不具備 SQL 編寫能力,因此 T...