2024 iThome 鐵人賽

0

生成式 AI

運用生成式 AI 服務所提供的API 實做應用開發（以Gemini及ChatGPT為例）系列第 38 篇

9-3 Assistant API RAG 向量資料庫訓練

16th鐵人賽

2024-09-07 07:19:53

3503 瀏覽

分享至

RAG 技術的現狀與挑戰

隨著大語言模型在 2027 年 8 月的進一步發展，檢索增強生成（RAG, Retrieval-Augmented Generation）已經成為一門顯學，許多技術社群和教育平台紛紛推出相關課程。然而，實踐中真正掌握這項技術，並且能讓語言模型根據使用者提供的檔案內容精確地回答問題，實際上比許多人預期的要困難得多。

現實挑戰：理論與實踐的差距

在我的經驗中，即使你完整學習了網路上的所有 RAG 教學，也不一定能夠順利實現目標。RAG 涉及多個複雜的步驟，包括資料的準備、檢索系統的搭建、模型的整合和優化等等。這些步驟中的每一個都可能成為阻礙進展的潛在瓶頸。

甚至像 OpenAI 這樣的領先企業，也在持續改進他們的 RAG 系統，這說明即便是頂尖的團隊也面臨挑戰。要超越這些企業，建立更為完善的 RAG 系統，對於個人或小型團隊來說，無疑是困難重重。

當自建 RAG 成為必要

然而，在某些情況下，自行實施 RAG 可能是唯一的選擇。例如，當你的數據或文件包含敏感資訊或是具有高保密要求，無法上傳到第三方服務時，自建 RAG 就變得不可避免。這種情況下，深入掌握 RAG 的技術細節，並結合自己的系統需求進行調整和優化，將是你成功的關鍵。

替代方案：善用第三方服務

如果你的資料並不涉及敏感內容，則可以考慮將 RAG 的工作交給像 OpenAI 這樣的專業服務提供商。他們的系統已經過多次迭代和優化，能夠提供穩定且高效的 RAG 解決方案。使用這些服務不僅簡化了實施過程，還能節省大量時間和精力，讓你專注於業務本身。

實作步驟

在 playground 建置 assistant
直接拉到 File Search
點 +Files
選選擇你所需要的檔案
等待訓練然後就可以開始提問

試作

這裡新北市光復國小的課後社團的簡章來作為範例

https://www.kfes.ntpc.edu.tw/p/406-1000-11072,r53.php?Lang=zh-tw

將課後社團資料拉進來
等待訓練
完成後試著詢問看看

假設 OpenAI 實作 RAG 的方式都是相同的，那麼這裡可以看到，我選用不同的模型會產生不同的結果。所以，其實比較重要的還是模型嗎？

好書推薦

本系列相關內容已轉載及加強到筆者 2025 年所出版之

全面掌握 Gemini 開發實務：輕鬆駕馭 Google AI 引擎

編寫有效的提示：了解如何撰寫清晰、準確的指令，引導 Gemini 模型生成高質量的回應，從日常應用到複雜專案都能得心應手。
微調 Gemini 模型：深入探索模型微調技巧，根據您的專案需求調整參數，實現個性化應用，讓AI成為您專屬的智慧助理。
整合 Gemini API：完整解讀 API 功能，學習如何將其融入現有系統或打造全新的應用，充分利用 Google AI 生態系統的強大資源。

購買連結🔗 Momo🛍️ 博客來📚 誠品📘 金石堂📖天瓏

若這篇文章對您有實質幫助🙏，還望購買書籍📚，是對筆者最實質的鼓勵🥰。

9-2 運用 chatGPT playground 實作基本 Assistant API 串接

9-4 Assistant API Functions 撰寫

系列文

運用生成式 AI 服務所提供的API 實做應用開發（以Gemini及ChatGPT為例）共 44 篇

目錄

RSS系列文訂閱系列文

74 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

參賽組數

902 組

團體組數

37 組

累計文章數

19838 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙