iT邦幫忙

2024 iThome 鐵人賽

0

https://ithelp.ithome.com.tw/upload/images/20240903/20046160n8p5iBgA0l.png

RAG 技術的現狀與挑戰

隨著大語言模型在 2027 年 8 月的進一步發展,檢索增強生成(RAG, Retrieval-Augmented Generation)已經成為一門顯學,許多技術社群和教育平台紛紛推出相關課程。然而,實踐中真正掌握這項技術,並且能讓語言模型根據使用者提供的檔案內容精確地回答問題,實際上比許多人預期的要困難得多。

現實挑戰:理論與實踐的差距

在我的經驗中,即使你完整學習了網路上的所有 RAG 教學,也不一定能夠順利實現目標。RAG 涉及多個複雜的步驟,包括資料的準備、檢索系統的搭建、模型的整合和優化等等。這些步驟中的每一個都可能成為阻礙進展的潛在瓶頸。

甚至像 OpenAI 這樣的領先企業,也在持續改進他們的 RAG 系統,這說明即便是頂尖的團隊也面臨挑戰。要超越這些企業,建立更為完善的 RAG 系統,對於個人或小型團隊來說,無疑是困難重重。

當自建 RAG 成為必要

然而,在某些情況下,自行實施 RAG 可能是唯一的選擇。例如,當你的數據或文件包含敏感資訊或是具有高保密要求,無法上傳到第三方服務時,自建 RAG 就變得不可避免。這種情況下,深入掌握 RAG 的技術細節,並結合自己的系統需求進行調整和優化,將是你成功的關鍵。

替代方案:善用第三方服務

如果你的資料並不涉及敏感內容,則可以考慮將 RAG 的工作交給像 OpenAI 這樣的專業服務提供商。他們的系統已經過多次迭代和優化,能夠提供穩定且高效的 RAG 解決方案。使用這些服務不僅簡化了實施過程,還能節省大量時間和精力,讓你專注於業務本身。

實作步驟

https://ithelp.ithome.com.tw/upload/images/20240903/20046160yWHbErqfvw.png

  1. 在 playground 建置 assistant
  2. 直接拉到 File Search
  3. 點 +Files
  4. 選選擇你所 需要的檔案
  5. 等待訓練 然後就可以開始提問

試作

這裡新北市光復國小的課後社團的簡章來作為範例

https://www.kfes.ntpc.edu.tw/p/406-1000-11072,r53.php?Lang=zh-tw

https://ithelp.ithome.com.tw/upload/images/20240903/20046160p58XeLSMn0.png

  1. 將課後社團資料拉進來
  2. 等待訓練
  3. 完成後試著詢問看看

https://ithelp.ithome.com.tw/upload/images/20240903/20046160pPKicFmfdP.pnghttps://ithelp.ithome.com.tw/upload/images/20240903/20046160w4w2bkYMbF.png

假設 OpenAI 實作 RAG 的方式都是相同的,那麼這裡可以看到,我選用不同的模型會產生不同的結果。所以,其實比較重要的還是模型嗎?


上一篇
9-2 運用 chatGPT playground 實作基本 Assistant API 串接
下一篇
9-4 Assistant API Functions 撰寫
系列文
運用生成式 AI 服務 所提供的API 實做應用開發(以Gemini及ChatGPT為例)44
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言