Retrieval-Augmented Generation (RAG) 是一種結合了檢索技術和生成技術的強大方法,旨在提高大型語言模型(LLM)的回答準確性,減少幻覺,尤其是在需要查詢大量資料庫中的具體資訊時。RAG 的基本工作原理是:事先把把文本做 embedding,使用者問問題時,先進行檢索(Retrieval),接著進行生成(Generation)。
文本嵌入(Embedding):
檢索階段(Retrieval):
生成階段(Generation):
減少幻覺(Hallucination):
更好的語義理解與回答精確性:
動態更新:
除了 Native 的 RAG,其實也發展出很多進階的 RAG 技巧。這些進階技巧在雜亂無章的資料裡的表現會更好,但是我還是強烈建議如果要做客服型或是企業級應用的話,還是要把文本資料給整理好!
明天我們就來先做 embedding 吧!