iT邦幫忙

2024 iThome 鐵人賽

DAY 1
0
自我挑戰組

用自己的資料客製化聊天機器人:使用開源LLM模型以及RAG系列 第 1

《計畫初衷》如何讓大語言模型(LLM)能夠回答私人資料裡面的問題?

  • 分享至 

  • xImage
  •  

想像你有一家公司,公司內部有成千上萬的資料,在多個不同的資料儲存處,例如Google Drive, One Drive, Drop Box, Confluence. 這些文檔都是大家覺得有必要就寫下來的,沒有遵循一個架構,你要找資料時,常常要花費大量時間搜尋,還有比對跟整理,最後才能找到你要的答案。

感謝大語言模型(以下簡稱LLM)的誕生,我們可以利用他,讓他學習我們的資料,然後回答我們的問題,省下我們大量時間。

直覺上,這聽起來是要用微調(fine-tunning)的方法,但是,在這裡我要介紹的是另一個比較好的解法,叫做RAG(Retrieval-augmented generation)。微調在面對小量資料時難以看見成效,因為你是在對參數達到7億~200億的大語言模型微調,資料量極度懸殊。

RAG

Retrieval (取回)-augmented(增強的) generation(產生),顧名思義,藉由“取回”相關文本這個額外動作,來“增強”LLM的回答能力跟正確性。

RAG架構

https://ithelp.ithome.com.tw/upload/images/20240804/20168425gwuE9y1Im4.png

計畫目標

這個計畫目標在使用LLM以及RAG,以及你自己的資料,可以是公司內部的文檔,可以是超出現成LLM回答能力範圍的資料,或是特定的語言資料,例如我們都知道LLM在繁體中文的回答能力是較英文弱的。

  • 建造一個能夠用(台灣style)中文回答特定領域問題的專家聊天機器人
  • 這個機器人在你的電腦就可以訓練了
  • 這個機器人使用開源的大語言模型,所以你的資料跟聊天紀錄都不會外流。
  • 這個聊天機器人,只在你給定的資料範圍內回答問題,如果在你給的資料他找不到答案,那他應該回答“我不知道”,而不是亂編答案。這一點尤其重要,也是RAG的最大賣點之一。

系列文
用自己的資料客製化聊天機器人:使用開源LLM模型以及RAG1
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言