昨天我提到多輪對話這個概念,它能讓AI記得使用者之前說過的話,讓整體對話變得更自然、更像真的聊天。
那麼如果希望問答機器人不只是一個工具,而能變成智慧助理,它還需要具備哪些能力?
- 瞭解更多背景資訊
目前我的版本只能根據使用者當下輸入的文章回答問題,也就是說,它只會看見我給它的這一段文字。
如果未來想讓AI回答更廣泛的問題,就需要讓它能查資料或引用外部知識。
這時候,一個叫RAG(Retrieval-Augmented Generation)的技術就派上用場了。
它的想法是:讓模型在回答前,先去資料庫或文件中找出相關內容,再根據這些內容生成答案。
這樣一來,就能減少模型亂回答的情況(就是先前文章提過的幻覺)。
- 有邏輯的回答方式
另一個我想改進的方向是答案的可讀性。
雖然目前的結果都蠻準確,但有時候回答還是太簡短、甚至有點生硬。
未來可以加入一些簡單的邏輯模板,讓AI回答時更有結構,比如:
- Step 1:先解釋概念
- Step 2:舉一個例子
- Step 3:再總結一句重點
這樣輸出的內容就會更像是人講話,而不是機器回答。
- 對不同語言的支援
在這個小專案中,我發現AI不但能看懂英文,也能理解中文問題。
這讓我開始想:如果它能同時理解更多語言,是不是更方便?
像是醫療領域、客服、教育,其實都有跨語言溝通的需求。
未來我也想試試看讓AI能自動偵測語言並自動翻譯回應。
- 使用者體驗的設計
目前這個程式在Colab上執行時,雖然能互動,但還是以命令列為主。
如果未來能加上簡單的介面,例如用Gradio或Streamlit做成可點選輸入的版本,那整個問答體驗會更接近真實應用。
到這裡,我的小專案已經從能跑變成能用,接下來想挑戰的是能被別人輕鬆使用。
多輪對話、知識檢索、結構化回答、語言支援,這些都是未來可以慢慢擴充的方向。
從這幾天的實作,我越來越覺得AI應用的難點,不只是讓它生成答案,而是讓它生成對的答案,並以對的方式呈現。