Day 23【SDGs 強化】讓你的機器人更懂 SDGs

2025 iThome 鐵人賽

DAY 23

Software Development

建構跨平台AI對話機器人：從LINE到Telegram實踐SDGs推廣的30天專案紀實系列第 23 篇

17th鐵人賽

shammi

2025-09-23 10:02:56

223 瀏覽

分享至

HI！大家好，我是 Shammi 😊

經過 22天的應用，包含對 LINE 和 Telegram 開發經驗的總結與反思，我發現雖然我的機器人現在能夠順利接收訊息、穩定回應，而且也搞定了那些讓我頭大的技術問題，但如果要讓它真正成為一個「懂」SDGs 的專業級 AI 夥伴，光是能回覆我覺得還不夠！我希望它的回答能更精準、更有深度，真的能幫助大家理解並參與永續發展。

今天，我想深入探討如何針對性地優化 Embedding（向量化）和提示詞（Prompt）策略，讓機器人不僅能說，更能「說得好」、「說得精」。

🌐 一、為什麼要讓機器人更「懂」SDGs？

在 AI 時代，我們手上握有了強大的工具，但我相信，身為「個人」，我們可以運用 AI 科技為這個世界創造正面影響。我的專案目標，正是要透過 AI 機器人推廣 SDGs，讓更多夥伴參與永續活動。而要達成這個目標，機器人就必須成為 SDGs 領域的專家！

👉 避免泛泛而談： 通用型的 AI 模型雖然厲害，但它們畢竟是「什麼都懂一點」，對於 SDGs 這樣充滿專業術語、複雜概念和特定情境的領域，它們可能無法提供足夠精準和深入的資訊。

👉 提升回應質量： 我不希望我的機器人只是簡單地複製貼上資料，而是能夠真正理解使用者的問題，結合 SDGs 知識庫，給出有洞察力、有價值的回覆。這就像給它一套專門閱讀 SDGs 文件的「專業眼鏡」和一個專門思考 SDGs 的「智慧大腦」。

👉 強化推廣效果： 機器人回覆的品質越高，使用者對 SDGs 的理解就越深，也越能激發他們參與永續活動的熱情。這直接關係到我專案的最終目標。

🌐 二、機器人『SDGs 智慧升級』的策略規劃

要讓機器人更懂 SDGs，我將從兩個核心環節下手：Embedding 模型（理解之眼）和大型語言模型 (LLM) 的提示詞（思考與表達），這些優化我會在程式碼 system_prompt= 區塊上進行。

🤖 策略一：優化 Embedding，讓機器人『看』得更清楚！

Embedding 模型負責將文字轉化為向量，這些向量就是機器人在知識庫中搜索的依據。如果 Embedding 不夠精準，就像戴著模糊的眼鏡讀書，即使書的內容再好也看不清楚。

👉 為什麼需要優化？

通用模型的局限性： 雖然我們目前使用的 text-embedding-004 模型非常強大，但它是基於海量通用文本訓練的。SDGs 領域有其獨特的專業詞彙和概念關聯，通用模型可能無法完全捕捉這些細微的語義差異。
檢索精準度： 不精準的 Embedding 可能導致機器人搜索到表面相似但語義不相關的文本塊，進而影響最終回覆的品質。

👉 我的優化思考方向（並已體現在程式碼中）：

1️⃣ 精煉輸入文本： 確保輸入給 Embedding 模型的 SDGs 文本是乾淨的，沒有多餘的符號、空格，專業術語也盡量標準化，這能讓模型學習到更純粹的語義。

2️⃣ 明確設定 task_type：我會嚴格區分兩種 task_type：RETRIEVAL_DOCUMENT 適用於知識庫文本，而 RETRIEVAL_QUERY 則用於使用者問題。這就像是明確告訴模型：「這個向量是用來檢索的」，能幫助模型更好地理解這些向量的用途，大幅提高檢索相關性。

🤖 策略二：精煉提示詞（Prompt），讓機器人『說』得更到位！

提示詞就像是給 LLM（大型語言模型）的詳細指令書，指導它如何思考和組織語言。即使檢索到的資料再精準，如果提示詞指令不夠明確，LLM 也可能無法發揮它的最大潛力。

👉 為什麼需要優化？

控制回覆風格與內容： 我希望阿米（我的機器人）的回覆是溫暖、親切、簡潔而深刻的。提示詞就是用來設定這些「個性」和「風格」的。
有效整合知識： 提示詞必須引導 LLM 如何有效利用檢索到的上下文資料，而不是隨意拼湊或產生不相關的內容。
避免「胡說八道」(Hallucination)： 透過精準的指令，我們可以減少 LLM 憑空捏造資訊的機率。

👉 我的優化思考方向（並已體現在程式碼中）：

1️⃣ 更具體的「系統提示」 (System Prompt)： 我會繼續精進阿米的角色設定，加入更多關於「如何針對 SDGs 進行專業、有深度回覆」的具體指示。例如，強調「引用或歸納 SDGs 目標」、「解釋 SDGs 如何實際應用於個人生活或社區」、「引導使用者思考 SDGs 的重要性」等。

2️⃣ 明確的「回答步驟」： 在提示詞中，我會把「回答步驟」寫得更精確，指導 LLM 依循嚴謹的邏輯來組織答案。例如：「分析使用者問題與 SDGs 目標的相關性」、「如果問題涉及多個 SDGs 目標，請嘗試整合說明其關聯性」、「當資料不足時，如何禮貌告知並引導提問相關問題」。

3️⃣ 持續迭代與測試： 提示詞優化不是一次性的任務，它需要不斷地測試、評估 LLM 的回覆，然後根據回饋再進行調整和改進。這就像調校一個精密的儀器，需要耐心和細心。