[從零打造客製化 AI 聊天機器人] 什麼是大型語言模型 (LLM)？

2024 iThome 鐵人賽

DAY 2

自我挑戰組

從零打造客製化 AI 聊天機器人系列第 2 篇

16th鐵人賽

cheyne

2024-09-15 22:46:56

1049 瀏覽

分享至

大語言模型 LLM（Large Language Model）是一種經過深度學習的人工智能模型，經過大量的訓練，能理解人類語言並產生回覆，以往若要判斷使用者輸入的內容需要特別使用到斷字、斷詞資料庫才可以處理，且很難精準判斷語和意圖，而 LLM 可以在更高層次上理解語言和語意。

LLM 是透過自然語言處理（NLP）技術，經過大量文本訓練，從中學習單詞和句子間的關係，可以了解人類語言的意思、語法和上下文，並根據輸入的意圖，來生成流暢、有邏輯的回答。

LLM 是如何訓練出來的呢？它的核心是一種深度學習模型，基於轉換器（Transformer）架構，這是一種特殊的人工神經網絡（ANN）模型，這種模型能夠有效捕捉單詞、片語和句子之間的依賴關係，從而更好理解語言。目前，能夠訓練出 LLM 模型的機構通常是大型科技公司，例如：OpenAI 開發的 GPT（ GPT-3 和 GPT-4）、Google 開發的 Bard，以及 Microsoft 使用 OpenAI 技術整合進行的 Bing Chat 等。

通常我們不會對已訓練好的模型再加以訓練，因為非常昂貴且要花費大量數據，但可以透過設計精確的提示（Prompts）來引導 LLM 生成更精確的回覆，然而 LLM 的可靠性取決於其訓練的資料，所以較新的資訊，可能無法提供正確答案，有時還會產生錯誤或虛假的內容，這種情況被稱為「幻覺」。

因為 LLM 可以學習各種語言模式和語意關係，應用範圍也很廣泛，例如：聊天機器人、智能客服、自動寫作、搜索引擎優化、語言翻譯等，為大家提供創新的解決方案。