iT邦幫忙

2024 iThome 鐵人賽

DAY 2
0
自我挑戰組

從零打造客製化 AI 聊天機器人系列 第 2

[從零打造客製化 AI 聊天機器人] 什麼是大型語言模型 (LLM)?

  • 分享至 

  • xImage
  •  

大語言模型 LLM(Large Language Model)是一種經過深度學習的人工智能模型,經過大量的訓練,能理解人類語言並產生回覆,以往若要判斷使用者輸入的內容需要特別使用到斷字、斷詞資料庫才可以處理,且很難精準判斷語和意圖,而 LLM 可以在更高層次上理解語言和語意。

LLM 是透過自然語言處理(NLP)技術,經過大量文本訓練,從中學習單詞和句子間的關係,可以了解人類語言的意思、語法和上下文,並根據輸入的意圖,來生成流暢、有邏輯的回答。

LLM 是如何訓練出來的呢?它的核心是一種深度學習模型,基於轉換器(Transformer)架構,這是一種特殊的人工神經網絡(ANN)模型,這種模型能夠有效捕捉單詞、片語和句子之間的依賴關係,從而更好理解語言。目前,能夠訓練出 LLM 模型的機構通常是大型科技公司,例如:OpenAI 開發的 GPT( GPT-3 和 GPT-4)、Google 開發的 Bard,以及 Microsoft 使用 OpenAI 技術整合進行的 Bing Chat 等。

通常我們不會對已訓練好的模型再加以訓練,因為非常昂貴且要花費大量數據,但可以透過設計精確的提示(Prompts)來引導 LLM 生成更精確的回覆,然而 LLM 的可靠性取決於其訓練的資料,所以較新的資訊,可能無法提供正確答案,有時還會產生錯誤或虛假的內容,這種情況被稱為「幻覺」。

因為 LLM 可以學習各種語言模式和語意關係,應用範圍也很廣泛,例如:聊天機器人、智能客服、自動寫作、搜索引擎優化、語言翻譯等,為大家提供創新的解決方案。


上一篇
[從零打造客製化 AI 聊天機器人] 序言
下一篇
[從零打造客製化 AI 聊天機器人] 什麼是 RAG ?
系列文
從零打造客製化 AI 聊天機器人14
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言