前言 語言模型在 NLP 領域裡面,長期以來一直是個倍受重視的主題。拜 ChatGPT 所賜,這半年多以來大型語言模型的相關議題迅速爆紅,其影響力相信大家都感同...
簡介 透過文本捕捉語言結構,進而建立一個統計機率模型,廣義而言就可以被稱作一種語言模型。本文主要介紹透過神經網路訓練出來的語言模型,以及常見 Transform...
前言 相信大家對 ChatGPT 已經非常熟悉,而且 ChatGPT 的介紹文章也如雨後春筍般的出現,每一篇的講解都相當清楚詳細。尤其筆者屬於晚開賽的選手,已經...
簡介 除了 ChatGPT 網頁介面以外,還能透過 OpenAI API 調用 ChatGPT 的功能,讓我們能夠在自己的開發應用裡面借助 ChatGPT 的力...
簡介 經常有人說 ChatGPT 是個喜歡「一本正經胡言亂語」的東西,也許吧!在 GPT-4 推出之後,與 GPT-3.5 相比起來,確實相對容易產生錯誤。但是...
簡介 作為公開 LLM Chatbot 第一人的 ChatGPT,雖然有踩穩市場第一步的優勢,但各大研究單位推出的模型同樣來勢洶洶。在這激烈競爭的 AI 大戰中...
簡介 有了 ChatGPT API 這種功能強大、操作方便、成本低廉的文字生成服務後,相關應用如雨後春筍般湧現,突破了過往各種 NLP 系統的一些侷限之處,大幅...
簡介 雖然 ChatGPT 已經有相當豐富的知識含量,但還是難免會產生一些事實錯誤或偏差。為了解決這個問題,結合檢索模型 (Retrieval Model) 的...
簡介 在開始實際操作 LLM 之前,我們先來瞭解 LLM 的訓練流程。訓練一個 LLM 通常包含兩個步驟:監督式微調與增強式學習,不過也有許多模型只做監督式微調...
簡介 建立深度學習的開發環境說是一場惡夢也不為過,無論是開發應用還是訓練模型,都有各自的大坑要踩。就算一開始環境都弄的好好的,也有可能用一陣子之後自己突然爆炸。...