前言 語言模型在 NLP 領域裡面,長期以來一直是個倍受重視的主題。拜 ChatGPT 所賜,這半年多以來大型語言模型的相關議題迅速爆紅,其影響力相信大家都感同...
簡介 透過文本捕捉語言結構,進而建立一個統計機率模型,廣義而言就可以被稱作一種語言模型。本文主要介紹透過神經網路訓練出來的語言模型,以及常見 Transform...
前言 相信大家對 ChatGPT 已經非常熟悉,只要稍微去官網使用看看,就能親身感受到他的威力。雖然 ChatGPT 已經相當易用,但依然有許多使用上的細節值得...
簡介 除了 ChatGPT 網頁介面以外,還能透過 OpenAI API 調用 ChatGPT 的功能,讓我們能夠在自己的開發應用裡面借助 ChatGPT 的力...
簡介 經常有人說 ChatGPT 是在「一本正經的胡言亂語」,在 GPT-4 推出之後,尤其能感受到 GPT-3.5 相對容易產生錯誤。但是喜歡胡言亂語未必是個...
簡介 作為公開 LLM Chatbot 第一人的 ChatGPT,雖然有踩穩市場第一步的優勢,但各大研究單位推出的模型同樣來勢洶洶。在這激烈競爭的 AI 大戰中...
簡介 有了 ChatGPT API 這種功能強大、操作方便、成本低廉的文字生成服務後,相關應用如雨後春筍般湧現,突破了過往各種 NLP 系統的一些侷限之處,大幅...
簡介 雖然 ChatGPT 已經有相當豐富的知識含量,但還是難免會產生一些事實錯誤或偏差。為了解決這個問題,結合檢索模型 (Retrieval Model) 的...
簡介 在開始實際操作 LLM 之前,我們先來瞭解 LLM 的訓練流程。訓練一個 LLM 通常包含兩個步驟:監督式微調與增強式學習,不過也有許多模型只做監督式微調...
簡介 建立深度學習的開發環境說是一場惡夢也不為過,無論是開發應用還是訓練模型,都有各自的大坑要踩。就算一開始環境都弄的好好的,也有可能用一陣子之後自己突然爆炸。...