iT邦幫忙

鐵人檔案

2023 iThome 鐵人賽
回列表
AI & Data

LLM 學習筆記 系列

筆者學習 Large-Scale Language Model (LLM) 的筆記。

鐵人鍊成 | 共 33 篇文章 | 81 人訂閱 訂閱系列文 RSS系列文 團隊消波塊上的海洋貓貓
DAY 1

達標好文 LLM Note Day 1 - 語言模型簡介

前言 語言模型在 NLP 領域裡面,長期以來一直是個倍受重視的主題。拜 ChatGPT 所賜,這半年多以來大型語言模型的相關議題迅速爆紅,其影響力相信大家都感同...

2023-09-16 ‧ 由 Penut Chen 分享
DAY 2

LLM Note Day 2 - 神經網路語言模型

簡介 透過文本捕捉語言結構,進而建立一個統計機率模型,廣義而言就可以被稱作一種語言模型。本文主要介紹透過神經網路訓練出來的語言模型,以及常見 Transform...

2023-09-17 ‧ 由 Penut Chen 分享
DAY 3

LLM Note Day 3 - ChatGPT

前言 相信大家對 ChatGPT 已經非常熟悉,只要稍微去官網使用看看,就能親身感受到他的威力。雖然 ChatGPT 已經相當易用,但依然有許多使用上的細節值得...

2023-09-18 ‧ 由 Penut Chen 分享
DAY 4

LLM Note Day 4 - OpenAI API

簡介 除了 ChatGPT 網頁介面以外,還能透過 OpenAI API 調用 ChatGPT 的功能,讓我們能夠在自己的開發應用裡面借助 ChatGPT 的力...

2023-09-19 ‧ 由 Penut Chen 分享
DAY 5

LLM Note Day 5 - 貓貓塔羅

簡介 經常有人說 ChatGPT 是在「一本正經的胡言亂語」,在 GPT-4 推出之後,尤其能感受到 GPT-3.5 相對容易產生錯誤。但是喜歡胡言亂語未必是個...

2023-09-20 ‧ 由 Penut Chen 分享
DAY 6

LLM Note Day 6 - ChatGPT 的挑戰者們

簡介 作為公開 LLM Chatbot 第一人的 ChatGPT,雖然有踩穩市場第一步的優勢,但各大研究單位推出的模型同樣來勢洶洶。在這激烈競爭的 AI 大戰中...

2023-09-21 ‧ 由 Penut Chen 分享
DAY 7

LLM Note Day 7 - ChatGPT 的相關應用

簡介 有了 ChatGPT API 這種功能強大、操作方便、成本低廉的文字生成服務後,相關應用如雨後春筍般湧現,突破了過往各種 NLP 系統的一些侷限之處,大幅...

2023-09-22 ‧ 由 Penut Chen 分享
DAY 8

LLM Note Day 8 - Retrieval & Generation

簡介 雖然 ChatGPT 已經有相當豐富的知識含量,但還是難免會產生一些事實錯誤或偏差。為了解決這個問題,結合檢索模型 (Retrieval Model) 的...

2023-09-23 ‧ 由 Penut Chen 分享
DAY 9

LLM Note Day 9 - LLM 訓練流程

簡介 在開始實際操作 LLM 之前,我們先來瞭解 LLM 的訓練流程。訓練一個 LLM 通常包含兩個步驟:監督式微調與增強式學習,不過也有許多模型只做監督式微調...

2023-09-24 ‧ 由 Penut Chen 分享
DAY 10

LLM Note Day 10 - 建立開發環境

簡介 建立深度學習的開發環境說是一場惡夢也不為過,無論是開發應用還是訓練模型,都有各自的大坑要踩。就算一開始環境都弄的好好的,也有可能用一陣子之後自己突然爆炸。...

2023-09-25 ‧ 由 Penut Chen 分享