既然可以計算 Loss 了,接著終於要進到最關鍵的訓練環節,將 dataset 提供給模型,透過迴圈跌代每一個 batch,在每一個 batch 中計算 Los...
前言
盤點好痛點、期望、角色後,就能接著將工作情境梳理成流程,讓相關角色所影響的流程都能考量到,避免關鍵資訊遺漏,例如每個角色在各個環節所扮演的角色為何?資訊...
今日主題
進度回顧Day 16 從錢包到腦袋:待讀清單的消化速度與週末清倉
昨天的進度是幫自己做一個可以整合待讀清單的頁面,並且統計消滅速度和週末清倉玩法。但仔...
在昨天,我們談過大型語言模型(LLM)的原理與應用。今天我們要進一步理解支撐它們的核心技術 —— Transformer 架構。這個架構由Google團隊提出,...