2025 iThome 鐵人賽
沒在獨自升級的 一起來
AI & Data
選手 74 文章 1472
Day 18
2025-10-02
223
0
當模型在生成文字時,每一步都會面臨很多可能的選項,而最終輸出的過程,就叫做解碼(decoding)。 Decoding 的核心問題就是從眾多可能的輸出當中選擇最...
Day 19
2025-10-03
222
0
嗨呦!今天我們要繼續昨天有講到的N-gram 昨天我們提到 N-gram很常被用來計算句子的機率甚至預測下一個詞。但昨天也有根大家提到他有一些限制,那就是如果某...
Day 3
2025-09-17
222
0
我的模型可以喂進整本哈利波特!! 每次有新的 AI 模型推出,我們總是會看到這樣的宣傳:「上下文窗口達到 XXX 萬個 tokens!可以容納 X 本哈利波特全...
Day 13
2025-09-27
222
0
前言 模型大致上可以分成兩大類分類型的跟生成型的。通常分類的模型會用到 Encoder 架構,也就是我們前面幾個章節提到的那些內容,其實都是在講 Encoder...
Day 8
2025-09-02
222
0
前情提要 昨天一樣分步驟將 Multi-head attention 程式講解完了,比較麻煩是維度處理,但如果看懂就沒有太大問題了。 參考文章: https:/...
Day 9
2025-09-23
221
0
前言昨天我們完成了資料的下載、讀取、初步檢視以及簡單視覺化,對資料集的結構、特徵分布和目標類別已有基本認識。今天,我們要在此基礎上,進行資料前處理(Data P...