2025 iThome 鐵人賽
沒在獨自升級的 一起來
AI & Data
選手 74 文章 1472
Day 18
2025-08-20
222
0
昨天介紹了anythingllm,今天來介紹最簡單的操作方法: 我選擇用anythingllm的Gemma3 1B的模型使用,再自訂工作區的名子設定完後來到這畫...
Day 8
2025-09-02
221
0
前情提要 昨天一樣分步驟將 Multi-head attention 程式講解完了,比較麻煩是維度處理,但如果看懂就沒有太大問題了。 參考文章: https:/...
Day 4
2025-09-17
221
0
昨天我們完成了探索性資料分析(EDA),對資料的特徵與分佈有了初步理解。今天,我們要先建立第一個簡單的模型,也就是 Baseline Model。這個模型不會針...
Day 19
2025-10-03
221
1
前言 這幾天從 Day 16 到 Day 18,我們把 Transformer 的數學公式拆得超細,連帶著整個 BERT 的架構也講得蠻透徹了。現在,是時候來點...
Day 19
2025-10-03
221
0
嗨呦!今天我們要繼續昨天有講到的N-gram 昨天我們提到 N-gram很常被用來計算句子的機率甚至預測下一個詞。但昨天也有根大家提到他有一些限制,那就是如果某...
Day 3
2025-09-17
221
0
我的模型可以喂進整本哈利波特!! 每次有新的 AI 模型推出,我們總是會看到這樣的宣傳:「上下文窗口達到 XXX 萬個 tokens!可以容納 X 本哈利波特全...