iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
佛心分享-IT 人自學之術

學習 LLM 系列

從最基礎了解 LLM ,到一個小實作,讓自己可以學會 LLM,更了解現在 AI 時代所需要的技能。

參賽天數 26 天 | 共 30 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文
DAY 21

Day21 把不同資料測試一次

把其他類型文件拿來做 chunk → embeddings → 加入 index → 做檢索chunk:把長文章切成多個片段(chunk),通常會設定最大長度...

2025-10-05 ‧ 由 yu_ting 分享
DAY 22

Day22 加入 UI(Gradio)

i> 安裝 Gradio !pip install -q gradio chromadb sentence-transformers ii> 建立...

2025-10-06 ‧ 由 yu_ting 分享
DAY 23

Day23 改善檢索

概念 : Top-k:檢索回傳前 k 筆候選(k 越大 recall 越高但可能 precision 降低);常試 k=1、3、5 相似度分數(score):...

2025-10-07 ‧ 由 yu_ting 分享
DAY 24

Day24 測試不同生成模型

在相同的檢索結果 + prompt 下分別使用: 一個 flan-t5-small 一個 flan-t5-base 比較: 回答語氣(口語 / 正式 /...

2025-10-08 ‧ 由 yu_ting 分享
DAY 25

Day25 處理長文件

實作 : import math import json import os from typing import List, Dict, Optional i...

2025-10-09 ‧ 由 yu_ting 分享
DAY 26

Day26 記錄使用者對話歷史

類型 : 短期記憶(session state):記住本次會話的最近 N 個 turns(用於對話連貫性) 長期記憶(persistent memory):跨...

2025-10-10 ‧ 由 yu_ting 分享
DAY 26

Day27 專案測試

流程 : 準備 20 筆中文測試 query(每題對應到正確的 FAQ id) 使用sentence-transformers/paraphrase-mult...

2025-10-12 ‧ 由 yu_ting 分享
DAY 26

Day28 寫 README

概述 FAQ 資料管理(faqs.csv) 對話歷史記錄(SQLite / JSONL 可選) 向量檢索(Sentence-Transformers embe...

2025-10-13 ‧ 由 yu_ting 分享
DAY 26

Day29 DEMO

完整程式碼 : # ====================================== # 🧱 STEP 0:安裝必要套件 # ===========...

2025-10-13 ‧ 由 yu_ting 分享

Day30 心得

學習歷程與收穫 Day 1–10:從理解到實作最開始的挑戰,是搞懂「文字如何變成數字」。我用上了 sentence-transformers/paraphr...

2025-10-19 ‧ 由 yu_ting 分享