iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
佛心分享-IT 人自學之術

學習 LLM 系列

從最基礎了解 LLM ,到一個小實作,讓自己可以學會 LLM,更了解現在 AI 時代所需要的技能。

參賽天數 24 天 | 共 24 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day 11 準備中文資料集 (2)

六、把資料轉成 Hugging Face Dataset Sentiment(CSV → HF dataset) from sklearn.model_se...

2025-09-25 ‧ 由 yu_ting 分享
DAY 12

學習 Prompt Engineering (提示工程)

Prompt Engineering : 設計並優化給 LLM 的輸入文字,讓模型更穩定、準確地輸出你想要的答案,重點不是改模型,而是改輸入與互動流程 核心原則...

2025-09-26 ‧ 由 yu_ting 分享
DAY 13

Day13 設計實作專案

目標 : 一個完整可操作的 FAQ 問答系統,並搭配簡單 UI(Gradio) 準備 : 建立 10 條 FAQ 資料集 用 sentence-transfo...

2025-09-27 ‧ 由 yu_ting 分享
DAY 14

Day14 畫 RAG 流程圖

在 Colab 上製作流程圖 # Colab-friendly: 安裝 Graphviz !apt-get install -y graphviz > /...

2025-09-28 ‧ 由 yu_ting 分享
DAY 15

Day15 設計 10 條 FAQ

i> 先設計 10 條 FAQ 如何申請退貨?請於訂單頁點選退貨申請並上傳商品照片,客服將於 3 個工作天內處理。 運費如何計算?單筆訂單滿 1000...

2025-09-29 ‧ 由 yu_ting 分享
DAY 16

Day16 安裝並測試向量 DB

i> 安裝 : !pip install -q sentence-transformers faiss-cpu chromadb ii> 準備資料...

2025-09-30 ‧ 由 yu_ting 分享
DAY 17

Day17 產生句子 Embeddings(sentence-transformers)

把設計好的 10條 FAQ 句子轉成向量 用sentence-transformers(SBERT 家族)製作句子/句段的向量表示把向量存成 numpy 檔...

2025-10-01 ‧ 由 yu_ting 分享
DAY 18

Day18 把 embeddings 存入向量資料庫,實作簡單檢索

流程 : 有 embeddings(N × d 的 numpy.float32 陣列)和對應 ids(list of str) 把 embeddings 加到...

2025-10-02 ‧ 由 yu_ting 分享
DAY 19

Day19 把檢索結果套進 LLM 做回答

流程 : 使用者輸入 query 用 embedding model 檢索向量庫 → 取得 top-k(id, question, answer, score...

2025-10-03 ‧ 由 yu_ting 分享
DAY 20

Day20 做成 CLI 版本

一、把 script 存成 run_faq.py %%bash cat > run_faq.py <<'PY' #!/usr/bin/env...

2025-10-04 ‧ 由 yu_ting 分享