iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2 Like 1 留言 12336 瀏覽

鐵人賽 AI & Data DAY 16

LLM 學習筆記系列第 16 篇

技術 LLM Note Day 16 - ggml & llama.cpp

簡介 ggml 是 ggerganov 開發的一個機器學習框架，主打純 C 語言、輕量化且可以在 Apple 裝置上執行等功能。大概 2022 年底的時候，就常...

Penut Chen ‧ 2023-10-01 ‧團隊消波塊上的海洋貓貓

3 Like 0 留言 11534 瀏覽

鐵人賽 AI & Data DAY 9

LLM 學習筆記系列第 9 篇

技術 LLM Note Day 9 - LLM 訓練流程

簡介在開始實際操作 LLM 之前，我們先來瞭解 LLM 的訓練流程。訓練一個 LLM 通常包含兩個步驟：監督式微調與增強式學習，不過也有許多模型只做監督式微調...

Penut Chen ‧ 2023-09-24 ‧團隊消波塊上的海洋貓貓

3 Like 1 留言 10832 瀏覽

鐵人賽 AI & Data DAY 24

LLM 學習筆記系列第 24 篇

技術 LLM Note Day 24 - 語言模型微調 LLM Finetuning

簡介接下來要來討論如何微調 (Finetune) 一個大型語言模型。微調 LLM 與微調其他模型其實很相似，但是因為 LLM 的參數量較大，所以訓練的最低需求...

Penut Chen ‧ 2023-10-09 ‧團隊消波塊上的海洋貓貓

1 Like 0 留言 8225 瀏覽

鐵人賽 AI & Data DAY 5

OpenAI 從提示工程（Prompt Engineering)到語義核心(Semantic Kernel)的實踐系列第 5 篇

技術提示工程（Prompt Engineering）：Prompt 進階技法 chain-of-thought (CoT)

提示工程（Prompt Engineering）：Prompt 進階技法 chain-of-thought (CoT) 前言前一篇提到 In-Context...

Ian ‧ 2023-09-20

3 Like 1 留言 7756 瀏覽

鐵人賽 AI & Data DAY 25

LLM 學習筆記系列第 25 篇

技術 LLM Note Day 25 - PEFT & LoRA 訓練框架

簡介在單張消費級顯卡上全微調 (Fully Fine-Tune, FFT) 一個 7B 參數量以上的模型幾乎是不可能的，這時神秘的笑臉再次出手拯救了我們。由...

Penut Chen ‧ 2023-10-10 ‧團隊消波塊上的海洋貓貓

1 Like 0 留言 7040 瀏覽

鐵人賽 AI & Data DAY 4

OpenAI 從提示工程（Prompt Engineering)到語義核心(Semantic Kernel)的實踐系列第 4 篇

技術提示工程（Prompt Engineering）：Prompt 進階技法 In-Context Learning

前言前一篇提到Prompt 的基本技法，本篇開始會談一些進階式的用法，首先來看的是In-Context Learning。雖然前一篇的Prompt 基本技法在...

Ian ‧ 2023-09-19

3 Like 0 留言 6260 瀏覽

鐵人賽 AI & Data DAY 11

LLM 學習筆記系列第 11 篇

技術 LLM Note Day 11 - 擁抱開源的微笑 Hugging Face Transformers

簡介 Hugging Face 🤗 Transformers 是訓練 Transformer 模型最知名的套件沒有之一，此套件收入了許多知名模型架構、訓練演算法...

Penut Chen ‧ 2023-09-26 ‧團隊消波塊上的海洋貓貓

3 Like 1 留言 6172 瀏覽

鐵人賽生成式 AI DAY 26

2024 年用 LangGraph 從零開始實現 Agentic AI System 系列第 26 篇

技術【Day 26】- Ollama: 革命性工具讓本地 AI 開發觸手可及 - 從安裝到進階應用的完整指南

摘要這篇文章是一篇關於 Ollama 的詳細指南，介紹了 Ollama 這個開源本地大型語言模型運行框架。文章首先介紹了 Ollama 的背景、特性和優點，強...

hengshiousheu ‧ 2024-09-24

3 Like 1 留言 4949 瀏覽

鐵人賽 AI & Data DAY 23

LLM 學習筆記系列第 23 篇

技術 LLM Note Day 23 - LangChain 中二技能翻譯

簡介除了下層的推論框架以外，也有非常多人在關注上層的應用開發，其中最炙手可熱的當屬 LangChain 框架。當我們開始實際使用 LLM 開發相關應用程式時，...

Penut Chen ‧ 2023-10-08 ‧團隊消波塊上的海洋貓貓

3 Like 1 留言 4592 瀏覽

鐵人賽 AI & Data DAY 17

LLM 學習筆記系列第 17 篇

技術 LLM Note Day 17 - vLLM & Paged Attention

簡介 vLLM 是來自 UC Berkeley 的 Woosuk Kwon 和 Zhuohan Li 所製作的推論框架，使用 Paged Attention 技...

Penut Chen ‧ 2023-10-02 ‧團隊消波塊上的海洋貓貓

0 Like 0 留言 4086 瀏覽

鐵人賽生成式 AI DAY 10

2024 年用 LangGraph 從零開始實現 Agentic AI System 系列第 10 篇

技術【Day 10】從零到一：用實戰案例掌握 LangGraph Studio 開發 AI 代理

摘要本文介紹了 LangGraph Studio，一個專為 AI 代理應用程式開發設計的整合開發環境 (IDE)。文章首先介紹了 LangGraph Stud...

hengshiousheu ‧ 2024-09-08

0 Like 0 留言 4084 瀏覽

鐵人賽生成式 AI DAY 2

2024 年用 LangGraph 從零開始實現 Agentic AI System 系列第 2 篇

技術【Day 2】- 什麼是 AI 代理？複合式 AI 與 Agentic AI 的創新之路

摘要這篇文章深入探討了人工智慧領域從單一模型到複合式 AI 系統的轉變，並重點介紹了 AI 代理的概念和應用。文章首先以智慧打卡系統為例，說明單一模型在處理...

hengshiousheu ‧ 2024-08-31

0 Like 0 留言 3750 瀏覽

鐵人賽 AI & Data DAY 2

OpenAI 從提示工程（Prompt Engineering)到語義核心(Semantic Kernel)的實踐系列第 2 篇

技術提示工程（Prompt Engineering）：LLM模型的誘發劑-Prompt提示

前言相信有用過ChatGPT都有發現到，要讓ChatGPT的回應符合我們想要的內容，其中很重要的關鍵是Prompt(又稱提示、詠唱)，本篇就來談談Prompt...

Ian ‧ 2023-09-17

2 Like 0 留言 3683 瀏覽

鐵人賽 AI & Data DAY 12

LLM 學習筆記系列第 12 篇

技術 LLM Note Day 12 - So Many LLMs 如繁星般的語言模型們

簡介雖然多數的 Local LLM 不會像 ChatGPT 一樣高達 175B 的參數量，但即便模型只有 7B, 13B，在只有一兩張 3090, 4090...

Penut Chen ‧ 2023-09-27 ‧團隊消波塊上的海洋貓貓

0 Like 0 留言 3648 瀏覽

鐵人賽 AI & Data DAY 3

OpenAI 從提示工程（Prompt Engineering)到語義核心(Semantic Kernel)的實踐系列第 3 篇

技術提示工程（Prompt Engineering）：Prompt 初階技法

前言上一篇提到Prompt是LLM模型的誘發劑，本篇接續介紹Prompt的基本用法和一些初階技法，幫助讀者更有效的與這些語言模型互動。接下來的內容均以Ch...

Ian ‧ 2023-09-18

4 Like 1 留言 3596 瀏覽

技術 PDF GPT: ChatGPT 不能問的，這個可以!

相信大家用 ChatGPT 都有一陣子了，也知道 ChatGPT 雖然強大，但是有以下幾個缺點: 無法詢問超過 2021 年以後的問題無法直接上傳自己的數...

Pythonist ‧ 2023-07-10

2 Like 0 留言 3407 瀏覽

鐵人賽 AI & Data DAY 20

LLM 學習筆記系列第 20 篇

技術 LLM Note Day 20 - 上下文學習 In-Context Learning

簡介上下文學習 (In-Context Learning, ICL) 是一種語言模型的現象，LLM 可以根據提供的範例來產生預測的標記，而不需要任何額外的微調...

Penut Chen ‧ 2023-10-05 ‧團隊消波塊上的海洋貓貓

2 Like 0 留言 3273 瀏覽

鐵人賽 AI & Data DAY 18

LLM 學習筆記系列第 18 篇

技術 LLM Note Day 18 - Hugging Face Text Generation Inference

簡介 Text Generation Inference 簡稱 TGI，是由 Hugging Face 開發的 LLM Inference 框架。其中整合了相當...

Penut Chen ‧ 2023-10-03 ‧團隊消波塊上的海洋貓貓

1 Like 0 留言 3132 瀏覽

鐵人賽 AI & Data DAY 15

LLM 學習筆記系列第 15 篇

技術 LLM Note Day 15 - ONNX & ONNX Runtime

簡介 ONNX Runtime (ORT) 與其他推論框架相比，是個相對古老的框架。但是他的泛用性相當高，可以適用於幾乎任何模型上。而 ORT 不只專注在推論上...

Penut Chen ‧ 2023-09-30 ‧團隊消波塊上的海洋貓貓

0 Like 0 留言 3070 瀏覽

鐵人賽 AI & Data DAY 13

OpenAI 從提示工程（Prompt Engineering)到語義核心(Semantic Kernel)的實踐系列第 13 篇

技術 Semantic Kernel的實踐：Semantic Kernel 概觀

Semantic Kernel的實踐：Semantic Kernel 概觀前言在開始使用 Semantic Kernel 之前，先從概觀的角度來理解 Sem...

Ian ‧ 2023-09-28

0 Like 0 留言 3058 瀏覽

鐵人賽生成式 AI DAY 4

2024 年用 LangGraph 從零開始實現 Agentic AI System 系列第 4 篇

技術【Day 4】- LangGraph 入門教程：節點、邊、狀態

摘要這篇文章深入淺出地介紹了 LangGraph，一種由 LangChain 團隊開發的工具，用於構建更靈活且複雜的 AI 代理工作流程。LangGraph...

hengshiousheu ‧ 2024-09-02

0 Like 0 留言 2876 瀏覽

技術在 Windows 上編譯 llama.cpp 專案

最近接觸到要將 LLM 放在 Windows 筆電上運行的案子，需對 llama.cpp 做一些自訂選項的編譯，因此無法直接拿 GitHub 上的 Releas...

Penut Chen ‧ 2024-08-03

0 Like 0 留言 2843 瀏覽

鐵人賽 AI & Data DAY 6

OpenAI 從提示工程（Prompt Engineering)到語義核心(Semantic Kernel)的實踐系列第 6 篇

技術提示工程（Prompt Engineering）：Prompt 進階技法 Tree of Thoughts (ToT)

前言前一篇提到思維鏈（CoT）技法，用於處理邏輯推理、算述運算效果特別不錯，本篇延伸思維鏈（CoT）技法，介紹另一個進階技法Tree of Thoughts...

Ian ‧ 2023-09-21

0 Like 0 留言 2753 瀏覽

鐵人賽 AI & Data

LLM 學習筆記系列第 31 篇

技術 LLM Note Day 31 - Flash Attention

簡介最近 Hugging Face Transformers 整合了 Flash Attention 2，可以減少記憶體消耗並提昇模型運算的速度，且使用方式非...

Penut Chen ‧ 2023-10-18 ‧團隊消波塊上的海洋貓貓

2 Like 0 留言 2732 瀏覽

鐵人賽 AI & Data DAY 28

LLM 學習筆記系列第 28 篇

技術 LLM Note Day 28 - 資料集 Datasets

簡介要訓練一個模型，首先要有資料。不僅要有很大量的資料，也要有品質很好的資料。資料的品質包含：文句是否通順、格式是否合理、內容是否偏頗、資訊是否有害等等。品質...

Penut Chen ‧ 2023-10-13 ‧團隊消波塊上的海洋貓貓

1 Like 0 留言 2622 瀏覽

鐵人賽生成式 AI DAY 7

2024 年用 LangGraph 從零開始實現 Agentic AI System 系列第 7 篇

技術【Day 7】 - LangGraph 深入探索：Function Calling 機制與進階應用

摘要本文探討 LangGraph 框架中的 Function Calling 技術，它是一種讓大型語言模型 (LLM) 能夠與外部工具互動的機制，進而擴展 A...

hengshiousheu ‧ 2024-09-05

0 Like 1 留言 2596 瀏覽

鐵人賽生成式 AI DAY 27

2024 年用 LangGraph 從零開始實現 Agentic AI System 系列第 27 篇

技術【Day 27】- 告別提示工程：DSPy如何革新大型語言模型的應用開發

摘要DSPy 是一個由 Stanford NLP 研究人員開發的框架，旨在簡化大型語言模型 (LLM) 的開發。它以 "Programming, n...

hengshiousheu ‧ 2024-09-25

2 Like 0 留言 2576 瀏覽

技術 Groq + Llama 3.1 + SerpApi 免費仔光速打造簡易 RAG 系統

Groq 是一家美國的人工智慧公司，專注於硬體推論加速器的開發，近期以 LPU (Language Process Unit) 聞名。LPU 就跟 CPU 或...

Penut Chen ‧ 2024-07-24

0 Like 0 留言 2532 瀏覽

鐵人賽 AI & Data DAY 7

OpenAI 從提示工程（Prompt Engineering)到語義核心(Semantic Kernel)的實踐系列第 7 篇

技術提示工程（Prompt Engineering）：Prompt 最佳實踐指引

前言經過前面幾篇內容，將Prompt的技法從基本運用到目前幾個研究實驗論文所提出的進階技法，做了一番說明，本篇將引用OpenAI與Micrsoft官方推出的針...

Ian ‧ 2023-09-22

2 Like 0 留言 2417 瀏覽

鐵人賽 AI & Data

LLM 學習筆記系列第 33 篇

技術 LLM Note Day 33 - AutoAWQ

簡介 Activation-Aware Weight Quantization (AWQ) 是類似於 GPTQ 的另外一種量化方法，同樣也是透過少量的校準資料集...

Penut Chen ‧ 2023-12-05 ‧團隊消波塊上的海洋貓貓

技術 LLM Note Day 16 - ggml & llama.cpp

技術 LLM Note Day 9 - LLM 訓練流程

技術 LLM Note Day 24 - 語言模型微調 LLM Finetuning

技術 提示工程（Prompt Engineering）：Prompt 進階技法 chain-of-thought (CoT)

技術 LLM Note Day 25 - PEFT & LoRA 訓練框架

技術 提示工程（Prompt Engineering）：Prompt 進階技法 In-Context Learning

技術 LLM Note Day 11 - 擁抱開源的微笑 Hugging Face Transformers

技術 【Day 26】- Ollama: 革命性工具讓本地 AI 開發觸手可及 - 從安裝到進階應用的完整指南

技術 LLM Note Day 23 - LangChain 中二技能翻譯

技術 LLM Note Day 17 - vLLM & Paged Attention

技術 【Day 10】從零到一：用實戰案例掌握 LangGraph Studio 開發 AI 代理

技術 【Day 2】- 什麼是 AI 代理？複合式 AI 與 Agentic AI 的創新之路

技術 提示工程（Prompt Engineering）：LLM模型的誘發劑-Prompt提示