iT邦幫忙

llm相關文章
共有 313 則文章
鐵人賽 生成式 AI DAY 23
懶人救星:生成式AI 系列 第 23

技術 Day23-Text to SQL 的改進方法: DIN-SQL 心得

前言✨ 隨著大數據時代的來臨,SQL Query 成為了各行各業不可或缺的必備技能。然而對於不熟悉 SQL 語法的使用者而言,將自然語言問題轉換為複雜的 SQL...

鐵人賽 生成式 AI DAY 20

技術 Day20 - 實作之前先來聊一下系統

前言 前面的章節中,我們從基礎的LLM推理知識 🧠、簡單的硬體知識 💻,一路學習到一些著名的推理加速技術原理 ⚡️。 礙於技術篇即使加上一堆emoji 🎨還是很...

鐵人賽 生成式 AI DAY 22
懶人救星:生成式AI 系列 第 22

技術 Day22-LlamaIndex 黑科技圖解:讓你在無 SQL 技能下秒變查詢達人!

前言✨ 先前我們介紹了文檔檢索、查詢和聊天等功能。現今隨著企業數據量的激增,企業和組織越來越依賴數據來做出決策。然而許多用戶並不具備 SQL 編寫能力,因此 T...

鐵人賽 AI/ ML & Data DAY 18

技術 Day18: MINDACT-可以幫你上網訂票和發廢文的終極Chatbot

最近Threads上出現一堆電子乞丐和風向文,讓人看了實在很躁。 或許有人會嗆:「不爽就不要看!」但人是犯賤的生物,你們會PO帳單條碼,我們就想臭。 我不禁思考...

鐵人賽 AI/ ML & Data DAY 19

技術 Day19: 任務導向之我們希望Siri可以操控手機和APP

每年的這個時候,都是果粉和卓粉的批鬥大會,在今年的六月,蘋果也宣布推出Apple Intelligence,與Google Gemini打對臺(我覺得沒Gemi...

鐵人賽 生成式 AI DAY 20

技術 day20 製作給予GenAI的Diagram as Code教科書(二):Node補充資料

前言 昨天我們利用Guides製作教學手冊,使得GenAI懂得如何操作這個函式庫,但是若沒有完整的工具書,也沒辦法發揮出這個工具的強大之處,因此我們這天主要獲取...

鐵人賽 生成式 AI DAY 5

技術 Part1: Azure聊天機器人原理-RAG&LLM

上一篇我們一起看了聊天機器人的文檔餵食秀,今天要來科普兩個聊天機器人相關的專有名詞,RAG和LLM,這兩個縮寫就在我們系列文的主標題中,但到現在還沒好好跟大家解...

鐵人賽 生成式 AI DAY 4

技術 【Day 4】LLM 如何重塑區塊鏈技術:兩個應用範例

歡迎回來! 今天我們要開始討論 LLM 如何影響區塊鏈技術,話不多說,讓我們開始吧! 什麼是區塊鏈? 區塊鏈(Blockchain)是一種分散式系統(Distr...

鐵人賽 生成式 AI DAY 4

技術 Day4 模型介紹(GPT-4o, Claude 3.5 Sonnet, Gemini, llama3.1, Phi-3, Qwen2.5, Grok, ...)

上次提到生成式AI的開發的三大支柱「模型、平台、開發套件」,這次先來討論「模型」這個支柱。本文將聚焦於生成式AI的核心 「模型」。我們將主要探討語言模型(Lan...

鐵人賽 生成式 AI DAY 19

技術 Day19 - 教練,我想要更長的context length......

前言 這篇是最後一篇硬體加速技術理論篇了!介紹的是 資料面最佳化 (Data-level Optimization) 的方法。 🚀 簡單複習一下,在很久以前的...

鐵人賽 生成式 AI DAY 18

技術 Day18 - 快......還要更快:Speculative decoding

前言 這一章將介紹 演算法層面最佳化 (Algorithm-level Optimization) ,這其中最知名的即為Speculative Decoding...

鐵人賽 生成式 AI DAY 17

技術 Day17 - 模型壓縮之如何玩弄模型PART2:蒸餾/剪枝/稀疏化

前言 上一章中介紹了量化,它將模型從高精度轉換成低精度,來進行模型壓縮的動作,這一章會繼續介紹其他的模型壓縮方法! 🚀📉 (圖源: DALL·E) 💧 Kno...

鐵人賽 生成式 AI DAY 3

技術 【Day 3】LLM 的演變:從 GPT-3 到最新模型的進展

LLM 和 Transformer 前面我們已經聊到 LLM 的快速發展,以及它不可忽視的能力。講個笑話,曾經有個程式設計師上班時無法工作,老闆問為什麼? 他回...

鐵人賽 AI/ ML & Data DAY 4

技術 Day4: Chit-chat talk之DialoGPT-ChatGPT的阿祖

今天,我們來介紹在Chit-chat talk 一個具代表的chatbot,DialoGPT。DialoGPT(Dialogue Generative Pre-...

達標好文 技術 #1 製作屬於自己的 AI Vtuber

現在AI已經流行了好一陣子,有在關注AI Vtuber的各位一定都知道Vedal(計算機程序員和人工智慧開發者,利用大型語言模型生成了Neuro-sama的回應...

技術 #2 Python SDK for Gemini API 使用 Google 的 Gemini 大型語言模型

本篇我們要接續#1 製作屬於自己的 AI Vtuberhttps://ithelp.ithome.com.tw/articles/10352663 此流程通過整...

鐵人賽 生成式 AI DAY 20
懶人救星:生成式AI 系列 第 20

技術 Day20-RAG大秘密揭露!資料檢索其實可以這麼高效

前言✨ LlamaIndex Querying 功能為用戶提供了一個強大的數據檢索工具。這項功能使用戶能夠以簡單而直觀的方式查詢資料,無論是尋求具體答案還是進行...

鐵人賽 AI/ ML & Data DAY 3

技術 Day3: ChatGPT的前身與今世(續)-讓AI聊個天其實沒這麼簡單...

在ChatGPT出世之前(~2020),以前的語言模型(LM,Language Model)參數量不夠多,相比LLAMA3、GPT4的70B、175B,T5-L...

鐵人賽 生成式 AI DAY 16

技術 Day16 - 模型壓縮之如何玩弄模型PART1:量化

前言 這一章開始進入 模型/參數層面最佳化 (Model-level / Parameter-Level Optimization) 的技術介紹,這邊主要是介紹...

鐵人賽 生成式 AI DAY 2

技術 Day2 什麼是大語言模型LLM?

LLM在AI中的位置 在生成式AI百家爭鳴的今日,大家會很常聽到機器學習、深度學習、生成式AI、大語言模型、RAG、Fine-tuning等很多和AI相關的名...

鐵人賽 生成式 AI DAY 18

技術 day18 Diagram as Code 創建RAG資料庫計畫:製作給予GenAI的教科書

前言 day16、17我們快速的介紹Diagram as Code函式庫的API,並且介紹常見的幾個元件以及可以客製化的屬性,現在我們打算將此函式庫的API以及...

鐵人賽 生成式 AI DAY 15

技術 Day15 - 這次應該是壓榨讀者的腦袋:FlashAttention

前言 壓榨硬體系列的技術,這章要來提到大魔王FlashAttention!👾 雖然它也是Attention演算法上的改進 🔄,不過它的初衷也是為了改善硬體設備的...

鐵人賽 AI/ ML & Data DAY 1

技術 [Day 1] 緣起與文章主題介紹

緣起 如果你剛踏入數據科學的世界,那你一定聽說過 Kaggle 這個神奇的地方。Kaggle 是一個全球最大的數據科學競賽平台,匯聚了來自世界各地的數據愛好者和...

鐵人賽 生成式 AI DAY 18
懶人救星:生成式AI 系列 第 18

技術 Day18-從零開始:如何透過LlamaIndex建立Indexing?

前言✨ 在 LlamaIndex🦙 中,Indexing 模組是一個關鍵的組件,負責組織和存儲來自不同數據來源的資訊,以便更有效地進行檢索。這個模組的核心是節點...

鐵人賽 Odoo DAY 1

技術 前言

故事是這樣開始的 .... 某次會議時會議上的夥伴就決定ERP系統用免錢的odoo 好了,那時的版本是在odoo 17 release前的一兩個月跟GenAI才...

鐵人賽 生成式 AI DAY 15

技術 day15 繪製架構圖工具介紹:Plant UML、Diagram as Code 、Eraser

前言 之前我們介紹RAG,以及RAG各個資料源,甚至我們應用RAG製作一個文件分析器, day15,我們會開始製作我們的RAG資料源,首先我們先進行繪製架構圖函...

鐵人賽 生成式 AI DAY 15
懶人救星:生成式AI 系列 第 15

技術 Day15-從零開始:如何透過LlamaIndex讀取檔案(下)?

LlamaParse📄 LlamaParse 是LlamaIndex所開發的另一項服務,主要用於處理/解析文本數據,並提供OCR、輸出格式轉換(Markdown...

鐵人賽 IT 管理 DAY 10

技術 Day 10 : 啟航,Microsoft 365 Copilot 是怎麼運作的

前情提要 前兩天我們提到了 Microsoft Loop、OneDrive 與 SharePoint Online 的服務,這是因為接下來的介紹將同步分享如何...

鐵人賽 生成式 AI DAY 16
懶人救星:生成式AI 系列 第 16

技術 Day16-從零開始:如何透過LlamaIndex串接LLM Model?

前言 隨著大型語言模型(LLM)的快速發展,如何快速地將模型串接整合,成為了許多開發者面臨的挑戰。LlamaIndex 作為一個資料框架,提供了多種 LLM 接...

鐵人賽 生成式 AI DAY 14

技術 day14 chatDocument 文件分析器(二):混合資料格式解析!完全版chatDocument接受多檔案多來源的文件分析器

前言 昨天我們利用streamlit快速建構出csv檔案的智能文件分析器,今天我們將文件分析器利用自定義的Loader擴充py、text、pdf等資料格式,甚至...