剛學習LLM的時候,只會知道要用GPU,因為他的平行計算能力比較快。不過真的只有這樣嗎? (圖源: 自製) 在運算的過程中,最主要會消耗的是大量的記憶體(資料...
LLM大坑簡介 大型語言模型(LLM)的出現讓自然語言處理(NLP)有重大革命,以往NLP分成各式各樣的任務,像是翻譯、分類、摘要、資訊擷取等等,原本每一個任務...
AI會取代人類嗎? 人工智慧(AI)是否會取代人類的工作,這個問題在近年來引起了廣泛的討論和關注。根據《遠見雜誌》的報導,生成式AI的爆發,讓世人驚覺人工智慧...
摘要這篇文章以大家熟悉的「大地遊戲」為比喻,深入淺出地解說了 LangGraph 的狀態管理機制,並強調其在 AI 對話系統中的重要性。文章首先說明 Lang...
摘要本文探討 LangGraph 框架中的 Function Calling 技術,它是一種讓大型語言模型 (LLM) 能夠與外部工具互動的機制,進而擴展 A...
摘要這篇文章探討了 LangChain 和 LangGraph 這兩個強大的工具,它們能夠賦予 AI 模型呼叫外部程式碼的能力,進而擴展其功能並實現更智能的交...
前言 - 為什麼基礎建設很重要? 嗨嗨,大家好,我是精靈。 身為畢業兩年左右的菜鳥,因為意外不小心跳入了infra火坑,爬上來之後又意外吃了LLM這塊餅。接觸了...
摘要這篇文章深入淺出地介紹了 LangGraph,一種由 LangChain 團隊開發的工具,用於構建更靈活且複雜的 AI 代理工作流程。LangGraph...
摘要LangGraph 是一個用於建立複雜、狀態化的多AI代理系統的革命性框架,特別適用於與大型語言模型 (LLM) 合作。LangGraph 以圖形結構為基...
前言 昨天進行了model的串接功能 今天主要會說明串接model之後,會需要進行一系列的任務串接,包含Prompt的使用、LLM的呼叫、格式化輸出,涉及多個複...
摘要這篇文章深入探討了人工智慧領域從單一模型到複合式 AI 系統的轉變,並重點介紹了 AI 代理 的概念和應用。文章首先以智慧打卡系統為例,說明單一模型在處理...
今天要說明LangChain的安裝和LLM的連接 主要使用python進行安裝 pip install langchain 接著連接LLM langChai...
Paper link | Note link | Code link | ICLR 2024 整體想法 在這項研究中,他們首次全面性地探討了將圖結構資料編碼...
Paper link | Note link | Code link | EMNLP 2023 整體想法 本篇提出了一個通用框架,用於提升LLM在結構化數據...
Paper link | Note link | Code link | AAAI 2024 整體想法 Graph of Thoughts (GoT) 提升...
Paper link | Note link | Code link | ICLR 2024 整體想法 這篇論文提出了圖推理(RoG),通過將大型語言模型(...
Paper link | ICML 2023 整體想法 這項研究提出了一種簡單但有效的表示學習方法,稱為 RLEG,由基於擴散的嵌入生成器指導。 擴散模型在...
Paper link | Code link | AAAI 2024 整體想法 這項研究解決了與大型語言模型(LLMs)事實性評估相關的主要挑戰,並透過複雜...
Paper link | Note link | Code link | ICLR 2023 整體想法 這項研究探討了使用提示策略配合大型語言模型(LLM)...
最近接觸到要將 LLM 放在 Windows 筆電上運行的案子,需對 llama.cpp 做一些自訂選項的編譯,因此無法直接拿 GitHub 上的 Releas...
llama.cpp 是個相當受歡迎的語言模型推論框架,但一些相關的環境配置、編譯手法稍微困難一點,若不是有點技術底,一開始玩起來是頗痛苦。 好在後來作者都會定期...
Groq 是一家美國的人工智慧公司,專注於硬體推論加速器的開發,近期以 LPU (Language Process Unit) 聞名。LPU 就跟 CPU 或...
簡介 困惑度 (Perplexity, PPL) 是個評估語言模型相當實用的指標,用來表示語言模型對一句話的困惑程度。什麼叫困惑程度呢?當我們看到一句話會產生困...
簡介 昨天 Hugging Face Transformers 發布 v4.42 版,其中 Quantized KV Cache 這個功能特別吸引我,看到量化就...
原作者已歸隱(小隱隱於野,中隱隱於市,大隱隱於朝),並且先前的「萌王莉姆露」帳號已經刪除。以下是原作者文章與資訊的彙整。 iThome鐵人賽2023「用Pyth...
簡介 Activation-Aware Weight Quantization (AWQ) 是類似於 GPTQ 的另外一種量化方法,同樣也是透過少量的校準資料集...
介紹 pandas-ai 是一個開源套件,能夠讓使用者用 Prompt 的方式請 LLM 幫忙分析 DataFrame (等價於excel) 裡面的數據。 使用...
簡介 GPTQ 是透過 Post-Training 的方式對模型進行量化,其準確率與速度通常比 bitsandbytes (BNB) 4-Bit 好一些,是個相...
簡介 最近 Hugging Face Transformers 整合了 Flash Attention 2,可以減少記憶體消耗並提昇模型運算的速度,且使用方式非...
前言 前一篇提到 Semantic Kernel對於OpenAI Chat Completions封裝了一些方法,可以幫助開發人員快速的使用以對話為模式的Cha...