前言
這一章將介紹 演算法層面最佳化 (Algorithm-level Optimization) ,這其中最知名的即為Speculative Decoding...
4-5 Gemini API function calling 實作
https://colab.research.google.com/github/goo...
What is RAG (Retrieval-Augmented Generation)?
RAG(檢索增強生成)是一種將預訓練(Pre-training)的大...
今天練習是利用Hugging Face API Token來做翻譯文本的練習,跟昨天練習不同的是,API 能夠直接調用 Hugging Face 提供的翻譯模型...
前言
前面 Day7 有講過超級電腦(資料中心)和IaaS平台之間的關係 🛠️,在 Day9 提到了local LLM和雲端LLM服務的差異 ☁️⚖️,而 Da...
前情提要
上一篇成功用 Node 和 Python 把 Open WebUI 給 Run 起來,很順利的使用 UI 介面跟語言模型溝通,那今天就要來繼續玩看看...