從第一次開發 GenAI 到現在將近一年了,這段期間分別參與了三次不同企業和規模的專案,完整經歷了至少兩次從 0 到 1 開發 RAG 服務的流程。然而雖然累積了一些實務經驗,但初跨入這個領域,仍有許多需要持續學習的地方。
在接下來的30天裡,我希望能透過寫作重整這段時間的開發經驗,並結合相關書籍與課程,反思如何優化我的開發品質,並以打造企業級產品為目標,提升自己在系統設計與生成式 AI 開發方面的技術能力。
如果這系列的文章也能幫助到你,歡迎訂閱還有留言討論,讓我們一起成長進步 :)
回顧自己的學習歷程 去年11月,我第一次接觸到 RAG(Retrieval Augmented Generation)專案。儘管並非相關科系背景,但憑藉在研究室...
生成式 AI 產品最核心的當然就是 LLM 模型了,大部分企業自己架設 GenAI 產品主要是考量資安問題、以及針對使用場景 fine-tune 模型,因此對於...
第三天,我們進入到 transformer 的執行 pipeline 當中,當模型在處理文本時,需要先將文本轉換為模型能理解的形式,而 tokenizer 就是...
在前兩天的文章中,我們探討了 Transformer 模型的運作原理及 Tokenizer 如何將自然語言轉換成模型能夠理解的數字。今天,我們將進一步介紹嵌入(...
由於我們的目標是在開發生成式 AI 產品,所以會更著重在前述所提到的 decoder-only transformer models,而這也是許多現在知名生成式...
有了模型之後再來就是使用介面了。現在有很多快速提供介面的服務像 ChatOllama、OpenGPTs 和 HuggingChat 等等,不過為了快速體驗整個...
HuggingFace 是一個更正式的模型下載平台,並提供多種模型選擇,也讓開發者可以尋找其他人 fine-tune 過的模型。 Model Hub 首先,進...
下載模型大多是為了 fine-tune 使用,由於模型大小會受限於硬體資源,如果希望產品有更好的回答效果,大多會嘗試使用模型開發商所提供的 API 來串接它們所...
昨天介紹了 LangChain 生態系中的各個組件,這些組件是生成式 AI 開發的基礎,然而 LangChain 的核心在於如何通過 Chain 進行擴展和優化...
LangChain Expression Language (LCEL) 在介紹完 runnable 組件和 Langchain 的 chain 設計之後,接著...