在 Day 22 中,我們已經完成了一個基礎版的 RAG 後端來達成:
接收使用者輸入的問題
透過 ChromaDB 檢索最相關的 Notion 筆記
由 G...
在前一篇(Day27),我們談到模型的版本控管與自動部署流程。
今天,我們要解決另一個實務痛點——部署後的推論效能與成本問題。
當模型部署上雲端後,工程師常會面...
接下來我們將要討論 AI Observability 的其中一個很重要的主軸,那就是 Evaluation,有好的方法,我們才能讓我們的 AI Applica...
延續昨日的多項式迴歸中,我們觀察到一個現象: 雖然二次特徵提升了模型的表現,但同時也引入過擬合 (Overfitting) 風險。這是因為當特徵數量暴增,模型就...
首先,我今天想介紹FAISS,它是相似度搜尋庫,是由facebook所開發的,主要用來在大量的向量資料中快速找到並查詢向量最相似的項目,但缺點是不具備資料庫的功...
在 Part 1 中,我們建立了短期記憶和長期記憶的基礎架構。但光有記憶倉庫還不夠,我們需要一個智慧管理員來決定:
哪些資訊值得從短期記憶轉移到長期記憶?
如...