AI在最近幾年的發展快速成長,隨著大數據與算力的提升,機器學習(Machine Learning)與深度學習(Deep Learning)成為主流,使 AI 在...
LLM(大型語言模型,Large Language Model): 指擁有「上億到千億參數」的深度學習模型,能理解並生成自然語言。LLM是總稱,常見的有GPT...
今天來介紹一個非常好用的開源平台”Hugging Face”,最初以 NLP 模型聞名,其中的transformers在github上成為史上增長最快機器學習庫...
什麼是API? API 全名為Application Programming Interface,是一種在程式之間溝通的工具,兩個系統或應用程式之間互動,要透過...
今天來介紹embedding: embedding是把文字轉換成一個向量的過程,這樣電腦就可以用數學方式理解它 向量: 它可以是一個維度為 n 的數字陣列例如:...
昨天大致了解了embedding,我今天要補充一些並做簡單的實作。 在 AI 的自然語言處理(NLP)應用中,「文字相似度比對」 是非常常見的需求。除了問答系統...
首先,我今天想介紹FAISS,它是相似度搜尋庫,是由facebook所開發的,主要用來在大量的向量資料中快速找到並查詢向量最相似的項目,但缺點是不具備資料庫的功...
什麼是向量資料庫呢?可以把文字變成數字儲存起來的地方。也就是把人類的語言轉換成數字,好讓電腦理解。 為什麼要用Chroma?它是個一個常見的向量資料庫,還有FA...
大語言模型LLM通常在一般的問題中都可以做準確地回答,但到專業領域就會出現虛幻的答案,所以就發展出RAG、Fine-tuning,都是來解決這個問題的。看一下他...
今天的主題是要介紹一個很常用的技能: 要如何把文件查訊後回答(先介紹分段) 首先,LangChain 是什麼?一個 LLM 應用框架(流程框架),可串接:向量資...