我們花了幾天的時間來介紹在如何將單詞轉化為詞向量,用於模型訓練或其他任務,今天就來聊聊如何利用這些詞向量來判斷單詞之間的語意相似度吧。 經過 embedding...
這幾年生成式 AI 和大型語言模型的快速發展,以及它們所帶來超乎期待的表現,正是讓我想要一腳踏入 NLP 世界的契機,而今天要介紹的內容就和 LLM 密切相關。...
今天繼續來挑戰怎麼理解 Transformer 架構吧! Attention 的概念其實之前就有了,不過在 2017 年發表的論文《Attention Is A...
2017 年 Transformer 的出現讓 NLP 的相關研究邁進了一大步,大家都開始朝著這個方向把模型的規模擴大,因為我們發現當模型的參數越多、疊越多層、...
今天又要來實作啦!我想要介紹的主題是 Hugging Face 以及如何使用它的功能來完成一些簡單的 NLP 任務。 Hugging Face 是一個和人工智慧...
還記得我們在 Day 24 的時候提到應用大型語言模型的四種方式嗎? 今天,我想要通過 Langchain 來實作看看,如何用最簡單的方式來對 LLM 下提示...
當我們打開 OpenAI 官方網站,找到對於 ChatGPT 的介紹,可以得知它是從 GPT3.5 模型微調而來,經過某些監督式的訓練以及強化學習的方式,讓它更...
今天要繼續把 RAG 實作的部分完成。 我們之前提到,RAG 包含了 Retriever 和 Generator 兩個部分,也就是將檢索到的相關文檔傳給模型生成...
關於評估任務 ( Evaluation ),我覺得作為 NLP 系列的最後一個篇章還蠻合適的,在這將近一個月的時間內,我們有聊過的主題包括資訊檢索、文本生成、文...
終於完成這 30 天的挑戰了! 這是我第一次參加 IT 鐵人賽,想說在升大四的暑假來找一個有興趣的主題,好好的把它從頭梳理一遍,於是選擇了入門 NLP 做為這次...