iT邦幫忙

鐵人檔案

2024 iThome 鐵人賽
回列表
自我挑戰組

NLP 新手的 30 天入門養成計畫 系列

從零開始入門 NLP,把自己這 30 天的學習內容展現出來 ~

鐵人鍊成 | 共 30 篇文章 | 6 人訂閱 訂閱系列文 RSS系列文
DAY 21

[Day 21] -「我們」與「惡」的距離:餘弦相似度

我們花了幾天的時間來介紹在如何將單詞轉化為詞向量,用於模型訓練或其他任務,今天就來聊聊如何利用這些詞向量來判斷單詞之間的語意相似度吧。 經過 embedding...

2024-08-26 ‧ 由 sfg 分享
DAY 22

[Day 22] - 挑戰 Transformer 系列:Seq2Seq

這幾年生成式 AI 和大型語言模型的快速發展,以及它們所帶來超乎期待的表現,正是讓我想要一腳踏入 NLP 世界的契機,而今天要介紹的內容就和 LLM 密切相關。...

2024-08-27 ‧ 由 sfg 分享
DAY 23

[Day 23] - 挑戰 Transformer 系列:Self-Attention

今天繼續來挑戰怎麼理解 Transformer 架構吧! Attention 的概念其實之前就有了,不過在 2017 年發表的論文《Attention Is A...

2024-08-28 ‧ 由 sfg 分享
DAY 24

[Day 24] - 簡單聊聊什麼是大型語言模型

2017 年 Transformer 的出現讓 NLP 的相關研究邁進了一大步,大家都開始朝著這個方向把模型的規模擴大,因為我們發現當模型的參數越多、疊越多層、...

2024-08-29 ‧ 由 sfg 分享
DAY 25

[Day 25] - 認識 Huggingface:情緒分析實作

今天又要來實作啦!我想要介紹的主題是 Hugging Face 以及如何使用它的功能來完成一些簡單的 NLP 任務。 Hugging Face 是一個和人工智慧...

2024-08-30 ‧ 由 sfg 分享
DAY 26

[Day 26] - 認識 Langchain:提示工程實作

還記得我們在 Day 24 的時候提到應用大型語言模型的四種方式嗎? 今天,我想要通過 Langchain 來實作看看,如何用最簡單的方式來對 LLM 下提示...

2024-08-31 ‧ 由 sfg 分享
DAY 27

[Day 27] - 把 IR 也加進來!檢索增強生成 (1)

當我們打開 OpenAI 官方網站,找到對於 ChatGPT 的介紹,可以得知它是從 GPT3.5 模型微調而來,經過某些監督式的訓練以及強化學習的方式,讓它更...

2024-09-01 ‧ 由 sfg 分享
DAY 28

[Day 28] - 把 IR 也加進來!檢索增強生成 (2)

今天要繼續把 RAG 實作的部分完成。 我們之前提到,RAG 包含了 Retriever 和 Generator 兩個部分,也就是將檢索到的相關文檔傳給模型生成...

2024-09-02 ‧ 由 sfg 分享
DAY 29

[Day 29] - 如何判斷 LLM 有沒有亂回答

關於評估任務 ( Evaluation ),我覺得作為 NLP 系列的最後一個篇章還蠻合適的,在這將近一個月的時間內,我們有聊過的主題包括資訊檢索、文本生成、文...

2024-09-03 ‧ 由 sfg 分享
DAY 30

[Day 30] - 完賽心得

終於完成這 30 天的挑戰了! 這是我第一次參加 IT 鐵人賽,想說在升大四的暑假來找一個有興趣的主題,好好的把它從頭梳理一遍,於是選擇了入門 NLP 做為這次...

2024-09-04 ‧ 由 sfg 分享