AI、機器學習以及深度學習的語言學應用

Carol (pincarol)

iT邦見習生 ‧ 點數 196

1762

累計瀏覽數

0人

在追蹤

站內簡訊追蹤

鐵人檔案

2025 iThome 鐵人賽

回列表

AI & Data

AI、機器學習以及深度學習的語言學應用系列

自然語言處理（NLP）對於各式各樣的模型來說至關重要。要先能夠運用程式語言來處理我們日常生活所用的語言，才能使大型語言模型（LLM）有更加精準的表現。
在這30天內，將從各式各樣的主題，像是基礎的Regular Expression，至BERT以及LLM，來去了解當今是如何運用AI、機器學習以及深度學習，來去處理、理解真實世界語料。

鐵人鍊成｜共 30 篇文章｜ 1 人訂閱訂閱系列文 RSS系列文｜團隊美珠姨

0 Like 1 留言 273 瀏覽

DAY 1

Day 1 - Regular Expression入門

當前大家最為熟知的大型語言模型（Large Language Model，簡稱LLM）包括ChatGPT、Gemini、DeepSeek等，他們具有非常強大的運...

2025-09-15 ‧ 由 Carol 分享

0 Like 0 留言 206 瀏覽

DAY 2

Day 2 - Finite State Automata (FSA)

昨天介紹了Regular Expression（正規表達式），今天就來聊聊Regular Expression運作背後重要的機制：Finite State Au...

2025-09-16 ‧ 由 Carol 分享

0 Like 0 留言 449 瀏覽

DAY 3

Day 3 - Entropy（熵、資訊熵）

今天要來談談Entropy，中文為「熵」或「資訊熵」，從字面上看起來像是一個化學元素😁，幾乎完全無法推斷他到底是什麼東西。但其實Entropy的概念很簡單，簡...

2025-09-17 ‧ 由 Carol 分享

0 Like 0 留言 163 瀏覽

DAY 4

Day 4 - N-gram （上）

現在很紅的ChatGPT、Gemini、DeepSeek，他們都是「大型語言模型（Large Language Model）」，那大型語言模型到底是什麼？要回...

2025-09-18 ‧ 由 Carol 分享

0 Like 0 留言 139 瀏覽

DAY 5

Day 5 - N-gram（下）

接續昨天 N-gram 的介紹，今天來繼續講講 N-gram～～ The Markov Assumption（馬可夫假設）昨天有提到，如果要用「所有前文」來...

2025-09-19 ‧ 由 Carol 分享

0 Like 0 留言 159 瀏覽

DAY 6

Day 6 - TF-IDF：我在你心裡究竟是什麼地位

前幾天的標題我都只放了主題，今天突然靈光乍現，覺得用「我在你心裡究竟是什麼地位」這句話來比喻 TF-IDF 非常的貼切🤣 沒錯，TF-IDF 的核心概念，其實就...

2025-09-20 ‧ 由 Carol 分享

0 Like 0 留言 225 瀏覽

DAY 7

Day 7 - Vector Space Model（向量空間模型）：文字在空間裡的距離感

前一篇談到 TF、IDF、TF-IDF，這些方法都在想：「文字在一篇文章裡，到底有什麼地位？」今天要更進一步，把整個文本變成一個「數學世界裡的點」—— 這就是...

2025-09-21 ‧ 由 Carol 分享

0 Like 0 留言 170 瀏覽

DAY 8

Day 8 - Cosine Similarity：你我之間的夾角

昨天介紹 Vector Space Model（向量空間模型）時，有講到 Cosine Similarity（餘弦相似度），但只是輕輕帶過💨，今天就來深入了解...

2025-09-22 ‧ 由 Carol 分享

0 Like 0 留言 188 瀏覽

DAY 9

Day 9 - Bag-of-Words （BoW）

之前講到向量空間模型（Vector Space Model）跟 Cosine Similarity 時，都有談到把文本轉換成向量，電腦才能夠處理人類的語言。但...

2025-09-23 ‧ 由 Carol 分享

0 Like 0 留言 208 瀏覽

DAY 10

Day 10 - Word2Vec

這幾天陸續都有談到，要讓電腦能夠處理並理解人類語言的方式，就是要把文字轉換成數值，也就是「向量」。昨天的 Bag-of-Words Model 把文字轉換成向...

2025-09-24 ‧ 由 Carol 分享

Carol的鐵人檔案

Carol的收藏

Carol的追蹤

Carol的Like

Carol的紀錄

Carol的訂閱列表

鐵人檔案

AI、機器學習以及深度學習的語言學應用 系列

標記使用者

AI、機器學習以及深度學習的語言學應用系列