iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
AI & Data

AI、機器學習以及深度學習的語言學應用 系列

自然語言處理(NLP)對於各式各樣的模型來說至關重要。要先能夠運用程式語言來處理我們日常生活所用的語言,才能使大型語言模型(LLM)有更加精準的表現。
在這30天內,將從各式各樣的主題,像是基礎的Regular Expression,至BERT以及LLM,來去了解當今是如何運用AI、機器學習以及深度學習,來去處理、理解真實世界語料。

參賽天數 22 天 | 共 22 篇文章 | 0 人訂閱 訂閱系列文 RSS系列文 團隊美珠姨
DAY 11

Day 11 - Lesk Algorithm:讓我們來一起消除歧義

每個語言當中的某些單字存在「歧義」(ambiguity),也就是同一個單字有不同的意思,有些意思的本質相似,但是有些定義卻幾乎沒有任何關聯。 舉個經典的例子:...

2025-09-25 ‧ 由 Carol 分享
DAY 12

Day 12 - Decision Tree(決策樹)

前面幾天都在講一些處理語料的技術跟概念,一直講到模型,今天終於要邁入模型這一階段~(雖然之後可能還是會講到一些語料處理的東西😳) 模型也是有分不同的類型,今天要...

2025-09-26 ‧ 由 Carol 分享
DAY 13

Day 13 - Supervised、 Unsupervised、Semi-supervised Learning

昨天開始進入了模型,介紹了第一個機器學習模型(Machine Learning Model)— 決策樹(Decision Tree)。 回到昨天所舉的例子,我們...

2025-09-27 ‧ 由 Carol 分享
DAY 14

Day 14 - Naive Bayes Classifier(貝氏分類器)

前天從 Decision Tree 這個傳統的 Supervised 機器學習模型開始介紹,並在昨天有進一步講解 Supervised、Unsupervised...

2025-09-28 ‧ 由 Carol 分享
DAY 15

Day 15 - Named Entity Recognition (命名實體辨識)

其實在自然語言處理(NLP)裡面,有一個任務叫做 Named Entity Recognition(NER,中文譯作命名實體辨識或是專有名詞識別)。 NER 的...

2025-09-29 ‧ 由 Carol 分享
DAY 16

Day 16 - Hidden Markov Models(HMM)

昨天在講 Named Entity Recognition(命名實體辨識)的時候,有講到「Hidden Markov Model (HMM)」,但是沒有特別介紹...

2025-09-30 ‧ 由 Carol 分享
DAY 17

Day 17 - Part-of-Speech Tagging(POS Tagging)

昨天介紹 Hidden Markov Model(HMM)的時候,有稍微提到文本當中的「詞性」是我們看不到的東西,因此可以用 HMM 這種模型來去推測每個詞的詞...

2025-10-01 ‧ 由 Carol 分享
DAY 18

Day 18 - Beam Search Algorithm

當模型在生成文字時,每一步都會面臨很多可能的選項,而最終輸出的過程,就叫做解碼(decoding)。 Decoding 的核心問題就是從眾多可能的輸出當中選擇最...

2025-10-02 ‧ 由 Carol 分享
DAY 19

Day 19 - Cross-Validation(交叉驗證)

之前在介紹 Decision Tree(決策樹)的時候,有講到要把資料切成 80% 給模型訓練,20% 給給模型測試訓練結果,這是最基本的模型評估方法。 但,它...

2025-10-03 ‧ 由 Carol 分享
DAY 20

Day 20 - Cross-Entropy Loss Function

前面在介紹 Entropy(熵) 的時候,我們提到它可以用來衡量資料的不確定性和驚喜程度,而在 Decision Tree 裡,我們利用 entropy 來判斷...

2025-10-04 ‧ 由 Carol 分享