iT邦幫忙

鐵人檔案

2022 iThome 鐵人賽
回列表
AI & Data

文理組人都能上手的入門 NLP(自然語言處理) 系列

由語言學專業的學生撰寫之自然語言處理學習筆記
從語言學的角度看機器學習及深度學習之應用
以淺顯易懂的方式解析語言學及AI之間的關係
從文字資料的處理出發到模型的訓練及應用
並以python示範
希望不管是文組人還是理組人都能藉此理解自然語言處理之概念

鐵人鍊成 | 共 31 篇文章 | 24 人訂閱 訂閱系列文 RSS系列文 團隊KnULPers_from_NCCU
DAY 20

[Day 20] 監督式機器學習模型:找那個逃跑空間最大的地方龜就對了!-支持向量機(Support Vector Machine)

  大家早安!歷經了四天針對經典監督式機器學習模型的了解,我們也算是小~小~的踏進NLP世界裡了。如果把這比喻成FPS(第一人稱射擊遊戲)的話,大概就是開局撿完...

2022-10-05 ‧ 由 fish_in_bed 分享
DAY 21

[Day 21] 監督式機器學習模型:掌握賺大錢的關鍵-實作SVM & 文本情感分析(Sentiment Analysis)

  午安各位~昨天講解完支持向量機(Support Vector Machine)的原理之後,今天要用推特上面對不同產品的評價來進行文本情感分析。會需要做這件事...

2022-10-06 ‧ 由 fish_in_bed 分享
DAY 22

[Day 22] 機器學習好朋友:到底誰是模型的真朋友?- 特徵重要性(Feature Importance)

  大家早安,昨天示範了國民好兄弟SVM實作跟比較進階的文本情感分析方式。但是做出來的時候結果不是很好,所以我在文章結束的時候留了一個懸念(其實就是我太懶而已)...

2022-10-07 ‧ 由 fish_in_bed 分享
DAY 23

[Day 23] 機器學習好朋友:驚不驚喜?意不意外?-資訊熵(Entropy)與NLP

  大家午安~講了那麼多天模型訓練,想必大家應該都有點膩了吧?今天就來點不一樣的(其實是為了明天鋪路)。在之前的文章裡面,我們提到很多計算詞頻的方法跟變體,但是...

2022-10-08 ‧ 由 fish_in_bed 分享
DAY 24

[Day 24] 監督式機器學習模型:不需要100分也可以騎上獨角獸-決策樹(Decision Tree)與隨機森林(Random Forest)

  大家午安~今天要跟大家介紹這個系列的最後兩種監督是機器學習模型-決策樹(Decision Tree)跟隨機森林(Random Forest)。不知道大家還記...

2022-10-09 ‧ 由 fish_in_bed 分享
DAY 25

[Day 25] 監督式機器學習模型:踏出環保第一步-實作決策樹(Decision Tree)與隨機森林(Random Forest)

  午安各位!昨天介紹過決策樹跟隨機森林的原理之後,今天我們要來實做這兩個模型。因為昨天有提到這兩種模型可以做不只兩種類別的分類,所以今天我們就跟上次一樣用,用...

2022-10-10 ‧ 由 fish_in_bed 分享
DAY 26

[Day 26] 漩渦鳴人與影分身之術-神經網路(Neural Network)與深度學習(Deep Learning)

  大家午安~本系列文章終於進入最後五天,我們也終於要開始認識現在最流行的機器學習方式-深度學習了。本來是計畫可以連實作一起分享的,但光是概念理解就已經夠要命了...

2022-10-11 ‧ 由 fish_in_bed 分享
DAY 27

[Day 27] 深度學習模型:文字向量的減肥之路-word2vec

  經歷昨天對神經網路跟深度學習的講解,不知道大家還好嗎?今天要順著上一篇的內容來講講深度學習可以怎麼應用在NLP上面。   當初在介紹詞袋模型的時候,我們提到...

2022-10-12 ‧ 由 fish_in_bed 分享
DAY 28

[Day 28] 深度學習模型:該長點記性了吧-循環神經網路(RNN)

  大家晚安~今天要繼續講解深度學習在NLP領域的應用。開始之前讓我們先再次呼喚最default的神經網路模型出來:   這是最經典簡單的深度神經網路模型,我...

2022-10-13 ‧ 由 fish_in_bed 分享
DAY 29

[Day 29] 深度學習模型:會忘記東西的才叫人吧-長短期記憶(LSTM)

  大家午安~昨天講解RNN的時候提到RNN的缺點就是容易產生梯度消失或梯度爆炸的問題,所以今天要介紹為了解決這兩個問題而產生的RNN變體-長短期記憶(Long...

2022-10-14 ‧ 由 fish_in_bed 分享