第十四屆 優選

ai-and-data
文理組人都能上手的入門 NLP(自然語言處理)
fish_in_bed

系列文章

DAY 11

[Day 8.5] 時間都去哪了?資料前處理:客製化你的專屬函式-function

  一個大糟糕,突然發現排schedule的時候沒有排到要教function怎麼用。但是這個東西又非常之方便,不講一下真的不行,所以只好來個第8.5天幫自己加班...

DAY 12

[Day 11] 時間都去哪了?資料前處理:聽懂進階人話的關鍵-詞性標註

  大家早安,不知知覺竟然已經完成鐵人賽的三分之一,真的是太快了。快到我的存稿都沒了從今天開始大概率每天都是最新鮮的文章了XDD 希望我可以順利完成。   回到...

DAY 13

[Day 12] 時間都去哪了?資料前處理:抓住那個欠錢不還的傢伙-詞性標註之HMM的應用

  早安大家,昨天講解了詞性標註在NLP領域的重要性跟怎麼實作之後,今天要介紹詞性標註背後的隱藏式馬可夫模型(HMM)到底是運用什麼原理在運算。應該會是這個系列...

DAY 14

[Day 13] 資料視覺化實作:把斷詞結果變成比文字雲更酷炫的文字狗跟文字小新

  早安各位,今天是還債日。之前在講斷詞斷句的時候有提到要出一個文字雲教學,但是因為時間安排的關係就被移到今天了。廢話不多說,大家應該都看過文字雲吧?就是下面那...

DAY 15

[Day 14] 機器學習常用特徵:超級變變變 -BOW 詞袋模型

  諸位早安,我們終於結束漫長的資料前處理教學了。之前在講前處理的過程中,我一直提到電腦很笨,只認得數字的事情,大家應該還記得吧。問題來了,我們到底要怎麼把文字...

DAY 16

[Day 15] 機器學習常用特徵:詞頻的皇親國戚-N-Gram & TF-IDF

  哈囉~雖然資料前處理的階段已經結束了,產出今天要介紹的各位皇親國戚應該還算是在前處理的範圍內,畢竟特徵萃取不太能算在模型訓練的一環,好吧反正他們就是地位尷尬...

DAY 17

[Day 16] 監督式機器學習模型:他是騙砲仔還是你的真愛?-單純貝式分類器(Naive Bayes)

  哈囉大家,今天終於要正式進入模型訓練的階段了,真是可喜可賀,可喜可賀。雖然現在各種fancy的深度學習模型都非常強大,也能達到比機器學習還要好很多的成效,但...

DAY 18

[Day 17] 監督式機器學習模型:傻白甜女主與她的包包-實作單純貝式分類器(Naive Bayes)與詞袋模型(Bag of Words)

  午安~昨天介紹了貝式分類器的原理之後,今天就要在python裡面實際操作一次看看,也順便把之前還沒講解怎麼實作的詞袋模型當成特徵一起示範。事不宜遲我們馬上開...

DAY 19

[Day 24] 監督式機器學習模型:不需要100分也可以騎上獨角獸-決策樹(Decision Tree)與隨機森林(Random Forest)

  大家午安~今天要跟大家介紹這個系列的最後兩種監督是機器學習模型-決策樹(Decision Tree)跟隨機森林(Random Forest)。不知道大家還記...

DAY 20

[Day 18] 監督式機器學習模型:身世之謎與自我追尋-羅吉斯迴歸(Logistic Regression)

  大家早安,今天要帶大家認識第二個監督式機器學習的經典模型-羅吉斯迴歸(Logistic Regression)。雖然羅吉斯迴歸叫做羅吉斯迴歸,但他其實不是迴...