嗨嗨~今天的主題相對比較簡單,就是要教大家用文字雲 (word cloud)的方式來呈現資料裡的關鍵詞!大家應該多多少少都有看過文字雲吧~?就是像下圖這樣,由一...
嗨嗨大家~ 不知道大家昨天有沒有自己玩了一下文字雲,應該挺有趣的吧☺️其實最主要希望大家快熟悉一下在做自然語言處理的時候前面的流程,那大家還記得在資料處理完後的...
嗨嗨大家~昨天我們介紹了SVM 模型,主要運作原理是可以透過一條線將資料分類,我們也有說到,還有很多模型是可以來做分類任務的,所以今天我們就要繼續我們的模型之旅...
嗨嚕~大家午安呀!這兩天我們講了傳統機器學習中很經典的兩個模型,希望在介紹過程中大家都有對模型以及整個訓練過程加減了解一些,那我們今天一樣要繼續介紹另一個常被提...
安安!前幾週我們介紹完如何訓練模型以及知道了大致流程會怎麼做,但訓練完就結束了嗎?當然不是啦~順練的模型再fancy、加入的特徵再好我們也必須要驗收評估模型才知...
嗨嚕大家~轉眼這個鐵人賽已經剩下一半啦!實在是有夠快(跟自己說聲加油) 昨天雖然跟大家說,了解模型評估之後差不多就已經了解整個模型訓練的流程,但要讓模型表現更穩...
嗨嗨大家~昨天我們講到模型訓練的整個流程中,其實有非常多地方是我們可以選擇、優化的。像是昨天提到的切分訓練集跟測試集就可以再多一步做交叉驗證,目的就是檢查模型的...
呦呼~ 大家早安!今天要來介紹的主是N-gram,也是一種可以用來統計詞頻的方式,也可以算是最初代語言模型的一種!我們昨天有提到Bag Of Words 他的缺...
嗨呦!今天我們要繼續昨天有講到的N-gram 昨天我們提到 N-gram很常被用來計算句子的機率甚至預測下一個詞。但昨天也有根大家提到他有一些限制,那就是如果某...
嗨嚕~前幾篇的內容中,我們很常提到,電腦其實看不懂文字,所以我們必須把文字轉成數值向量,才能進行後續的分析或建模。而這種「文字轉向量」的方法有很多,早期常見的有...