準備語料
取得語料的方式 {getting-corpus}
做文字探勘之前要先有語料,以下介紹幾種取得中文語料的方式。
公開資料
維基百科中文版:維基百科是...
昨天 DAY 15 談的是如何開發 macro。今天要聊的是在 dbt 如何安裝及使用 packages,使用別人寫好的 macro。
dbt Packages...
完賽心得
第一次參加鐵人賽,平安度過了~自己有個習慣就是會把有關非學術類的東西都用電子筆記在記,像是使用HackMD、OneNote等等,所以其實也算已經事先囤...
S2TT(Speech-to-Text Translation)為將語音轉為文本的模型,轉譯語言可以選擇。不管是輸入及輸出都可以選擇語言,所涵蓋的語言代號請參考...
NoSQL 資料庫
一種使用多種資料模型的資料庫系統
簡單說明:NoSQL資料庫是一種非關聯式的資料庫,它就像一個厲害的圖書館員/書店店員,可以用很多種方式...
條件機率的ML變形~~
樸素貝葉斯(Naive Bayes)是一種基於貝葉斯定理和特征條件獨立假設的分類算法。它的“樸素”體現在假設所有特征都是相互獨立的,這意...