前面提到了怎麼標記文章的好壞,以及我們打算使用的分類演算法,接下來要先講一下把文字轉成數值 (Arff, attribute-relation file for...
在前面一直提到我們得到的 PTT 文章都是文字呈現,那怎麼讓電腦也看得懂呢?因為最終的計算是個兩類別的分類問題,所以這邊我們把所有的文章轉成數值,也就是每一篇文...
# 分析檔案的第一步 準備輸入檔案是任何分析的第一步,但並不是把想要的研究的資料湊在一起就好, 除了必須依照程式的規格來建構檔案,也因為現實中的資料往往存在著各...