分類器 .. 應該是要講 氣死人的 "氣" 上一篇提到我們會使用這三個監督式的分類演算法: 支持向量機 (Support Vector...
今天來講一下分類器評估的方式。 一般常見的評估法 (evaluation) 有蠻多資料可以參考,在這裡就是快速的說而已,並不會琢磨太多。主要要講解的會是我們採用...
前面提到了怎麼標記文章的好壞,以及我們打算使用的分類演算法,接下來要先講一下把文字轉成數值 (Arff, attribute-relation file for...
前一天我們做了初步的測試,得到了一個鳥鳥的結果,正確率幾乎只有跟丟銅板差不多。這樣的結果實在讓人無法接受,因此想了幾個方法來改善這個問題。 分類問題可以依據幾...
這邊要講怎麼改善資料的辨識。 什麼叫做資料的辨識? 前面一直提到說所有的資料是靠人工標記後當作之後使用的資料集,那在標記的過程中常常遇到一些狀況是包括哪些呢?以...
前面用三種分類計算得到的結果非常令我不甚滿意,於是只好想辦法怎麼修正這個問題。 好啦,坦白說、其實也沒有什麼招數 ? 就我所知的部分,分類器要改善最終的辨識率時...
上一篇想辦法去改善分類演算法但似乎改善幅度不高,正所謂山不轉路轉,如果分類器改善不了,那何不來改善一下資料面的問題呢? 針對資料的部分我們會用以下三種方式重新處...
資料降維其實對於分類計算還蠻用的,所以這一篇來講一下我們怎麼降低資料維度然後達到提升分類正確率提升。資料降維這個動作也可以被稱為特徵選取 (feature se...
在前面四天我們依序提到了改善資料分類的方式,從最原始的資料處理到後來的分類演算法和資料降維,所有的目的當然是希望所有的結果可以驗證最原始提出概念:從 PTT...
終於第 30 天了,也就是說終於可以脫離文章地獄 ? 最後一篇不要寫技術了,來講講心得。(看之前大家不都這樣嗎?) 這一次寫的主題其實兩年前就想做了,去年一整...