將資料化為資訊：Inferring rudimentary rules

DAY 12

鐵人賽 notes data mining information

4347 瀏覽

# 簡單至上，1-rule, 1R
就如同這個方法的名字一樣，使用一個屬性（attribute）來做分類，產生一個只有一層的決策樹。
1R 簡單、低成本，但別看它這麼簡單，據說在實際的資料分析上往往有出人意表的精准度。

另外 1R 也很常被用來做一個最初的分析，看看資料大概的分佈是什麼樣子。

1R 的實作流程如下：

就這樣，直覺，簡單 XD

拿資料來說明，由於我有點懶得自己準備資料，就拿書上一直出現的天氣資料來用吧...（Weka 裡面也有這資料，拿來用應該沒關係吧 :o ）
我們的目標是，判斷一個日子適不適合玩（play），然後我們已經神秘地取得了以下資料：

接著我們使用 1R ，可以建出以下表格：

記得，rule 中，屬性值決定的分類結果是由種類出現的數量來決定的，以數量最多的來作為主要分類，另外如果遇到數量相同時，隨機選一個吧 :v 。

經過了複雜的運算，我們可以得知以 outlook 或 humidity 來做為 1R 分類的屬性時，錯誤率最低，因此我們可以考慮用兩者其中之一來作為分類依據。

下次再說說 1R 在使用上的其他問題吧

系列文

Data Mining 學習路：概念、技術與工具共 16 篇

11 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

立即登入留言

IT邦幫忙