[圖片參考 :](https://scitechvista.nat.gov.tw/Article/c000009/detail?ID=8f92230f-e9ad-42b4-9952-d1ecb4f51cf1)
decision tree:的基本概念是從資料結構的「樹」而來的,想像一棵樹倒著長,樹根(root)在最上頭,
我們可以以一張圖來表示,上圖的每個-橢圓形表示每一個節點(node),香蕉的顏色就是root,綠色與黃色就是樹枝,綠色與黃色的node就是root 的子節點,root則為它們兩個的父節點,綠色與黃色互為兄弟節點,太熟與剛好熟則為則為root的孫節點,因為底下再無節點,又稱樹葉(leaf),為綠色與黃色的子節點。
day4我們有談到decision tree的目標是information gain,「最大增益」這是什麼呢?
就是我們day3所提到由提供身高與體重的資訊讓電腦去猜測是男還是女的機率比較可能接近正確值。第一代(root)由身高是否大於(180公分)區分,分成左右兩棵子樹,第二子代由體重是否大於(75公斤),-區分左右兩棵子樹,小於75公斤為女生,大於為男生。
上面提到root是否大於180公分,與是否大於75公斤就是最大增益,是電腦自己計算出來用來區分男生或女生的最佳特徵分割點。
先有一個概念,明天我們會用更實際的範例說明。
未來5日我們要談的是: