決策樹全名Decision tree,是將資料產生出一棵樹的樣子,它也是一個機器學習的的演算法,主要是將問題的做出分類,什麼意思呢?我就用兩張圖來告訴你。
主要結構圖長這樣:
如果你看完有大概的意思,那我做個舉例你馬上就看能看得懂了。
我們以今天天氣是否帶雨傘的問題做了一個樹狀結構圖,在天氣是陰天的情況下我們將是否帶雨傘的可能性分類完畢大致上會長這個樣子,根據我們人是否帶雨傘的各種情況都預測出來,這邊大致上講個大概。
但實際上程式自動從一堆樣本資料集中構造出這顆決策樹,接著這個程式會自動建立起一個決策樹,在這的過程也就是所說的機器學習的過程,那構造這棵決策樹的結果就是一個成功的模型,再來最後讓模型中輸入一些條件,就可以讓模型給出判斷結果。
由於決策樹模型常用於分類和回歸問題,所以大部分使用在機器學習與資料探勘裡面會比較常用。
如何建立起一個決策樹呢?
1.找尋資料欄位做為一個特徵點,然後當作上面結構圖的一個一個節點。
2.根據每個變數(舉例的話就是例句的是與否,但不一定每個分類問題都是,是與否。),找出做好的分割點。
3.找出最好的兩個分割點做為兩個節點。
4.重複步驟2與步驟3,直到找出所有資料的葉節點,即可完成決策樹。
那今天的內容講到這邊,謝謝觀看!!