講人話就是一個包含多個決策樹的分類器,並且其輸出的類別是由個別樹輸出的類別的眾數而定。
當面對相同的問題時,為了避免單一特徵的重要性被過度放大而造成偏差,所以隨機挑選部分特徵來建構多棵決策樹,最後再利用投票的方式來決勝負,得出比單一決策樹更全面且正確的答案。隨機森林想解決的是決策樹泛化能力弱的缺點,因為決策樹只有一個決策的結果,這時,我就想起有人說過:「一個不夠?為什麼不吃兩個?」,同理可知,只要多建幾棵樹,就會有更多的結果,最終,只要將所有結果綜合起來,就可以進行投票決定最終答案了。至於為什麼叫做隨機森林?因為每棵樹都是從整個訓練樣本集中隨機選取固定數量的樣本及特徵集。