分享至
各位大佬好,最近正在研究特徵篩選的嵌入法,在模型建置階段會使用到三種演算法包括隨機森林、XGBoost和CatBoost。而在特徵篩選實作嵌入法若採用基於樹的演算法例如隨機森林,此時的流程是先藉由隨機森林經超參數最佳化後,再去看特徵重要程度,接著再依照自己設定的閾值將重要的特徵作為最終的特徵子集,最後交由三種演算法進行訓練及調參。我想請問這樣的思路是否正確,謝謝!
已邀請的邦友 {{ invite_list.length }}/5
不見得要搞那麼複雜吧直接挑個tree based model train完看feature importance也行
IT邦幫忙