參賽的方向旨在為讀者探索資料科學的精髓,不僅講述理論知識,也強調實際操作的重要性,分享的內容包括資料清洗與分析、視覺化圖形、機器學習和深度學習,讀者將透過了解基礎知識並學習程式碼的運用,學會如何處理真實世界的數據以及建立預測模型,在未來有機會透過實作專案來應用所學,並提升自己的資料科學能力。
~今天要分享的是「隨機森林實作」~ 在理解了隨機森林的基本原理後來看看python程式碼如何實作的吧~ 隨機森林分析模型在sklearn的ensemble套件底...
~今天要分享的是「集成式學習」~ 集成式學習(Ensemble Learning),有些地方會翻譯成薈萃式學習,最重要的核心概念是:將多個機器學習模型組合在一起...
~今天要分享的是「KNN介紹」~ KNN是K-Nearest Neighbors的縮寫,中文譯作K-最近鄰居,此方法是一種監督式機器學習方式,可用於解決迴歸跟分...
~今天要分享的是「KNN實作」~ 理解了KNN的核心概念後來看看在Python中是如何撰寫程式碼來實作的吧~ KNN分析模型在sklearn的neighbors...
~今天要分享的是「模型參數挑選」~ 我們在製作機器學習模型時,並不是只有選取合適的方法這麼簡單,還要調整模型的參數讓模型的結果最佳化,這就是模型參數挑選的重要性...
~今天要分享的是「Kmeans介紹」~ Kmeans是一種非監督式機器學習方式,主要用於處理集群分析(聚類)的問題。Kmeans屬於分割式集群方式的一種,其核心...
~今天要分享的是「Kmeans實作」~ 瞭解了Kmeans的基本概念後,來看看在Python中是如何撰寫程式碼來做分析的吧~ Kmeans分析模型在sklear...
~今天要分享的是「常見錯誤總整理」~ 掌握了前面幾篇的觀念與重點後,恭喜大家往數據分析師的道路邁進了一大步。這篇文章我會整理自己之前做資料分析時,程式碼遇到的一...
~今天要分享的是「深度學習」~ 在鐵人賽最後的兩篇文章,我想向大家介紹深度學習的觀念,這部分在iPAS「中級巨量資料分析師」的考試中佔了10%的分數,所以大家也...
~今天要分享的是「DNN、CNN、RNN介紹」~ 在深度學習的模型中,最常見到的有DNN、CNN和RNN這三種模型,在這篇文章就來瞭解它們的原理吧! DNN(...