iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
自我挑戰組

Python資料分析學習地圖 系列

從零開始如何利用Python來進行資料分析,依序紀錄 python 操作、資料視覺化、資料庫操作以及基礎機器學習知識和 Git 指令。

鐵人鍊成 | 共 30 篇文章 | 30 人訂閱 訂閱系列文 RSS系列文
DAY 21

Day 21 : SVM

原理說明 SVM (support vector machine 支援向量機),是在特徵空間中找到一個分離超平面,也就是「決策邊界」(decision boun...

DAY 22

Day 22 : 決策樹

決策樹(Decision trees)是一種過程直覺單純、執行效率也相當高的監督式機器學習模型,適用於classification 及 regression 資...

DAY 23

Day 23 : 集成式學習

接下來的要介紹一個很重要的模型觀念 - 集成式學習。俗話說的好,三個臭皮匠勝過一個諸葛亮,而在機器學習又是怎麼應用呢?讓我們一起探索吧! 集成式學習 集成式學習...

DAY 24

Day 24 : 隨機森林

原理 昨天有提到 Bagging 最有名的例子就是隨機森林,它是集合多棵決策樹來進行預測,很多樹就成為了森林,稱之為隨機森林。每一棵樹只能看見部分特徵,但透過多...

DAY 25

Day 25 : XGBoost

極限梯度提升 eXtreme Gradient Boosting(XGBoost) ,被稱為 Kaggle 競賽神器,常常第一名都是使用這個演算法。先來前情提要...

DAY 26

Day 26 : LightGBM 與 GridSearch

LightGBM GBDT(Gradient Boosting Decision Tree) 是利用弱分類器迭代訓練來得到最佳的模型,而 LightGBM(Li...

DAY 27

Day 27 : 模型解釋 Shap

在經過集成式學習(ensemble learning)之後的 tree based (像是 Random Forest, XGBoost, LightGBM)...

DAY 28

Day 28 : Git

1. 為什麼要學 Git,可以做什麼呢? 學習到現在大家一定累積很多的程式碼或是各式的檔案,如何去做有效的控管其實是非常重要! 想像有個情境是你上線了一段程式碼...

DAY 29

Day 29 : FastAPI 讓模型上線

我們通常會建立一個服務來讓模型上線,但在上線前,有一些基本的網路知識需要先了解。因此前面會先淺談網路,後面會介紹 FastAPI 來部署模型。 淺談網路 超文本...

DAY 30

Day 30: 完賽總結

終於完賽啦! 這次挑戰賽僅聚焦於結構化資料的資料分析,非結構化資料(圖片聲音影片等等),就需要用到深度學習,有興趣的大家可以再深入研究。也謝謝大家看完這30天的...