iT邦幫忙

鐵人檔案

第 11 屆 iThome 鐵人賽
回列表
AI & Data

Python機器學習介紹與實戰 系列

由基礎的環境建置教學到簡單解釋機器學習
並使用kaggle上的資料集帶領讀者實戰
並結合團隊的專案將實做結果呈現於網頁

鐵人鍊成 | 共 30 篇文章 | 53 人訂閱 訂閱系列文 RSS系列文 團隊Bikini Bottom
DAY 11

DAY[11]-機器學習(2)非監督式機器學習

還記得我們所說的,監督式機器學習是需要「正確答案」的,因此反過來說,非監督式機器學習就是不需要給定一個正確答案,那沒有正確答案要預測什麼呢? 非監督式機器學習在...

2019-09-26 ‧ 由 Austin 分享
DAY 12

DAY[12]-機器學習(3)整體學習

介紹完機器學習最主要的兩種類型之後,接著就是對於模型更進一步改進的介紹了,本部分最主要解釋的是整體學習(ensamble learning)的想法。 弱學習器與...

2019-09-27 ‧ 由 Austin 分享
DAY 13

DAY[13]-機器學習(4)競賽常勝軍(xgboost&lightgbm)

接下來要介紹的是數據競賽中最常見到的兩個模型,xgboost以及lightgbm。這兩個模型都是基於前一篇文章所提到的Boosting演算法,基於決策樹來形成的...

2019-09-28 ‧ 由 Austin 分享
DAY 14

DAY[14]-機器學習(5) 變異(variance)與偏誤(bias)

我們都知道機器學習最常見的指標就是準確程度,不論是迴歸類型的模型還是分類的模型,都有衡量準確度的方法,但是在一般的場合裡,我們是不會有正確的答案可以提供驗證的,...

2019-09-29 ‧ 由 Austin 分享
DAY 15

DAY[15]-機器學習(6)交叉驗證

在上一章節我們提到,實作模型的過程需要在變異與偏誤之間權衡,本章我們就延續之前使用的糖尿病資料集,搭配sklearn提供的函式來進行簡單的交叉驗證吧! 驗證集的...

2019-09-30 ‧ 由 Austin 分享
DAY 16

DAY[16]-機器學習(7)超參數調整

上一篇在交叉驗證的過程中,提到超參數的計算是使用窮舉法,因此要設定好參數的區間,來在訓練的過程中對參數進行測試。而在這次使用中我參考了本篇文章:LightGBM...

2019-10-01 ‧ 由 Austin 分享
DAY 17

DAY[17]-競賽平台介紹

知道許多機器學習的知識之後,想必各位一定會想要有些實戰的經驗,在這裡我推薦兩個我自己常使用的競賽平台,有興趣參加競賽的讀者可以到這些平台參加競賽累積經驗。 T-...

2019-10-02 ‧ 由 Austin 分享
DAY 18

DAY[18]-練習推薦平台Kaggle

雖然kaggle平台上的比賽難度以及競爭者的實力都較強,但是kaggle提供late submission讓沒參與到競賽的人也可以練習自己的訓練成果,並且最重要...

2019-10-03 ‧ 由 Austin 分享
DAY 19

DAY[19]-總整理與程式碼

為方便讀者使用以及回顧舊文章當中的程式碼有需要的讀者可以至https://colab.research.google.com/drive/1kH--E0gj1e...

2019-10-04 ‧ 由 Austin 分享
DAY 20

DAY[20]-Kaggle實戰-資料前處理與EDA

匯入與觀察資料 from google.colab import drive drive.mount('/content/gdrive') train = pd...

2019-10-05 ‧ 由 Austin 分享