還記得我們所說的,監督式機器學習是需要「正確答案」的,因此反過來說,非監督式機器學習就是不需要給定一個正確答案,那沒有正確答案要預測什麼呢? 非監督式機器學習在...
介紹完機器學習最主要的兩種類型之後,接著就是對於模型更進一步改進的介紹了,本部分最主要解釋的是整體學習(ensamble learning)的想法。 弱學習器與...
接下來要介紹的是數據競賽中最常見到的兩個模型,xgboost以及lightgbm。這兩個模型都是基於前一篇文章所提到的Boosting演算法,基於決策樹來形成的...
我們都知道機器學習最常見的指標就是準確程度,不論是迴歸類型的模型還是分類的模型,都有衡量準確度的方法,但是在一般的場合裡,我們是不會有正確的答案可以提供驗證的,...
在上一章節我們提到,實作模型的過程需要在變異與偏誤之間權衡,本章我們就延續之前使用的糖尿病資料集,搭配sklearn提供的函式來進行簡單的交叉驗證吧! 驗證集的...
上一篇在交叉驗證的過程中,提到超參數的計算是使用窮舉法,因此要設定好參數的區間,來在訓練的過程中對參數進行測試。而在這次使用中我參考了本篇文章:LightGBM...
知道許多機器學習的知識之後,想必各位一定會想要有些實戰的經驗,在這裡我推薦兩個我自己常使用的競賽平台,有興趣參加競賽的讀者可以到這些平台參加競賽累積經驗。 T-...
雖然kaggle平台上的比賽難度以及競爭者的實力都較強,但是kaggle提供late submission讓沒參與到競賽的人也可以練習自己的訓練成果,並且最重要...
為方便讀者使用以及回顧舊文章當中的程式碼有需要的讀者可以至https://colab.research.google.com/drive/1kH--E0gj1e...
匯入與觀察資料 from google.colab import drive drive.mount('/content/gdrive') train = pd...