介紹降維顧名思義為把高維度降到低維度,也可以把它想成是壓縮數據。降維是機器學習中的一個重要課題,有時候數據太大會造成運算時間過久,佔用內存,所以把數據做降維後...
介紹在開始介紹XGBoost之前,我們先來了解一下什麼事Boosting? 所謂的Boosting 就是一種將許多弱學習器(weak learner)集合起...
簡單回顧之前在介紹 Gradient Descent 及 ML入門(十五)Regularization(Solving overfitting)都有提到,在做...
機器學習演算法學得好不好,其中一個關鍵是數據及資料的品質。所以要對資料做預處理,能夠幫助我們構建更好的機器學習模型。 處理數據缺失現實中常會因為各種原因,造成數...
這個章節要介紹如何對離群值做處理,以下是我參加機器學習百日馬拉松所練習的題目,因為簡單易懂,所以提供給想從入門的朋友參考。 所謂離群值就是,如果只有少數幾筆資料...
這個章節要介紹類別型特徵處理,要訓練模型時,data必須要是數值形式,所以要將類別型的特徵進行轉換,以下是我參加機器學習百日馬拉松所練習的題目,因為簡單易懂,所...
這個章節要介紹相關係數,相關係數是很常使用在特徵處理的部分,可以使我們了解特徵與目標之間的關係。相關係數衡量兩個隨機變量之間線性關係的強度和⽅向。雖然不是表⽰變...
由於由於在ML_Day4(Perceptron感知器模型)有講過Perceptron,做法其實很類似,指示修改fit方法。 import numpy as np...