本業主要是資料工程師,但會參雜一點數據分析跟視覺化的工作,覺得已經會了python但不會machine learning像是買了一把好劍但不會戰鬥一樣,所以打算善用30天的學習挑戰!內容會參雜一些工作上會用到的視覺化內容
Logistic回歸是尋找最優化算法的方法,主要是利用Sigmoid函式去判斷要被預測的點屬於哪一個分類。大家應該很熟悉回歸的公式,而該算法是透過把每個feat...
要注意在LogisticRegression中的solver,裡頭可以選‘newton-cg’, ‘lbfgs’, ‘liblinear’, ‘sag’, ‘s...
支持向量機Support Vector Machines, SVM主要是在找出最佳的分類模型。 以下是書中(連結)範例的散佈圖,截自這裏 可以看到圖A有紅、藍兩...
以下例子是用SVC來進行的~ 一樣是沿用scikit-learn的乳癌資料庫,步驟跟之前的一樣,要注意svm.SVC要給兩個參數(參考),一個是C,懲罰分錯的w...
當要使用SVM將資料分成多類時,有兩種方法,一種是一對一,另外一種是一對多。以下是介紹一對一的方式,當有n個features時,會建立(n * n-1)/2個分...
元算法(meta-algorithm)是對其他算法進行組合,意思就是會對數據進行多重的抽樣,將數據分配給不同的模型分類器後,再收回來整合。 對於數據隨機抽樣...
來穿插一下工作上應用到的視覺化技能其實我是寫python的,前陣子才開始玩PowerBI,PowerBI雖然支援Python,但是對於matplotlib畫的地...
之前有提過的Logistic Regression是被分類在「classification」分類的功能中,而線性回歸或是多變數線性回歸等等是被分類在「predi...
今天來用scikit-learn實作一下線性迴歸這次我們試試看boston這個資料庫(連結)boston這個資料庫中有波士頓房價與一些因素,例如與上班區域的距離...
接下來介紹scikit-learn的第二個回歸模型--脊回歸Ridge Regression由於前天連結介紹透過均方誤差的算法,但如果數據集存在多重線性關係,均...