iT邦幫忙

鐵人檔案

2019 iT 邦幫忙鐵人賽
回列表
自我挑戰組

資料工程師的Machine Learning/工作學習歷程 系列

本業主要是資料工程師,但會參雜一點數據分析跟視覺化的工作,覺得已經會了python但不會machine learning像是買了一把好劍但不會戰鬥一樣,所以打算善用30天的學習挑戰!內容會參雜一些工作上會用到的視覺化內容

參賽天數 20 天 | 共 20 篇文章 | 27 人訂閱 訂閱系列文 RSS系列文
DAY 11

[第11天]LogisticRegression-1

Logistic回歸是尋找最優化算法的方法,主要是利用Sigmoid函式去判斷要被預測的點屬於哪一個分類。大家應該很熟悉回歸的公式,而該算法是透過把每個feat...

2018-10-11 ‧ 由 nora1171 分享
DAY 12

[第12天]LogisticRegression-2

要注意在LogisticRegression中的solver,裡頭可以選‘newton-cg’, ‘lbfgs’, ‘liblinear’, ‘sag’, ‘s...

2018-10-12 ‧ 由 nora1171 分享
DAY 13

[第13天]支持向量機SVM-1

支持向量機Support Vector Machines, SVM主要是在找出最佳的分類模型。 以下是書中(連結)範例的散佈圖,截自這裏 可以看到圖A有紅、藍兩...

2018-10-13 ‧ 由 nora1171 分享
DAY 14

[第14天]支持向量機-2

以下例子是用SVC來進行的~ 一樣是沿用scikit-learn的乳癌資料庫,步驟跟之前的一樣,要注意svm.SVC要給兩個參數(參考),一個是C,懲罰分錯的w...

2018-10-14 ‧ 由 nora1171 分享
DAY 15

[第15天]支持向量機-3

當要使用SVM將資料分成多類時,有兩種方法,一種是一對一,另外一種是一對多。以下是介紹一對一的方式,當有n個features時,會建立(n * n-1)/2個分...

2018-10-15 ‧ 由 nora1171 分享
DAY 16

[第16天]AdaBoost元算法

元算法(meta-algorithm)是對其他算法進行組合,意思就是會對數據進行多重的抽樣,將數據分配給不同的模型分類器後,再收回來整合。 對於數據隨機抽樣...

2018-10-16 ‧ 由 nora1171 分享
DAY 17

[第17天]PowerBI + R畫地圖

來穿插一下工作上應用到的視覺化技能其實我是寫python的,前陣子才開始玩PowerBI,PowerBI雖然支援Python,但是對於matplotlib畫的地...

2018-10-17 ‧ 由 nora1171 分享
DAY 18

[第18天]回歸--線性回歸

之前有提過的Logistic Regression是被分類在「classification」分類的功能中,而線性回歸或是多變數線性回歸等等是被分類在「predi...

2018-10-18 ‧ 由 nora1171 分享
DAY 19

[第19天]回歸--線性回歸-2

今天來用scikit-learn實作一下線性迴歸這次我們試試看boston這個資料庫(連結)boston這個資料庫中有波士頓房價與一些因素,例如與上班區域的距離...

2018-10-19 ‧ 由 nora1171 分享
DAY 20

[第20天]回歸--脊回歸(Ridge Regression)

接下來介紹scikit-learn的第二個回歸模型--脊回歸Ridge Regression由於前天連結介紹透過均方誤差的算法,但如果數據集存在多重線性關係,均...

2018-10-20 ‧ 由 nora1171 分享