這系列結束後,我將繼續挑戰IT鐵人30日:
佛心分享 : it 考照之路
主題:從摸索7個月到下定決心訂下3週後考試:自學取得PMP 3AT 執照
今天我們要談的是ML的supervised learning的不同於分類的另一種演算法,regression。將會介 紹simple linear regression vs multiple regression,之前談過的 logistic regression 雖名為迴歸其實是屬於分類,忘記的同學可以到day11去複習一下。對於supervised learning 不了解的同學可以翻閱一下 day 5去看一下前情提要,現在進入主題。
regression的起源與原理:
regression的數學式:
regression的程式碼:
在開始以前,請先觀察比較一下這兩張圖片的差異:
發現了嗎?左邊這張圖是x與y的二元圖例,而右邊則是多了一個x2,是x1,x2與y的三度空間圖例。還有左圖的紅點點中間有一條紅色的線,右邊的紅點點則是有一個紅色的平面。
regression的目地就是在左邊特徵x與target y 找出一條紅色的線,可以說明x與y的關係,因為是在2度空間,所以可以顯示x與y是線性關係,我們可以由x表示年紀,y表示所剩餘命(年數),看到呈現反比,也就是負相關。右邊的圖,我們可以以x1表示聰明才智,x2表示讀書時間,y表示考試成績,可以看見紅色的平面呈現正成長,正相關。x與y我們在day3 有解釋,不熟悉的同學,可以回去複習一下。
而simple linear regression 與 multiple regression的不同則在於特徵x的變數有幾個,大於1個以上通稱multiple regression。