iT邦幫忙

第 11 屆 iT 邦幫忙鐵人賽

DAY 27
0
自我挑戰組

機器學習入門系列 第 27

ML_Day27(相關係數簡介)

這個章節要介紹相關係數,相關係數是很常使用在特徵處理的部分,可以使我們了解特徵與目標之間的關係。相關係數衡量兩個隨機變量之間線性關係的強度和⽅向。雖然不是表⽰變數之間關係的最好⽅法,但可以提供我們很直觀的了解。以下是我參加機器學習百日馬拉松所練習的題目,因為簡單易懂,所以提供給想從入門的朋友參考。

https://ithelp.ithome.com.tw/upload/images/20191009/20116157UJw3ePkW2u.png

相關係數是⼀個介於 -1~1 之間的值,負值代表負相關,正值代表正相關,數值的⼤⼩代表相關性的強度
https://ithelp.ithome.com.tw/upload/images/20191009/20116157j2xBKyvU84.png

  • 弱相關
import numpy as np
import matplotlib
import matplotlib.pyplot as plt

np.random.seed(1)
x = np.random.randint(0, 50, 1000)
y = np.random.randint(0, 50, 1000)
np.corrcoef(x, y)
plt.scatter(x, y)

可以得到相關係數為array([[1., 0.00404702], [0.00404702, 1.]])
https://ithelp.ithome.com.tw/upload/images/20191009/20116157bfTHidaopP.png

  • 正相關
x = np.random.randint(0, 50, 1000)
y = x + np.random.normal(0, 10, 1000)
np.corrcoef(x, y)
plt.scatter(x, y)

可以得到相關係數為array([[1., 0.8218465], [0.8218465, 1.]])
https://ithelp.ithome.com.tw/upload/images/20191009/20116157fRuGroaUJK.png


上一篇
ML_Day26(類別型特徵處理)
下一篇
ML_Day29(手刻Gradient Descent)
系列文
機器學習入門28

尚未有邦友留言

立即登入留言