10月27日台北天氣微涼
既然由散布圖可以得知打擊率及上壘率是息息相關的~
那本篇我們就用回歸分析來看看到底有多相關吧!!
首先接續昨日的圖
#把每一隊皆用一種顏色表示
ggplot(A,aes(x = A$AVG , y = A$OBP )) + geom_point(aes(color = A$Team),size = 4)+
labs(x = "平均打擊率",y = "平均上壘率",title = "2012 MLB")+
xlim(c(0.233,0.275))+
ylim(c(0.294,0.338))+
geom_smooth(method = lm)
我們可以看到兩者呈現正相關,但要如何以數據來說明呢?
這時候我們使用R語言中的回歸
#迴歸分析
lm(應變數~自變數)
W = lm(A$OBP~A$AVG,data=A)
summary(W)
結果如下 :
稍微解釋一下
由圖可以得知 我的自變數 X = 打擊率 , 應變數 Y = 上壘率
其方程式 : Y = 0.78434X + 0.11935
R^2 = 0.7674
代表著其實這兩者的關係是非常密切的!
如果我們要看這條方程式是不是可以合理解釋這兩個變數 , 我們可以藉由第一個紅框中的第二排最後的 梅花 * 來看
其梅花越多代表著解釋力越強
可能解釋的不太好,如有大大有更棒的解釋請不吝賜教拉 XD
End.