iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 16
0

對於數值型的模型來說
當我們要進行預測時
最簡單的預測
就是猜下一個出現的是之前觀測的平均值 https://chart.googleapis.com/chart?cht=tx&chl=%5Cbar%20%7By%7D

如果我們所做出來的模型會比直接猜平均值還要好
這種表現將會反映在變異上
而決定係數(coefficient of determination, https://chart.googleapis.com/chart?cht=tx&chl=R%5E2) 就是在說變異量被模型解釋了多少

直接猜 https://chart.googleapis.com/chart?cht=tx&chl=%5Cbar%20%7By%7D 的模型變異量
SSTotal
做出來的模型變異量
SSRegression
模型解釋力
R-squared

通常 https://chart.googleapis.com/chart?cht=tx&chl=R%5E2 超過 0.7 就算很高的解釋力了!!


但是 https://chart.googleapis.com/chart?cht=tx&chl=R%5E2 也有缺點
就是他一定會隨著特徵的增加而變大
所以除了看 https://chart.googleapis.com/chart?cht=tx&chl=R%5E2 還會再用看調整 https://chart.googleapis.com/chart?cht=tx&chl=R%5E2


這裡的 n 是指全特徵集大小, k 是指挑選的特徵子集大小
當所選擇的特徵越多時
懲罰項的影響力越大,可以避免過度膨脹


上一篇
[Day 14] MSE 與 MAE
下一篇
[Day 16]赤池信息量準則(AIC)
系列文
主管可能很機車,但數學不會,數學不會就是不會:盡學渣之力說數學原理30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言