前一次講到赤池信息量準則(AIC)
貝氏信息量準則(Bayesian Information Criterion, BIC)與它很像
只是增加了一些懲罰項
BIC與AIC互相比較
可以看出最大的不同就是懲罰項
AIC 僅考慮了選擇的特徵子集大小
而 BIC 除了考慮特徵子集的大小外,還考慮了訓練樣本數 n 的大小
因為當訓練樣本越多時,如果希望模型簡單只能降低特徵子集的大小
我認為
AIC 是為了未來的預測,希望模型簡單,故只考慮特徵子集作為懲罰項
BIC 是更加考慮了「現在」,認為數量夠多時
應該只需要少量的特徵就能重現,故用訓練數量箝制了特徵子集