上次說到用一個等價類 U/P 去逼近另一個等價類 U/Q
可以把它看成是在特徵子集 Q 之下
能被特徵子集 P 完整細分多少
那我們如何量化這個細分的程度呢
我們之前有說過
用 U/P 去逼近 U/Q 時
我們會製造 POS, NEG, BND 三個集合
分別代表了內部、外部、邊界
內部 POS 中的元素
代表在特徵子集 Q 之下可以被特徵子集 P 完全分開
所以我們可以用這個量化細分的程度如下
公式上一目瞭然
這個量化的方法就是「能被完全分類的元素佔所有樣本的比例」
並將其記為
當 k = 1 時,表示特徵子集 P 可以完全分類特徵子集 Q
當 k = 0 時,表示特徵子集 P 完全無法分類特徵子集 Q
從這裡可以看到我們接下來特徵選取的目標
就是在最小的特徵子集 P 之下,還能有最大的細分程度
接下來就是如何找有最大細分程度且是最小 P 的過程
也就是特徵選取的部分了!!