iT邦幫忙

第 12 屆 iT 邦幫忙鐵人賽

DAY 27
0
AI & Data

主管可能很機車,但數學不會,數學不會就是不會:盡學渣之力說數學原理系列 第 27

[Day 26]粗糙集特徵選擇簡介-4

上次說到用一個等價類 U/P 去逼近另一個等價類 U/Q
可以把它看成是在特徵子集 Q 之下
能被特徵子集 P 完整細分多少
那我們如何量化這個細分的程度呢


我們之前有說過
用 U/P 去逼近 U/Q 時
我們會製造 POS, NEG, BND 三個集合
分別代表了內部、外部、邊界

內部 POS 中的元素
代表在特徵子集 Q 之下可以被特徵子集 P 完全分開
所以我們可以用這個量化細分的程度如下
degree_k

公式上一目瞭然
這個量化的方法就是「能被完全分類的元素佔所有樣本的比例」
並將其記為 https://chart.googleapis.com/chart?cht=tx&chl=P%20%5CRightarrow%20_k%20Q

當 k = 1 時,表示特徵子集 P 可以完全分類特徵子集 Q
當 k = 0 時,表示特徵子集 P 完全無法分類特徵子集 Q
從這裡可以看到我們接下來特徵選取的目標
就是在最小的特徵子集 P 之下,還能有最大的細分程度


接下來就是如何找有最大細分程度且是最小 P 的過程
也就是特徵選取的部分了!!


上一篇
[Day 25]粗糙集特徵選擇簡介-3
下一篇
[Day 27]粗糙集特徵選擇簡介-5
系列文
主管可能很機車,但數學不會,數學不會就是不會:盡學渣之力說數學原理30

尚未有邦友留言

立即登入留言