今天要介紹的是一個叫做機會平等 (Equality of Opportunity) 的概念,利用這種評估方式,可以讓所有子群利用同樣ML模型所得出的結果更為準確。簡單還說,若使用一個ML模型能讓一筆資料得到合理的結果,其他筆資料應該要有同樣的機會都能得到合理的結果。
舉例來說,若是有一間銀行開發了一個ML模型來審核是否通過客戶的借貸申請,而這個模型就必須要做到,不論這個客戶被分到哪個子群去,都能有相同的機會申請到貸款。
那為什麼我們需要在ML中應用這種方法呢?主要是因為可以利用它來檢視模型的輸出結果,並確保產出的結果是準確 (Accuracy) 且非歧視性的 (Non-discrimination)。
此外,亦須確認各子群的分類方式是恰當的,以免影響結果。
利用上述的評估方式可以讓你的模型預測更為準確,但如果要得到更好的結果,你必須實際了解你的資料,但很多時候,要處理的資料是以百萬為單位計算的,在資料量龐大的狀況下,是不大可能以人力方式去完全了解整個資料集的內容。而要觀察這種大量資料的秘訣就是將其視覺化,透過觀察圖形來了解你的資料。如果要做到視覺化,可以參考使用Google所開發的開源工具Facets,有關這個工具的進一步介紹請參考其官網喔(網址:https://pair-code.github.io/facets/) 。