前言
昨天我們談到監督式學習的兩大任務:分類(Classification)與迴歸(Regression)。其中分類任務在生活中最常見,也最容易理解。那麼,分類任務又可以再細分成哪些不同的類型呢?今天就來深入看看。
一、二元分類 (Binary Classification)
最簡單的分類就是二元分類,意思是只有兩種可能的答案。
比如:一封電子郵件是「垃圾信」還是「正常信」?
又或者:醫學檢測結果是「陽性」還是「陰性」?
在這種情況下,模型的目標就是學會在「是 / 不是」之間做出判斷。通常我們會用 0 和 1 來表示結果。
二、多類分類 (Multi-class Classification)
如果類別不只兩種,而是三種、四種甚至更多,那就是多類分類。
比如:辨識一張水果的照片,可能是「蘋果」「香蕉」「橘子」或「葡萄」。
又比如:手寫數字辨識任務,輸入一張數字圖片,模型需要判斷它是 0 到 9 中的哪一個。
在這裡,每個樣本只能屬於其中一個類別,不會同時是「蘋果」又是「香蕉」。
三、多標籤分類 (Multi-label Classification)
最後一種更靈活的情況,就是多標籤分類。意思是每個樣本可以同時屬於多個類別。
比如:一張照片裡,同時有「海灘」「日落」「人物」這三個標籤。
又比如:YouTube 的影片,可能同時標記為「音樂」「運動」「教學」。
跟多類分類不同的是,多標籤分類不是「只能選一個」,而是「可能有很多答案」。
小結
今天我們介紹了分類任務的三種類型,了解這些分類型態,有助於我們更直觀地判斷「問題屬於哪種分類」,也能幫助選擇合適的模型。後續章節,我們會更深入探討這些分類是如何透過演算法來實現的。