前言
昨天我們快速比較了 AI、ML、DL 的差異,並提到 ML 的一大類型是 監督式學習 (Supervised Learning)。
那麼,監督式學習究竟是怎麼運作的?有哪些常見的任務與演算法?今天就來深入認識。
一、監督式學習(Supervised Learning)的概念
監督式學習的核心概念:
訓練資料 (Training Data) = 輸入特徵 (Features) + 對應標籤 (Label)
模型透過學習 輸入特徵 (Features) 與 標籤 (Label) 之間的對應關係,自動建立 預測規則 (Prediction Rules)。
其中,「標籤 (Label)」就像是題目的 標準答案 (Correct Answer)。
換句話說,監督式學習就像「老師 (Supervisor) 出題給學生練習,並提供正確答案」。學生經過反覆練習與修正,就能自己解出新題目。
流程簡化為:
資料收集 (Data Collection):準備帶有標籤的資料。
模型訓練 (Model Training):學習輸入與答案的對應關係。
驗證與測試 (Validation & Testing):檢查模型是否能應用在新資料上。
推論 (Inference):使用模型來預測未知答案。
二、監督式學習的輸出型態與常見演算法 (Tasks in Supervised Learning)
監督式學習主要分為 分類 (Classification) 和 迴歸 (Regression) 兩大類,這是依據 模型輸出的型態 (Output Type) 決定的。
輸出型態 :離散類別 (Discrete Category / Class)
特點 :模型的目標是判斷資料屬於哪一個類別,而不是精確的數值。
範例 :
常用演算法 (Common Algorithms):
輸出型態 :連續數值 (Continuous Value)
特點 :模型的目標是預測精確的數值,而不是分類。
範例 :
常用演算法 (Common Algorithms):
三、監督式學習:建立輸入到標籤的映射
監督式學習 (Supervised Learning) 可以理解為模型學會一個函數 𝑓,將輸入特徵(Features) X 映射到標籤(Label) Y:f: X -> Y
分類 (Classification)
數學定義:f: X -> {C1, C2, ..., Ck},其中 {𝐶1,...,𝐶𝑘}是離散類別集合。
迴歸 (Regression)
數學定義:f: X -> R 或 f: X -> R^m
小結
今天我們了解了監督式學習(Supervised Learning)的核心概念、主要流程,以及分類(Classification)與迴歸(Regression)兩大任務類型。後續章節中,會更探討監督式學習裡的分類任務類型,逐步讓大家能更直觀地理解分類是怎麼進行的。