【DAY4】監督式學習：核心概念與流程整理

2025 iThome 鐵人賽

DAY 4

AI & Data

17th鐵人賽 ai data machine learning supervised learning

637 瀏覽

前言

昨天我們快速比較了 AI、ML、DL 的差異，並提到 ML 的一大類型是監督式學習 (Supervised Learning)。
那麼，監督式學習究竟是怎麼運作的？有哪些常見的任務與演算法？今天就來深入認識。

一、監督式學習(Supervised Learning)的概念

監督式學習的核心概念：
- 訓練資料 (Training Data) = 輸入特徵 (Features) + 對應標籤 (Label)
- 模型透過學習輸入特徵 (Features) 與標籤 (Label) 之間的對應關係，自動建立預測規則 (Prediction Rules)。
- 其中，「標籤 (Label)」就像是題目的標準答案 (Correct Answer)。
換句話說，監督式學習就像「老師 (Supervisor) 出題給學生練習，並提供正確答案」。學生經過反覆練習與修正，就能自己解出新題目。
流程簡化為：
1. 資料收集 (Data Collection)：準備帶有標籤的資料。
2. 模型訓練 (Model Training)：學習輸入與答案的對應關係。
3. 驗證與測試 (Validation & Testing)：檢查模型是否能應用在新資料上。
4. 推論 (Inference)：使用模型來預測未知答案。

二、監督式學習的輸出型態與常見演算法 (Tasks in Supervised Learning)

監督式學習主要分為分類 (Classification) 和迴歸 (Regression) 兩大類，這是依據模型輸出的型態 (Output Type) 決定的。

輸出型態：離散類別 (Discrete Category / Class)
特點：模型的目標是判斷資料屬於哪一個類別，而不是精確的數值。
範例：
- 郵件分類為垃圾信 (Spam) 或非垃圾信 (Non-Spam)
- 圖片辨識：貓 (Cat) 或狗 (Dog)
- 病人診斷：健康 (Healthy) 或患病 (Sick)
常用演算法 (Common Algorithms)：
- 決策樹 (Decision Tree)
- 支援向量機 (SVM)
- 邏輯迴歸 (Logistic Regression)
- 隨機森林 (Random Forest)

輸出型態：連續數值 (Continuous Value)
特點：模型的目標是預測精確的數值，而不是分類。
範例：
- 房價預測 (House Price Prediction)
- 氣溫預測 (Temperature Forecast)
- 股票價格預測 (Stock Price Prediction)
常用演算法 (Common Algorithms)：
- 線性迴歸 (Linear Regression)
- Lasso / Ridge Regression
- 梯度提升樹 (Gradient Boosted Decision Tree, GBDT)

三、監督式學習：建立輸入到標籤的映射

監督式學習 (Supervised Learning) 可以理解為模型學會一個函數 𝑓，將輸入特徵(Features) X 映射到標籤(Label) Y：f: X -> Y