iT邦幫忙

2025 iThome 鐵人賽

DAY 4
0
AI & Data

30 天了解 AI & Data:入門到實作系列 第 4

【DAY4】監督式學習:核心概念與流程整理

  • 分享至 

  • xImage
  •  

前言

昨天我們快速比較了 AI、ML、DL 的差異,並提到 ML 的一大類型是 監督式學習 (Supervised Learning)。
那麼,監督式學習究竟是怎麼運作的?有哪些常見的任務與演算法?今天就來深入認識。


一、監督式學習(Supervised Learning)的概念

  • 監督式學習的核心概念:

    • 訓練資料 (Training Data) = 輸入特徵 (Features) + 對應標籤 (Label)

    • 模型透過學習 輸入特徵 (Features) 與 標籤 (Label) 之間的對應關係,自動建立 預測規則 (Prediction Rules)。

    • 其中,「標籤 (Label)」就像是題目的 標準答案 (Correct Answer)。

    換句話說,監督式學習就像「老師 (Supervisor) 出題給學生練習,並提供正確答案」。學生經過反覆練習與修正,就能自己解出新題目。

  • 流程簡化為:

    1. 資料收集 (Data Collection):準備帶有標籤的資料。

    2. 模型訓練 (Model Training):學習輸入與答案的對應關係。

    3. 驗證與測試 (Validation & Testing):檢查模型是否能應用在新資料上。

    4. 推論 (Inference):使用模型來預測未知答案。

二、監督式學習的輸出型態與常見演算法 (Tasks in Supervised Learning)

監督式學習主要分為 分類 (Classification) 和 迴歸 (Regression) 兩大類,這是依據 模型輸出的型態 (Output Type) 決定的。

  1. 分類 (Classification)
  • 輸出型態 :離散類別 (Discrete Category / Class)

  • 特點 :模型的目標是判斷資料屬於哪一個類別,而不是精確的數值。

  • 範例 :

    • 郵件分類為垃圾信 (Spam) 或非垃圾信 (Non-Spam)
    • 圖片辨識:貓 (Cat) 或狗 (Dog)
    • 病人診斷:健康 (Healthy) 或患病 (Sick)
  • 常用演算法 (Common Algorithms):

    • 決策樹 (Decision Tree)
    • 支援向量機 (SVM)
    • 邏輯迴歸 (Logistic Regression)
    • 隨機森林 (Random Forest)
  1. 迴歸 (Regression)
  • 輸出型態 :連續數值 (Continuous Value)

  • 特點 :模型的目標是預測精確的數值,而不是分類。

  • 範例 :

    • 房價預測 (House Price Prediction)
    • 氣溫預測 (Temperature Forecast)
    • 股票價格預測 (Stock Price Prediction)
  • 常用演算法 (Common Algorithms):

    • 線性迴歸 (Linear Regression)
    • Lasso / Ridge Regression
    • 梯度提升樹 (Gradient Boosted Decision Tree, GBDT)

三、監督式學習:建立輸入到標籤的映射

監督式學習 (Supervised Learning) 可以理解為模型學會一個函數 𝑓,將輸入特徵(Features) X 映射到標籤(Label) Y:f: X -> Y

  • 輸入特徵 X:可以是向量 x1, x2, ..., xn,代表資料中的各種屬性
  • 標籤 Y:依照型態不同,監督式學習分為兩種主要任務
  1. 分類 (Classification)
    數學定義:f: X -> {C1, C2, ..., Ck},其中 {𝐶1,...,𝐶𝑘}是離散類別集合。

    • 解釋:模型學習的是從特徵空間到離散類別集合的映射
    • 目標:對每個輸入 𝑋預測最可能的類別 𝐶𝑖
    • 運作方式:常用 softmax 或 logistic 函數輸出每個類別的機率,再選擇最大值作為預測結果
      <附註>softmax / logistic 函數:用於分類任務,將模型輸出轉換成各類別的機率。目前只需知道它能「幫助模型決定最可能的類別」,詳細運作方式將在後續章節介紹
  2. 迴歸 (Regression)
    數學定義:f: X -> R 或 f: X -> R^m

    • 解釋:模型學習的是從特徵空間到連續數值的映射
    • 目標:對每個輸入 𝑋 預測精確的數值 𝑌
    • 運作方式:通常使用均方誤差 (Mean Squared Error, MSE) 或其他損失函數調整模型,使預測值最接近真實標籤
      <附註>MSE:用於迴歸任務,衡量模型預測值與真實值的差距。目前只需知道它是「模型調整預測的依據」,後續會深入講解計算方法與運用方式

小結
今天我們了解了監督式學習(Supervised Learning)的核心概念、主要流程,以及分類(Classification)與迴歸(Regression)兩大任務類型。後續章節中,會更探討監督式學習裡的分類任務類型,逐步讓大家能更直觀地理解分類是怎麼進行的。


上一篇
【DAY3】什麼是 AI、機器學習 (ML)、深度學習 (DL)?快速掌握三者差異
系列文
30 天了解 AI & Data:入門到實作4
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言