【Day 8】機器學習概述（上）

2025 iThome 鐵人賽

DAY 7

佛心分享-讓我升級的那些書

17th鐵人賽

281 瀏覽

機器學習（Machine Learning）是讓機器從大量資料中自動學習規則，並根據這些規則對未知資料進行預測的過程。這與人類孩童認知世界的方式相似，透過不斷學習和觀察來歸納事物的規律。

機器學習的本質是透過大量樣本資料的訓練（training），讓機器獲得經驗（模型），從而產生預測新事物的能力（inference）。這種預測能力可以被視為是找到一個從輸入到輸出的函數（或稱對應關係），以揭示資料中隱藏的規律。

這幾個概念的定義界線模糊，但可以從目標和側重點來區分：

資料分析（Data Analysis）：主要針對小規模資料，透過分析和總結已知資訊，得出有意義的結論。大數據分析（Big Data Analysis）則是在處理大規模資料時，對運算模式和方法上的差異的稱呼。
資料探勘（Data Mining）：範圍更廣，目標是從大量資料中「挖掘」出表層看不到的、有價值的資訊，並幫助人們進行決策。它常常使用機器學習技術來完成。
機器學習（Machine Learning）：最終目標是「預測」。它根據資料規律來預測未知資訊，從而帶來決策上的收益。

共同點：

1. 資料集、特徵和標籤

2. 機器學習任務的分類

監督式學習（Supervised Learning）：資料集帶有標籤資料，透過學習已知標籤來進行預測。
- 迴歸（Regression）：目標變量為連續型數值，例如預測房價。
- 分類（Classification）：目標變量為離散型類別，例如判斷郵件是否為垃圾郵件。
非監督式學習（Unsupervised Learning）：資料集沒有標籤資料，目標是挖掘特徵資料中的資訊。
- 聚類（Clustering）：根據資料分佈將樣本分組。
強化學習（Reinforcement Learning）：基於「行動-反饋」機制進行自我學習，以最大化獎勵為目標，通常應用於動態、瞬息萬變的環境中（例如遊戲AI）。
遷移學習（Transfer Learning）：一種加速學習的模式，將一個已訓練好的模型的參數應用於新的相關任務，而非從零開始學習。