開場
昨天我們聊了深度學習為什麼會爆紅,今天的新手村任務是 —— 搞懂監督式學習 (Supervised Learning) 與非監督式學習 (Unsupervised Learning)。
這是機器學習的兩大基礎分類,理解這個差別,就像知道遊戲裡「有 NPC 教學任務」和「自己自由探索」的不同。
一、監督式學習 (Supervised Learning)
概念:有老師(標籤)在旁邊指導。資料集中包含 輸入 + 正確答案。
監督式學習的核心概念就是「有老師在旁邊指導」,也就是說資料集中同時包含輸入與正確答案。這種方式常見於兩大任務:其一是 分類 (Classification),用來判斷輸入屬於哪一類,例如貓狗分類、垃圾郵件過濾,甚至是醫療診斷中判斷腫瘤屬於良性或惡性;其二是 迴歸 (Regression),用來預測連續數值,例如房價預測、股票價格走勢或氣溫變化。簡單來說,監督式學習就像遊戲裡有 NPC 教你打怪,一路上都有提示,讓模型能快速學會正確的判斷方法。
二、非監督式學習 (Unsupervised Learning)
概念:沒有老師,資料沒有標籤,電腦只能靠自己找規律。
非監督式學習的重點在於「沒有老師帶路」,資料沒有標籤,電腦必須自己從中找出規律。它的常見任務包括 分群 (Clustering),將相似的資料自動聚在一起,例如電商進行顧客分群,或影視平台依照觀眾的觀影習慣推薦內容;另一個是 降維 (Dimensionality Reduction),把高維度資料壓縮成較少的維度,方便可視化或加速模型訓練,常見方法有 PCA 與 t-SNE,廣泛應用於資料探索。整體來說,非監督式學習就像遊戲裡「自己亂闖地圖」,不知道怪物的名字,只能憑直覺把長得或行為相似的怪歸在同一類。
三、對比表格
特點 | 監督式學習 (Supervised) | 非監督式學習 (Unsupervised) |
---|---|---|
資料 | 有標籤(答案) | 無標籤 |
任務 | 分類、迴歸 | 分群、降維 |
範例 | 貓狗分類、房價預測、垃圾郵件過濾 | 顧客分群、PCA、t-SNE 視覺化 |
比喻 | 有 NPC 教你打怪 | 自己亂闖地圖找規律 |
監督式學習:最常用於分類與預測,實務應用最多。
非監督式學習:常用於前處理、資料探索、找出隱藏規律。
深度學習的多數應用屬於監督式學習,但非監督式在理解資料結構上同樣關鍵。