機器學習(Machine Learning, ML)介紹
機器學習是一種人工智慧(AI)的子領域,它讓電腦可以 從數據中學習模式與規則,而不需要人工明確編寫程式來完成每一個任務。換句話說,機器學習是讓電腦透過經驗「自己改進」的一種技術。
基本概念
-
數據 (Data)
機器學習的核心是數據,分為:
-
訓練數據 (Training Data): 用來教電腦學習模型。
-
測試數據 (Test Data): 用來驗證模型的效果。
-
特徵 (Features)
特徵是數據中用來描述物件的屬性,例如:
- 房價預測:房屋面積、房間數、地點。
- 圖像分類:像素值、顏色、形狀。
-
模型 (Model)
模型是電腦學習到的「規則集合」,它能夠將輸入數據映射到預測結果。
-
目標 (Target / Label)
目標是你希望模型預測的結果,例如:
- 電郵分類:垃圾郵件或正常郵件。
- 股票價格:明天的收盤價。
機器學習類型
-
監督式學習 (Supervised Learning)
- 有 輸入 和 對應的標籤。
- 目標是學會從輸入預測標籤。
- 例子:
-
非監督式學習 (Unsupervised Learning)
- 只有 輸入數據,沒有標籤。
- 目標是找出數據的結構或模式。
- 例子:
- 客戶分群(Clustering)
- 主成分分析(PCA)
-
強化學習 (Reinforcement Learning)
- 透過 試錯法學習最佳策略。
- 電腦透過獎勵或懲罰改進決策。
- 例子:
常用算法
- 線性回歸 (Linear Regression)
- 邏輯回歸 (Logistic Regression)
- 支持向量機 (SVM)
- 決策樹與隨機森林 (Decision Tree / Random Forest)
- 神經網路 (Neural Networks)
- K-均值聚類 (K-Means Clustering)
應用範圍
-
醫療:疾病診斷、藥物研發
-
金融:信用評分、風險管理
-
零售:推薦系統、銷售預測
-
自動駕駛:物體偵測、路徑規劃
-
自然語言處理 (NLP):聊天機器人、翻譯系統
總而言之來說,機器學習就是讓電腦透過數據學習,從而自動完成決策或預測的技術。