iT邦幫忙

2023 iThome 鐵人賽

DAY 1
6
AI & Data

ML From Scratch系列 第 1

[Day 1] 前言 & 機器學習簡介

  • 分享至 

  • xImage
  •  

前言

在接觸機器學習幾年後,對於背後的理論確仍就是一知半解,於是這系列的文章誕生了。

接下來的文章會以每個主題技術分三天講解:

  1. 主題技術之背後理論
  2. 從頭實做主題技術 (From Scratch)
  3. 透過 Kaggle 或其他資源運用主題技術

Table of Contents

https://ithelp.ithome.com.tw/upload/images/20231013/20152821Zv1pUPFNb3.jpg

機器學習是 ?

實現人工智慧 (Artifical Intelligence) 的方法之一,透過設計的演算法來分析數據,並在學習後進行判斷或決策。

舉例來說,我們必須以以下資料去判斷說未知輸入資料的輸出,
其中已知資料包含 https://chart.googleapis.com/chart?cht=tx&chl=(2%2C%2010)%2C%20(9%2C%2031),依照剛才簡述的三個步驟,

  1. 我們可以定義一個一元一次函數 https://chart.googleapis.com/chart?cht=tx&chl=y%20%3D%20a%20%5Ccdot%20x%20%2B%20b
  2. 透過已知資料,我們可以發現當 https://chart.googleapis.com/chart?cht=tx&chl=a%20%3D%203https://chart.googleapis.com/chart?cht=tx&chl=b%20%3D%204 時,該函數可以符合已知資料的輸出
  3. 當有未知資料 https://chart.googleapis.com/chart?cht=tx&chl=x%20%3D%207,作為輸入時,我們可以透過此函數去預測,其有可能會有 https://chart.googleapis.com/chart?cht=tx&chl=y%20%3D%2025 的輸出

機器學習與...的距離

  • 人工智慧: 機器學習並不等於人工智慧,機器學習只是實現人工智慧的方法之一
  • 深度學習: 深度學習是機器學習的一種演算法,輸入資料透過已經訓練好的人工神經網路 (Neural Network) 來分析並給予分類
  • 資料科學: 在資料科學領域,我們可以使用機器學習對資料進行分析。但資料科學並不只限於此,如何透過資料或的實際效益也是重點,機器學習只是資料科學的應用之一

https://ithelp.ithome.com.tw/upload/images/20230901/20152821sMI2RFhYsx.png

From Wikimedia Commons, the free media repository

機器學習包含哪幾類

機器學習可以分為以下幾類:

  1. 監督式學習: 主要透過訓練資料並建立模型,透過以建立模型去預測以新資料為來源的輸出。
    其中給定資料皆已標記,即已在每筆輸入資料都有相對預期輸出結果,而這在機器學習可以稱為 Ground truth,也就是每筆輸入資料的正確答案
  2. 半監督式學習: 僅透過少量標記資料訓練並建立模型
  3. 非監督式學習: 與監督式學習相反,必須透過無標記過資料來建立模型,而模型會透過輸入資料來分類
  4. 強化學習: 根據環境的互動,來得到所期望之最大效益。在大多數情況下,強化學習會看作是一種馬爾可夫決策過程

其中以監督式學習較為普遍,常見的演算法可大致分為分類 (classification) 以及遞迴 (regression)

機器學習的演算法有...

主要列舉以下演算法,而粗體字為涵蓋內容

監督式學習

  • Classification
  • Regression
    • Linear Regression
    • Polynoimal Regression
    • Support Vector Regression
    • Decision tree Regression
    • Random Forest Regression
    • Ridge Regression
    • Lasso Regression
    • Logistic Regression
  • Neural Network
    • Perceptron
    • Feed Forward Neural Network
    • Multilayer Perceptron
    • Convolutional Neural Network
    • Recurrent Neural Network
    • Long short-term memory recurrent neural network
    • Sequence to Sequence Models
  • Naive Bayes
  • Support vector machine
  • K-Nearest Neighbors

半監督式學習

  • Transductive Learning
  • Inductive Learning
  • Generative Adversarial Network
  • Self-training
  • Co-training

非監督式學習

  • K-means
  • Autoencoder
  • Gaussian Mixture Model

強化學習

  • Q learning
  • Deep Q-Network
  • Actor-Critic
  • Policy Gradient
  • Proximal Policy Optimization

在這裡也感謝關注我文章的人,讓我們一起進步吧

/images/emoticon/emoticon08.gif

Reference


下一篇
[Day 2] Polynomial Regression — 背後理論
系列文
ML From Scratch31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

1
angelchun
iT邦新手 3 級 ‧ 2023-09-11 12:48:07

希望能再口語話些

whoami iT邦新手 3 級 ‧ 2023-09-11 13:48:01 檢舉

了解 感謝

我要留言

立即登入留言