iT邦幫忙

2021 iThome 鐵人賽

DAY 3
0
AI & Data

30天搞懂機器學習是否搞錯了什麼系列 第 3

【Day 3】機器學習基本功(一)

機器學習三大步驟

  1. 定義一個模型(model)
  2. 從模型裡挑出好的函式(function)
  3. 經由演算法找出最好的函式

監督式學習

今天透過舉例的方式來讓大家初步了解監督式學習裡包含的任務及方法,之後會再個別進行詳細的介紹。

特性

  • 需要大量訓練資料
  • 需要告訴機器輸入和輸出的關係,即為標記(label)

迴歸(Regression)

  • 函式的輸出是一個數值(scalar)

例1:要機器預測明天的PM2.5,函式輸出的PM2.5為一個數值,因此其為迴歸問題。其輸入可能為過去會影響PM2.5的種種數值,輸出即為明天PM2.5的數值,想要找到這樣的函式則需要給予大量過去PM2.5的資料進行訓練。

例2:預測股票,輸入可能為過去幾年股票的資料,輸出為明天股票的價位。

例3:無人車,輸入可能為無人車的各種感測器感測到的資料,輸出可能為方向盤的角度。

例4:推薦系統,輸入可能為某個使用者和某個商品,輸出為該使用者購買該商品的可能性。

分類(Classification)

  • 機器從我們給予的選項中選擇其中一個選項作為輸出

例如:要機器判斷是否為垃圾郵件,函式輸出為我們給予機器的選項。其輸入為一封郵件,輸出即為是或否,因此其為分類問題,透過告訴機器什麼是垃圾郵件什麼不是的資料集來進行訓練。而選項不只限於兩個,也能夠有很多個,例如:分類新聞類別。

深度學習(Deep Learning)

  • 函式非常複雜

例1:影像辨識,透過給予機器大量的圖片訓練,讓機器尋找一個函式,它可以描述pixel與它的class之間的關係。

例2:下圍棋,為一個分類問題,給機器的輸入是一個棋盤的盤勢,輸出為下一步落子的位置,而一個棋盤上有19X19的位置可以落子,因此可以想像成它是19X19個選項的分類問題。

結構化學習(Structured Learning)

  • 函式的輸出是一個有結構性的物件(object)

例如:語音辨識,輸入為聲音訊號,輸出為該聲音的內容,內容由多個詞彙組成,為一個有結構性的物件。另外還有翻譯、人臉辨識等等。


參考資料

李宏毅老師 - ML Lecture 0-1
李宏毅老師 - 機器學習2021


上一篇
【Day 2】機器學習的種類
下一篇
【Day 4】機器學習基本功(二) --- Regression
系列文
30天搞懂機器學習是否搞錯了什麼30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言