【Day 2】機器學習的種類

13th鐵人賽

guanjie0618

團隊人工逗點智慧

2021-09-15 11:24:36

4745 瀏覽

分享至

機器學習的種類主要分成四種：監督式學習(Supervised learning)、非監督式學習(Un-supervised learning)、半監督式學習(Semi-supervised learning) 以及 強化學習(Reinforcement learning)。在這邊就先簡單說明一下各個學習方法，之後有機會再做詳細的介紹。

監督式學習(Supervised learning)：

監督式學習是將所有資料集都做標記(label)，告訴機器這個是什麼、那個是什麼，透過人工分類來告訴機器標準答案，讓機器在學習過程中比對修正，依照標準答案來判斷，因此正確率也會相對較高。

例如：給機器一堆雞跟鴨的照片告訴機器哪個是雞哪個是鴨，然後讓機器自己透過特徵去學習，依照學習出來的模型就可以去判斷一張機器沒看過的照片得出那是雞還是鴨。

非監督式學習(Un-supervised learning)：

在了解了監督式學習之後，非監督式學習就代表著所有資料都沒有被標記，機器自行透過尋找特徵來進行分類，因此準確率就相對於監督式學習低。

例如：給機器一堆雞跟鴨的照片，機器必須自己去判斷哪個是雞哪個是鴨並進行分類，依照自行分類的特徵學習出來的模型去判斷一張機器沒看過的照片得出是雞還是鴨，但也有可能因為有些不重要的特徵被過度放大，導致結果不理想。

半監督式學習(Semi-supervised learning)：

半監督式學習是將少部分資料進行標記，機器透過少部分標記的資料來找出其特徵並對其他未標記的資料進行分類，相較於非監督式學習，半監督式學習的正確率相對較高。

例如：給機器一堆雞跟鴨的照片，但只告訴機器其中幾張照片哪個是雞哪個是鴨，讓機器自行依據那些標準答案來分類剩下的照片，依照學習出來的模型去判斷一張機器沒看過的照片得出那是雞還是鴨。

強化學習(Reinforcement learning)：

強化學習是讓機器自行從環境互動中來學習，不需要給任何資料，機器必須透過獎懲機制(reward)取得最大化的獎勵，也就是說我們不需要標記，只需要告訴機器他採取的行為(action)是不是正確的，讓機器根據獎懲自行修正其採取的行為，最終得到最好的結果，也就是依照過去的經驗去學習。

例如：讓機器去跟一個人下棋，如果機器贏了就會得到 positive reward ，輸了就得到 negative reward ，贏了機器就會知道可能某些下法是好的，但是我們不會跟他說哪幾步是下的好，哪幾步是下不好，機器必須自己去學習想辦法知道。因此強化學習是需要大量的訓練樣本才有辦法訓練出一個好的模型。