下面這張圖主要說明,機器學習主要分成: Supervised Learning(監督式學習)、Unsupervised learning(非監督式學習)、Semi-supervised Learning(非監督式學習)、Unsupervised Learning(非監督式學習)、Transfer Learning(遷移式學習)、Reinforcement Learning(強化式學習)。
以下所介紹都是以Supervised Learning為主,所謂的Supervised Learning指必須要有大量的training data,並且需要告訴機器input及output之間的關係,例如給一張狗的圖片,必須告訴它這是狗,給一張貓的圖片,必須告訴它這是貓,這樣的動作通常較label。
所以當我們用Supervised Learning做學習時,必須告訴機器input及output是什麼。
binary classification:
input為每一封郵件,output為每一封郵件是否為垃圾郵件,也就是yes or no的結果。
multi-classification:
首先必須準備多篇文章,並且告訴機器每一篇文章相對應的類別,最後給它新的文章,希望機器能給出正確的結果。