一開始區分要使用那種學習模型是很重要的。我們知道監督學習模型和無監督學習模型的主要區別是在於數據有沒有標籤。
例如你有大樂透中獎者的數據,每一筆資料都有許多欄位,如中獎金額,下注金額和性別等等。選擇其中一欄作為我們想要預測的內容,稱為標籤,然後把其他的欄位當作特徵提示。
假設我們試著實作二個模型:
模型1:我們想要猜下注金額,因此下注金額是我們的標籤。我可以使用一個,全部或任意數量的欄位當作為特徵值來預測。因為下注金額是一個連續的標籤,所以這會是一個回歸模型。
模型2:我們想要預測中獎者的性別,那性別欄位是我們標籤。因為我們的標籤性別具有離散數量的值或類,所以這會是一個分類模型。
畫一下分析問題的圖,大概如下:
總之,根據我們想預測的問題,我們擁有的數據的可解釋性(explainability),會決定我們要使用哪種機器學習模型來找到解決方案。
好,第15天,打完。
參考
coursera - Machine Learning with TensorFlow on Google Cloud Platform 專項課程
coursera - Launching into Machine Learning