監督式學習是透過觀察訓練樣本的輸入和輸出,以學習並預測中間的處理函數。其核心特點為必須先對訓練資料進行標註,以讓模型學會預測或分類的技能。其主要應用如下:
(1)分類: 將輸入數據分為不同的類別或標籤。舉例來說Google可以使用監督式學習相關演算法,例如選擇標記好的郵件數據來區分垃圾郵件和非垃圾郵件,模型會根據這些數據自動識別特徵,調整權重以提高預測的精確度。同樣的方法也可以用於識別照片中的動物種類、汽車品牌、以及醫療影像診斷等。
(2)預測: 例如在股票市場,使用回歸分析可以用來預測股票價格的趨勢,進行投資決策;在房地產市場則可以用回歸模型幫助估算房屋的價值,以及預測未來的價格趨勢。
(3)文字識別: 我們平常在Line圖片轉文字、以及使用平板寫筆記後,將手寫字跡轉換為數字或字母的文本形式,本身也是用到監督式學習!相信大家用Line圖片識別文字或用Goodnote寫筆記時,都會收到用戶是否願意分享照片文字識別或是是否願意分享字跡識別,其實這些都是Line以及Goodnote為了得到大量的模型訓練數據來標註字跡特徵。這樣才能更準確的識別出文字!
(PS: Line的圖片識別文字是用到OCR的技術,其本身也是屬於監督式學習喔)。
明天將介紹監督式學習的相關演算法~