何為機器學習
為人工智慧的一項分支,透過演算法建構模型從大量的資料中找出規律,進而學習能做到識別資料或預測未來規律,並逐步完善精進,應用涵蓋金融、工業、零售、醫療…等等範圍相當廣泛;機器學習又可分成監督式學習(Supervised Learning)、非監督式學習(Unsupervised Learning)、半監督式學習(Semi-supervised learning)、增強學習(reinforcement learning);而最近也很常聽到的深度學習則為機器學習的另一項分支,不在此系列文章的規劃中。
三者的關係 圖片來源:NVIDIA
監督式學習
所有資料都有標準答案,先將資料做標籤(Label)在訓練的過程中告訴機器答案,即為監督式學習。例如要判斷香菇是否有毒,將有毒的香菇資料事先標為1沒毒的香菇資料標為0 。
非監督式學習
訓練資料沒有標準的答案,讓機器自行摸索出資料規律,不需要事先以人力輸入標籤,常用於關聯規則探索找資料的相似性。
半監督式學習
介於監督學習與非監督學習,少部分資料有標籤大部分資料沒有標籤,以資料分群來說先以有標籤的資料切出一條分界線,再利用剩下沒標籤資料的整體分布調整分界線;具有非監督式學習高自動化的優點,又能降低人工標籤資料的成本,是目前較常使用的方法。
增強學習
邊做邊學不斷調整,因應環境的變動隨之改變作法,隨時根據新進來的資料逐步做修正;例如當機器投籃時,越來越接近籃框給予一個正反饋(Positive Reward)若離目標更遠則給予負反饋(Negative Reward)。
參考資料來源:
https://www.inside.com.tw/2017/06/28/big-data
https://www.inside.com.tw/2017/07/19/machine-learning
後學才疏學淺,如有謬誤還請各位先進不吝指教。