iT邦幫忙

2024 iThome 鐵人賽

DAY 12
0
AI/ ML & Data

學習人工智慧的概念和技術系列 第 12

學習心得—機器學習基礎:監督學習與非監督學習

  • 分享至 

  • xImage
  •  

今天學有關於機器學習!
它是通過數據和算法,讓計算機能夠自動學習並從經驗中改進性能,就是通過數據來驅動模型,讓計算機能夠從數據中找到規律,並在遇到新數據時能夠做出預測或決策,不像是傳統的編程方式需要明確指令,而是依賴於「學習」的過程——計算機利用數據來訓練模型,然後使用該模型來解決類似的問題。是人工智慧(AI)的核心之一,也被廣泛應用於我們日常生活中的各種場景,如語音辨識、圖像分類、推薦系統等~

而機器學習方法通常被分為三大類:監督學習、非監督學習和強化學習!

監督學習(Supervised Learning)——有標籤的學習
監督學習是目前最廣泛應用的機器學習方式。在監督學習中,模型在訓練過程中被給予一組「已標籤」的數據。這意味著,我們不僅提供數據給模型,還提供該數據的對應答案(標籤),讓模型能夠學習如何將輸入映射到正確的輸出。

在監督學習的過程中,模型會透過大量的標籤數據來學習輸入和輸出之間的關係,然後利用這些關係來預測未來的數據。例如,在圖像分類問題中,我們會提供大量已標籤的圖像,如「貓」和「狗」的圖像,讓模型學習如何區分這兩類動物,最終能夠預測一張新圖像是貓還是狗。

監督學習的常見應用包括:

分類:例如電子郵件的垃圾分類、醫學診斷等。
迴歸:預測房價、股票市場走勢等連續數據。
在學習監督學習時,我深刻體會到標籤數據的重要性。模型的學習效果在很大程度上依賴於數據的質量與標籤的準確性。如果標籤不準確或數據質量差,模型的預測能力將會受到極大的限制。此外,數據的多樣性也很關鍵,否則模型可能會過度擬合,即只適用於訓練數據,無法對新數據做出準確預測。

非監督學習(Unsupervised Learning)——無標籤的學習
與監督學習不同,非監督學習處理的是無標籤的數據。這意味著,模型在學習時不會被告知正確答案,而是需要自己從數據中找出潛在的模式或結構。非監督學習的目標是發現數據內部的關聯性,這在沒有明確標籤的情況下尤為重要。

非監督學習的一個常見應用是聚類。聚類是將一組數據分成若干個類別,使得同一類別內的數據點更相似,而不同類別之間的數據點差異較大。例如,在市場行銷中,通過聚類分析,可以將客戶群體根據購買行為分成不同的類別,以便企業能夠針對不同的客戶群提供個性化的服務。

另一個非監督學習的常見應用是降維,如主成分分析(PCA)。當數據維度過高時,降維技術可以幫助我們簡化數據結構,同時保留數據中的重要資訊。

非監督學習的挑戰在於,由於缺乏標籤數據,模型的結果往往不如監督學習那麼具體。因此,非監督學習的應用通常需要更多的專業知識來解釋和理解模型所發現的模式。


上一篇
學習心得—Python基礎資料結構:列表、字典
下一篇
學習Numpy 庫—處理數據的基礎工具
系列文
學習人工智慧的概念和技術30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言