iT邦幫忙

2023 iThome 鐵人賽

DAY 5
0
AI & Data

AI語音模型訓練: machine learning 和 deep learning 的學習與應用系列 第 5

Day5 機器學習: 非監督式學習(Unsupervised Learning)

  • 分享至 

  • xImage
  •  

非監督式學習(Unsupervised Learning)

與監督學習相反,這種學習方法是用沒有經過標籤的原始數據集下去做訓練,目標是從未標籤數據中發現其結構或群集。這種無須事先對資料加以標籤,而是讓模型去自己發現資料的結構模式,常用在難以被分類的資料。


非監督式學習主要常見的幾種功能

  1. 聚類(Clustering, 又稱分群): 目標是將數據集 中的資料分成不同的群集,使同群集內的資料彼此相似,而不同群集間差異大。常用於一比數據無法直接看出明確的關聯,但須要找出數據間的結構、相關性,這時就會使用聚類方法進行分析分群。像是市場消費者分析,商業客戶分群等等。
    https://ithelp.ithome.com.tw/upload/images/20230920/20160630RyIwwQai4v.png
  2. 降維(Dimensionality Reduction): 顧名思義就是將數據進行降維、簡化,但同時保留數據的重要特徵訊息。常用於當數據及過於複雜,特徵過多,又或是高維數據需要使他更好的被識別理解時。降維可以簡化數據,降低計算成本,只保留數據內需要的訊息,並且可以避免過度擬合(OverFitting)。
    https://ithelp.ithome.com.tw/upload/images/20230920/20160630ZRimly1Jl6.png

Example

在社交網絡中,可以幫助辨識在各種方面相似的用戶或群體,從而提升社交媒體平台用戶體驗的和改善社交分析。(聚類方法)
在音頻訊號的處理中,可以用在數據的特徵訊息保留和壓縮處理,可以幫助去除某些不必要的訊息,如躁聲,還可以節省儲存空間和傳輸頻寬。(降維方法)


上一篇
Day4 機器學習: 監督式學習(Supervised Learning)
下一篇
Day6 機器學習: 半監督式學習(Semi-Supervised Learning)
系列文
AI語音模型訓練: machine learning 和 deep learning 的學習與應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言