iT邦幫忙

2023 iThome 鐵人賽

DAY 6
0
AI & Data

AI語音模型訓練: machine learning 和 deep learning 的學習與應用系列 第 6

Day6 機器學習: 半監督式學習(Semi-Supervised Learning)

  • 分享至 

  • xImage
  •  

半監督式學習(Semi-Supervised Learning)

介於監督與半監督學習之間,其用於訓練的數據集包含了以標籤和未標籤的資料,通常數據集內以標籤的數量會遠少於未標籤資料,運用有限的標籤數據和大量未標籤數據的特徵訊息去使模型優化。


半監督學習常見的為兩種學習方法

  1. 直推式學習(Transductive Learning): 運用數據集中有標籤的資料來訓練模型,在使用未標籤數據當作新數據來讓模型去預測未標籤數據的標籤結果。這種學習方法通常是針對給的數據集特化的,因此對數據集外的新資料功能有限。
    常用在對特定數據集有目標需求,且對於新數據沒有分析需求的狀況。

  2. 歸納式學習(Inductive Learning): 這個方法與直推式不同,主要關注於整個數據集的模式和特徵,並對新數據進行預測。也就是說,歸納式學習不是專注於特定的數據集,而是能夠適用於新數據,所以inductive learning 能夠訓練一個有良好泛化能力的模型。
    常用於數據樣本夠大,標籤數據夠多時,或是需求是一般的而非特化的目標的狀況。

Self-Training 經典的半監督學習案例

首先使用數據集內以標籤資料去對模型進行初次訓練,之後再用已訓練的模型進行自我訓練(也就是對自己未標籤的資料進行預測,預測完後將已有預測結果的資料進行更新),反覆訓練直到所有剩餘的資料都轉化為標籤資料。
https://ithelp.ithome.com.tw/upload/images/20230921/20160630DbV8DcXNNd.png


上一篇
Day5 機器學習: 非監督式學習(Unsupervised Learning)
下一篇
Day7 機器學習: 批量學習和線上學習(Batch/Offline Learning and Online Learning)
系列文
AI語音模型訓練: machine learning 和 deep learning 的學習與應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言