iT邦幫忙

2023 iThome 鐵人賽

DAY 21
0
AI & Data

圍繞 AI & Data 的主題系列 第 21

[Day 21] 半監督學習 (Semi-Supervised Learning)

  • 分享至 

  • xImage
  •  

Hello 大家好!歡迎回來!昨天剛剛分享完監督學習 (Supervised Learning),那今天我打算跟大家分享半監督學習 (Semi-Supervised Learning)。事不宜遲,現在開始!

簡介

半監督學習是一種結合已標記和未標記數據的機器學習方法,以提高模型的性能。傳統的監督學習僅依賴已標記的數據,而半監督學習充分利用大量的未標記數據,提取有用信息,增強學習過程。
https://ithelp.ithome.com.tw/upload/images/20231002/20163226Alny9HqHD7.png [1]

半監督學習技術

  • 自我訓練
    自我訓練是一種常見的半監督學習技術,模型在少量已標記數據上進行訓練,然後用於標記未標記數據的進一步訓練迭代。
  • 共同訓練
    共同訓練涉及在不同特徵子集上訓練多個模型,並使用它們在未標記數據上的一致性來改善預測。
  • 生成模型
    生成模型,如生成對抗網絡 (GAN) 或變分自編碼器 (VAE),可以學習底層數據分布並生成逼真的樣本進行訓練。

優點和挑戰

優點:

  • 利用未標記數據
    半監督學習可以利用大量易於獲取的未標記數據。
  • 改進性能
    通過結合未標記數據,半監督學習通常可以實現比僅使用有限已標記數據的監督學習更好的性能。

挑戰:
半監督學習面臨的挑戰包括有效利用未標記數據處理分布變化整合已標記和未標記數據
對於 Self-Training 類的方法,需要符合 Low-Density Seperation 假設才能成立;但是大部分的應用很難符合這個假設。

應用

  • 自然語言處理
    半監督學習已成功應用於文本分類、情感分析和命名實體識別等任務。
  • 電腦視覺
    在計算機視覺領域,半監督學習已用於圖像分類、目標檢測和圖像分割等任務。
  • 異常檢測
    半監督學習可以通過利用大多數未標記數據中觀察到的模式來幫助檢測異常。
  • 欺詐檢測
    通過利用已標記和未標記數據,半監督學習可以提高欺詐檢測系統的性能,識別可疑模式。

未來方向和新興趨勢

  • 主動學習
    主動學習技術結合了監督和半監督學習,通過有針對性地選擇最具信息量的樣本進行標記來進一步提高模型性能。
  • 深度生成模型
    深度學習和生成模型的結合對於推進半監督學習方法具有潛力。
  • 領域適應
    半監督學習可以擴展至領域適應任務,其中從源領域中獲取的已標記數據用於提高對具有有限標記的目標領域的性能。

參考資料

我是 Mr. cobble,明天見!


上一篇
[Day 20] 監督學習 (Supervised Learning)
下一篇
[Day 22] 非監督學習 (Unsupervised Learning)
系列文
圍繞 AI & Data 的主題30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言