iT邦幫忙

2022 iThome 鐵人賽

DAY 26
0
Security

區塊鏈與聯邦學習系列 第 26

聯邦強化學習(Federated Reinforcement Learning, FRL)

  • 分享至 

  • xImage
  •  

聯邦強化學習(FRL)使用多個代理(Agent)聯合建構,在不共享原始資料的情況下,產生更好的決策。

強化學習(Reinforcement Learning, RL)

強化學習(RL)應用於許多實際決策中,但強化學習(RL)經常遭受樣本效率低下的問題。
當強化學習(RL)用於提供決策支持時,它的性能受到一個人擁有的資料集樣本大小的限制。
直接的解決方案是多個強化學習(RL)代理(Agent)共享他們的資料,共同建構一個單一代理(Agent)。
但是在許多應用中,強化學習(RL)資料可能包含敏感訊息,因此禁止共享。

聯邦強化學習(Federated Reinforcement Learning, FRL)

聯邦強化學習(FRL),目的在從多個方面聯合構建更好的策略,各個代理(Agent)不需要他們分享他們的原始軌跡。
聯邦強化學習(FRL)用於解決強化學習(RL)在實際系統中的樣本效率低下問題,例如:自動駕駛、物聯網設備控制優化、和資源網路管理。

現有的聯邦強化學習(FRL)框架不具備理論上的收斂保證,因此缺乏對實際聯邦強化學習(FRL)應用的取樣效率的保證,這是一個嚴重的缺點。

  • 聯邦強化學習(FRL)需要每個代理(Agent)都參與模型訓練
    實際應用環境中強化學習(RL)資料的高采樣成本,與訓練資料不同的聯邦學習(FL)可以離線收集。
  • 聯邦強化學習(FRL)需要一種減少方差的聯合策略梯度框架的優化技術,保證收斂結果
    實際應用環境中的交互速度可能很慢,成本很昂貴,這使得聯邦強化學習(FRL)的採樣效率變的至關重要。

上一篇
聯邦遷移學習(Federated Transfer Learning, FTL)
下一篇
拆分學習(Split Learning, SL)
系列文
區塊鏈與聯邦學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言