iT邦幫忙

self-attention相關文章
共有 1 則文章
鐵人賽 AI & Data DAY 27

技術 28 Transformer

繼 Attention model 之後,由於 recurrent 架構的特性一直無法善用 GPU 的資源做加速。 這時 Google Brain 團隊就看到別...