iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 12
0
AI & Data

花甲老頭學 AI系列 第 12

[鐵人12:Day 12] EfficientNet 4:EfficientNet 之結構

  • 分享至 

  • xImage
  •  

在「簡介」時老頭曾經提到,有一個好的模型縮放公式還不夠,必須搭配一個好的 Baseline Model ,才能設計出好的擴充新模型。

作者參考了 MingXing Tan 等人的論文「MnasNet: Platform-Aware Neural Architecture Search for Mobile」(註一)利用「 multi-objective neural architecture search」方法來找出最佳的 Baseline Model。

  • 作者使用了和 MingXing Tan 論文內相同的搜尋空間 (search sapce)。

  • 最佳化的標的為「精確度 (ACC) 」及「運算量 (FLOPS)」,公式為:
    https://chart.googleapis.com/chart?cht=tx&chl=ACC(m)%20*%20%5BFLOPS(m)%20%2F%20T%5D%5Ew

    其中 ACC(m) 代表模型 m 的精確度,FLOPS(m) 代表模型 m 所需之運算量,T是目標運算量(設為 400M),而 w = -0.07。

找出來的模型,即是 EfficientNet-B0,它的結構如下:
https://ithelp.ithome.com.tw/upload/images/20200926/20129616IwB4eJntve.png
EfficientNet-B0 是由 MBConv (Mobile Inverted Bottleneck ConvNet, 註二) 並加上
squeeze-and-excitation optimization(註三)為基本模塊組合而成。

接著作者以 EfficientNet-B0 為 Baseline Model,並將縮放係數 φ 定為 1 (將 Baseline Model 擴充 1 倍),執行小規模的網格搜尋,去找適當的 α, β, γ 值。結果為 α = 1.2, β = 1.1, γ = 1.15。

然後,就以找出來的 α, β, γ 值,依序產生 EfficientNet-B1 到 EfficientNet-B7 (縮放係數 φ 設為 1 到 7)。作者在論文中特別提到,他們最後用的 α, β, γ 值,是 B0 到 B1 的擴充過程中找到的,理論上,也可以分別去找各個階段擴充時的最佳值 (例如由 B1 到 B2 是再搜尋一次),但是隨著模型逐漸變大,這種搜尋所需之時間及運算也將指數式的放大,而變得不可行。所幸沿用 B0 到 B1 的值,所得到的 EfficientNet 系列已能展現出良好的效能。

所產生的模型列表如下。要注意的是最右邊一欄 EfficientNet-L2,在論文中並沒有提到這一個巨大的 EfficientNet,它是後來產生的。前幾天在「EfficientNet 1:源起」中提到的 ImageNet 排名第一的 FixEfficientNet-L2 就是它的變形。
https://ithelp.ithome.com.tw/upload/images/20200926/20129616rNrkSwPcqw.png
模型產生出來了,接下來就要看看他們的效能到底好到什麼程度了!

(註一:論文 arXiv 號碼 1807.11626 https://arxiv.org/abs/1807.11626 )
(註二:參考
Sandler, M., Howard, A., Zhu, M., Zhmoginov, A., and Chen, L.-C. Mobilenetv2: Inverted residuals and linear bottlenecks. CVPR, 2018
Tan, M., Chen, B., Pang, R., Vasudevan, V., Sandler, M., Howard, A., and Le, Q. V. MnasNet: Platform-aware neural architecture search for mobile. CVPR, 2019 )
(註三:參考
Hu, J., Shen, L., and Sun, G. Squeeze-and-excitation networks. CVPR, 2018 )


上一篇
[鐵人12:Day 11] EfficientNet 3:複合式模型縮放 (Compound Model Scaling)
下一篇
[鐵人12:Day 13] EfficientNet 5:驗證及測試
系列文
花甲老頭學 AI30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言