二、教你怎麼看source code，找到核心程式碼 ep.23：Deeplab的model 部署

第 12 屆 iThome 鐵人賽

DAY 30

AI & Data

從零.4開始我的深度學習之旅：從用tf.data處理資料到用tf.estimator或tf.keras 訓練模型系列第 30 篇

12th鐵人賽 deep learning trace code 學習心得

細枝

團隊300萬 Tesla

2020-10-15 17:15:44

1520 瀏覽

分享至

文章說明

文章分段

文章說明
deeplab的簡單介紹、於我的意義 ep.1
tensorflow的程式碼特色 ep.2
訓練流程的細節 ep.3
逛deeplab的github程式

前情提要

上個ep稍微去看了deployment.py後，大概知道他在處理各個clone拿到的model的tensor name，那代表，要真的了解model在幹麻，還是得回歸到train.py裡作為model_fn的_build_deeplab()才行。

build model的過程伴隨著資料的輸入，第一件做的事情就是從iterator中取出一個batch的訓練樣本。

上次就講到這些，讓我們繼續開始吧。

逛deeplab的github程式(cont.)

`train.py` (cont.)

ModelOptions是來自common.py的class，目的就是在製作要設定此次模型的參數。

outputs_to_num_classes就是此次分類的數量
crop_size是input tensor shape，之前iterator已經按照這個尺寸處理好資料了
atrous_rates就是deeplab的論文核心，空洞的部分，順帶一提，蠻多API的conv layer都已經有提供這個參數做使用。
output_stride是input的尺寸與output尺寸的比例，我記得應該是input/output

這個部分就要去看model.py的multi_scale_logits()，我一直蠻好奇這個「logits」指的究竟是什麼意思？我們通常搭建的模型會是前面有許多conv layer層去找特徵，然後後面接幾個全連接層將其展開，然後最後用一層輸出跟分類數量一樣的神經層去輸出最後的output。而這個logits，一般就是最後一層的「前一層」的輸出。

也就是說，主要的模型架構應該就在這個method裡面。

接下來是將模型的logits取出來，把他們存在一個dict裡，並且給他tensor name。

接著最後就是將logits送去給add_softmax_cross_entropy_loss_for_each_scale()去計算最後的輸出，並且跟label進行比較。

有沒有做到更新參數這件事要等看了這個method才知道。

所以接著去utils資料夾看train_utils.py的程式吧。

`train.utils.py`

對不同scale的logits，都去計算softmax cross entropy的loss。

其實在這個method的第74行～140行，都在處理scale的問題，讓logits與label有對應到，所以會有一些resize跟reshape的部分。

這裡其實還有一個重點，data與label使用的resize method不一樣，也不應該一樣，data適合使用bilinear這類interpolation的，而label則是適合nearest neighbor這類的resize。
畢竟不會有人希望，label resize後，居然出現1.5這種label...

最終就是把label跟logits拿去計算loss，不過這裡已經到tf.nn這個原始API了，身為上層API的使用戶，我已經無法繼續解釋下去了，所以只能在這裡打住。