iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 18
1

文章說明

文章分段

  1. 文章說明
  2. deeplab的簡單介紹、於我的意義
  3. tensorflow的程式碼特色
  4. 訓練流程的細節
  5. 逛deeplab的github程式,順序:train.py model.py datasets/data_generator.py …

 

前情提要

前面講了製作tfrecord需要的基礎功能,今天會把迴圈部分的邏輯講完。

 

逛deeplab的github程式(cont.)

build_voc2012_data.py (cont.)

  • 107行就是迴圈的開始,_NUM_SHARDS設4表示shard_id從0到3跑4圈。因為是用迴圈去使用shard,所以4個tfrecord分到的example並不是像玩撲克牌那樣,繞圈發牌,而是一個tfrecord發完num_per_shard張後,再開下一個tfrecord。

  • 108-110行則是設定tfrecord要叫什麼,假設output_dir是./result,且假設list dir底下的txt檔叫voc2012_train.txt,那tfrecord名稱就是voc2012_train-00000-of-00004.tfrecord

這樣的話4個tfrecord分別叫:0/4,1/4,2/4,3/4。
感覺把shard_id + 1比較符合直覺(1/4~4/4)。

  • 最後是111行是tfrecordwriter,功能就跟一般file writer差不多,主要不同之處是,他接受的是已經轉成string的tf example(看134行)。

 


112-114行,是在處理每個tfrecord會存放當初放在filenames中編號幾到幾的資料。我覺得這裡的寫法可以記,像我就不會馬上想到這樣處理。

 


不明白不用print()的原因。

 

  • 119-120行用i取出此次要處理的data,然後121行用tf.gfile.GFile用read byte模式,之後再用read轉換。

實際上應該可以直接用'r'就好。順便查一下為什麼他要這樣寫,跑去看官網的gfile沒有相關說明,那就看一下原始碼,這裡我就沒有切換branch,因為感覺不會差別太大。
然後看到super(),代表得去查_FileIO的寫法,

就去github的.../python/lib/io/file_io.py找東西
發現看無就放棄。

  • 接著122行用reader的read_image_dims拿到data的高跟寬,用的是tf的function
    • build_data.py:

      82行呼叫自定義的decode_image()

       


      看到97行,session.sun()裡面的程式是_decode,後面的feed_dict的前面是存放在變數self._decode_data的placeholder,冒號(:)後面是還沒decode的data

       


      67行:因為data reader是jpg格式,所以_decode用的是decode_jpeg(),他接的tensor是self._decode_data這個placeholder,然後在97行run的時候這個placeholder被丟入了當前還沒decode的data。

 


上一篇
二、教你怎麼看source code,找到核心程式碼 ep.10:如何製作tfrecord? 2
下一篇
二、教你怎麼看source code,找到核心程式碼 ep.12:如何製作tfrecord? 4
系列文
從零.4開始我的深度學習之旅:從 用tf.data處理資料 到 用tf.estimator或tf.keras 訓練模型30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言