二、教你怎麼看source code，找到核心程式碼 ep.10：如何製作tfrecord? 2

第 12 屆 iThome 鐵人賽

DAY 17

AI & Data

從零.4開始我的深度學習之旅：從用tf.data處理資料到用tf.estimator或tf.keras 訓練模型系列第 17 篇

12th鐵人賽深度學習學習心得追蹤程式

細枝

團隊300萬 Tesla

2020-10-02 23:46:44

1741 瀏覽

分享至

文章說明

文章分段

文章說明
deeplab的簡單介紹、於我的意義
tensorflow的程式碼特色
訓練流程的細節
逛deeplab的github程式，順序：train.py model.py datasets/data_generator.py …

前情提要

開始講dataset資料夾的程式，首先從build_dataset_data.py開始，這份code需要根據每個dataset的架構的不同去撰寫，但簡言之其需要寫到的功能有：

處理參數的程式
定義tfrecord中的每一個tf example要存放的名字與型態
根據data與label的存放的型態，用對應載入程式將其載入
把準備好的資料按照定義，寫成一筆筆tf example存入tfrecord
以上兩步用迴圈處理
還可以按照資料集的不同分配，處理train與validation資料

Ep.9其實只有講到step 1而已，今天接著繼續按照程式順序來閱讀，準備從build_data.py說明自定義的reader。

開始吧。

逛deeplab的github程式

build_data.py

首先快速瀏覽一下這份code裡面包含的功能：

52行是將tensorflow用於讀取jpeg與png的2種method，合併成為一個通用的reader，使用時要先宣告要讀取的檔案型態。

105、120行是把讀取的資料轉成在儲存tfrecord時使用的TF_Feature型態。

接著是最後的136行，是適用於大部分segmentation任務的通用型tf example格式，包括2d data本身、檔名、2d影像的長與寬、還有label。

接著回到build_voc2012_data.py，104-105行分別宣告了用來處理data和label的reader。

由此可知，voc2012的資料集的data是jpeg格式，且為3維(RGB)的彩色影像；而label則是png格式的1維影像。

事實上，label不會是jpeg格式的原因是：jpeg是有損壓縮，將其載入回來的label有可能失真，所以一般來說，如果label被以一張影像的方式儲存的話，決大部分都是以png的格式進行儲存的。

二、教你怎麼看source code，找到核心程式碼 ep.9：如何製作tfrecord?

二、教你怎麼看source code，找到核心程式碼 ep.11：如何製作tfrecord? 3

系列文

從零.4開始我的深度學習之旅：從用tf.data處理資料到用tf.estimator或tf.keras 訓練模型共 30 篇

RSS系列文訂閱系列文

9 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

ChatGPT Business & Codex 如何從零開始?

IT邦幫忙

從零.4開始我的深度學習之旅：從 用tf.data處理資料 到 用tf.estimator或tf.keras 訓練模型系列 第 17 篇