開始講dataset資料夾的程式,首先從build_dataset_data.py開始,這份code需要根據每個dataset的架構的不同去撰寫,但簡言之其需要寫到的功能有:
Ep.9其實只有講到step 1而已,今天接著繼續按照程式順序來閱讀,準備從build_data.py說明自定義的reader。
開始吧。
首先快速瀏覽一下這份code裡面包含的功能:
接著回到build_voc2012_data.py,104-105行分別宣告了用來處理data和label的reader。
由此可知,voc2012的資料集的data是jpeg格式,且為3維(RGB)的彩色影像;而label則是png格式的1維影像。
事實上,label不會是jpeg格式的原因是:jpeg是有損壓縮,將其載入回來的label有可能失真,所以一般來說,如果label被以一張影像的方式儲存的話,決大部分都是以png的格式進行儲存的。