常見的影像修改
將影像匯入張量進行訓練是非常強力方式,但我們很少直接匯入原始影像。
常見的修改包括
鏡像(mirror)以進行資料擴張(data augmentation)。
調整到預期的輸入大小
Corp 臉部或其他所需的部分
鏡像張量
當正在嘗試訓練識別某種東西的模型時,可透過對現有的識別物照片透過鏡向來對資料集大小加倍。稍微整訓影像以擴增資料即是一種常見的做法。
有兩種方法可以用來翻轉影像的張量資料,一種是沿著寬度軸翻轉影像的方式修改影像張量資料,可以使用tf.reverse來表示只想翻轉包含影像的軸
例如:
因為我們清楚知道他的底層資料,所以可以輕易地進行轉換任何資料,例如RBG也可以。
而另一種是使用tf.image.flipLeftRight,它通常是用於批次的影像
首先我們先來說說何謂批次增加維度。
一維張量是一批次的值,就像一直線是一批次滿足該直線函數一樣。當一堆直線緊鄰在一起時就會從一維移動到二維平面,同樣的我們也可以將一維張量進行同樣1維到2維的過。
像是:
[
[1,2,3]&[7,8,9] = [1,2,3],
[7,8,9]
]
將兩形狀為3的1D張量組合後就可以變成形狀為[2,3]的2D張量,同理3D變4D也是如此。
我們可以使用tf.expandDims況張3D影像的維度然後使用tf.squeeze進行反轉
這比第一種複雜許多
今天就講到這裡,謝謝大家