iT邦幫忙

2022 iThome 鐵人賽

DAY 12
0
AI & Data

初學者介紹TensFlow.js系列系列 第 12

[Day12]常見的影像修改

  • 分享至 

  • xImage
  •  

常見的影像修改

將影像匯入張量進行訓練是非常強力方式,但我們很少直接匯入原始影像。
常見的修改包括
鏡像(mirror)以進行資料擴張(data augmentation)。
調整到預期的輸入大小
Corp 臉部或其他所需的部分

鏡像張量
當正在嘗試訓練識別某種東西的模型時,可透過對現有的識別物照片透過鏡向來對資料集大小加倍。稍微整訓影像以擴增資料即是一種常見的做法。
有兩種方法可以用來翻轉影像的張量資料,一種是沿著寬度軸翻轉影像的方式修改影像張量資料,可以使用tf.reverse來表示只想翻轉包含影像的軸
例如:
https://ithelp.ithome.com.tw/upload/images/20220924/20152506SWK8FIk57l.png
因為我們清楚知道他的底層資料,所以可以輕易地進行轉換任何資料,例如RBG也可以。

而另一種是使用tf.image.flipLeftRight,它通常是用於批次的影像
首先我們先來說說何謂批次增加維度。
一維張量是一批次的值,就像一直線是一批次滿足該直線函數一樣。當一堆直線緊鄰在一起時就會從一維移動到二維平面,同樣的我們也可以將一維張量進行同樣1維到2維的過。
像是:
[
[1,2,3]&[7,8,9] = [1,2,3],
[7,8,9]
]
將兩形狀為3的1D張量組合後就可以變成形狀為[2,3]的2D張量,同理3D變4D也是如此。

我們可以使用tf.expandDims況張3D影像的維度然後使用tf.squeeze進行反轉
https://ithelp.ithome.com.tw/upload/images/20220924/20152506FhxNemiuGt.png

這比第一種複雜許多

今天就講到這裡,謝謝大家


上一篇
[day11]轉換影像張量2
下一篇
[Day13]常見的影像修改2
系列文
初學者介紹TensFlow.js系列30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言