iT邦幫忙

2022 iThome 鐵人賽

DAY 1
0
自我挑戰組

數位影像處理系列 第 1

[Day 1] 影像基礎

  • 分享至 

  • xImage
  •  

大家好,這次數位影像處理鐵人賽,希望藉由30天的技術知識分享,讓各位讀者能夠了解影像處理的基礎知識以及應用。

由於影像處理是一門很艱深的課程,原因在於其中的數學原理非常複雜。不過,除非要走研發演算法的路線,否則以應用層面來講,只要了解參數的意義以及各種Lib庫的使用就夠了,所以不用太擔心數學的問題,我會省略繁瑣的數學步驟,但仍會帶到基本原理,因此讀者不必擔心。

本課程讀者需具備基礎Python程式能力,若沒有學過Python,建議到網路上學習一些基礎語法喔!


一般的數位影像可以分成兩種,分別稱為灰階影像、色彩影像,如下圖
https://ithelp.ithome.com.tw/upload/images/20220908/20152370DPBJnqXFS8.jpg

相信若有學過訊號相關或是影像辨識課程的同學都很熟悉的一張圖,此圖稱為Lenna影像。

Lenna影像為典型的灰階影像,而色彩影像則是由光的三原色-紅(Red)、綠(Green)、藍(Blue)組成,簡稱RGB。

構成人體的最小單位是細胞,構成物質的最小單位是原子,那麼構成數位影像的最小單位是什麼呢? 就是像素(Pixel)

一個數位影像是由 M * N 的像素所組成,稱為影像大小(Image Size)或影像解析度(Image Resolution),其中
M 稱為列數(Number of Rows), N 稱為行數(Number of Columns)。

以Lenna圖來說,圖的左上角稱為原點(0,0),右下角的座標為(M - 1, N - 1),而Lenna圖的數位影像大小為
256 * 256 個像素,即 M = 256、N = 256, 總共有 256 * 256 = 65536 個像素。也因此我們可以猜得出來,數位影像是以一個二維陣列表示。

#請注意,數位影像的直角座標系和一般數學中的狄卡爾座標系不同,數位影像中,X軸縱軸,方向朝下,y軸橫軸,方向朝右。
https://ithelp.ithome.com.tw/upload/images/20220908/20152370Ag4Vpsxr2M.jpg


接著,讓我們來談談像素強度。一個像素的強度數定義為L,通常為2的冪次方,即https://chart.googleapis.com/chart?cht=tx&chl=L%20%3D%202%5Ek
也稱為位元深度(Bit Depth) 或 位元解析度(Bit Resolution),螢幕上常聽到的例如 8 bits 色深 或 10 bits 色深,由於 bits 數越多,2的k次方就越大,所能表示的顏色就更精確、更鮮豔。如下圖所示:
https://ithelp.ithome.com.tw/upload/images/20220908/20152370Kt1f9xAQLF.png

以灰階影像而言,每個像素的強度為 8位元, 而色彩影像的每個像素包含 R、G、B 三個數值,每個數值以8位元的資料儲存,共24位元。


最後,介紹一下現今常用的數位影像檔案格式:

  1. BMP:由微軟制定的影像檔案格式,常見於 Windows 作業系統,適用於相機拍攝的照片。BMP檔案格式支援 1、4、 6、8、16與24位元的影像,其中8位元可以是灰階,也可以是色彩影像,取決於色彩調色板的定義。24位元的影 像則為色彩影像。BMP分為無壓縮與有壓縮兩種,無壓縮的BMP較常見,經過數位影像處理後存檔也不會有失真的情形,而BMP雖然也支援影像壓縮(壓縮演算法為 Run Length Encoding,簡稱RLE),但並不常見。

  2. GIF:取自圖形交換格式(Graphic Interchange Format)的縮寫,有看過網路迷音的動圖應該都很了解XD。GIF檔案格式主要支援8位元的影像,同時採用 Lempel-Ziv-Welch(LZW)壓縮方式,此方法由於其檔案在壓縮後不會流失影像品質,即所謂的無失真壓縮,且壓縮後檔案大小可以有效降低傳輸時間,因此目前廣泛於網路使用。

  3. PNG:為可攜式網路圖(Portable Network Graphic)的縮寫,目的在取代GIF檔案格式。除了延續使用LZW壓縮方式,PNG額外支援48位元的影像,同時有加入透明的Alpha通道功能,成為目前設計專業領域常用的數位影像檔案格式。

  4. JPEG:取自聯合相片專家小組(Joint Photographic Experts Group)的縮寫。JPEG適用於相機拍攝的片等等,使用無失真壓縮技術,包含:離散餘弦轉換(Discrete Cosine Transform, DCT)、霍夫曼碼(Huffman Codes)。JPEG經過影像壓縮,可以提供理想的檔案大小、並維持良好的影像品質,因此在網路被廣泛使用。

  5. TIFF:為標籤影像檔案格式(Tagged Image File Format)的縮寫,適用於相機拍攝的照片等等。TIFF主要利用文件標頭中的標籤(Tag),不僅支援無失真和失真壓縮,同時也支援多影像跨平台等特殊應用,是一種適應性相當強的檔案格式。

今天的影像基礎就先介紹到這裡,礙於篇幅的關係,只介紹一些常見的檔案格式。下週將進入OpenCV的環節,感謝大家!


下一篇
[Day 2] OpenCV介紹
系列文
數位影像處理30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言