人類如何看見世界 在正式進入圖像處理與電腦視覺的領域之前,先來簡單說明「人類如何看見世界」這件事。人類的眼球由數個構造所構成,包含瞳孔 (pupil)、水晶體...
什麼是像素 我們可以想像眼前有一幅馬賽克拼貼畫,它由數萬個彩色磁磚構成,而對於數位影像來說,這些彩色磁磚所指的就是像素 (pixel)。一張數位影像,本質上是由...
從光子到檔案:曝光與影像格式 從按下相機快門的那刻,到變成我們看見的圖片之前,發生了哪些事情? 內部處理流程 在轉換程我們常見的 JPEG 格式前,相機前後基本...
在數位影像的世界裡,影像雜訊是無可避免的問題。無論是來自於光線不足、感光元件的熱雜訊,或是傳輸過程中的失真,雜訊都會降低影像品質。本篇將介紹常見的影像雜訊類型,...
特徵工程 如果我們要跟一個沒見過貓的朋友敘述貓的長相,我們正常不會說「他左上的第一個像素顏色是什麼」,而是敘述他的眼睛、耳朵、尾巴長怎麼樣。對電腦來說,讓他主動...
我們現在已經有能力從一張圖片中,提取出一組代表其結構的「重點座標」。但電腦要如何確定這是「同一個角」,而不是兩個不同的角呢? 描述子 描述子 (descript...
邊緣偵測 我們已經知道怎麼找出一張影像的特徵點,但是線的特徵也同樣重要,因此我們要從中提取有意義的線條。 邊緣偵測 (edge detection) 的目標是識...
幾何變換 當我們在兩張圖片中找到了對應的特徵點後,如何計算出一個能將一張圖片「變形」到另一張圖片視角下的矩陣?這個矩陣稱為單應性矩陣 (homography),...
RANSAC 雖然我們學到 ORB 能自動找到數十甚至上百對的匹配點,但其中不可避免地會包含一些錯誤的匹配。如果我們把這些包含「雜訊」的匹配點全部丟進去計算單應...
機器學習簡介 我們對傳統電腦視覺領域中,基於幾何和梯度的方法論,已經有了非常深入的理解和實踐。這些方法在處理具有明確規則和幾何結構的任務時,表現得非常出色,但如...