各位安安,我是這次2023 IT鐵人賽"軟體開發組"的參賽者Vincent Yeh,很高興你來參觀我的文章。由於我之前有在課堂上學習過影像處理,也有實際參加過影像處理相關領域的實作競賽,雖然有一定的實作基礎,但回頭過來,我學到的其實也只是冰山一角。
影像處理這門學問不只是牽扯到寫程式的技能,更牽扯到數學、演算法在影像處理上的應用,以往的我欠缺理論的基底,只能在不斷的試誤中學習,大量嘗試的時間和學習到的東西不成正比。
為了精進自己的影像處理理論基礎,我決定參加這次的比賽,想透過這次的比賽增加我對影像處理的理論基礎,並搭配實作學習。當然,最主要還是希望將影像處理的技術用我個人的理解方式呈現給網路上的你。為了這次的比賽,我會將我理解到的知識盡可能用圖片呈現,整理繁雜的文字成易於理解的圖片。
最後,如果文章有任何錯誤,也請大家多多指教。
一張車子的圖片對人類來說非常豐富,因為我們有一顆聰明的大腦,我們可以依據以前的經驗根據影像的顏色、形狀、大小和細節,並迅速識別出這是一輛車。我們可以根據這些資訊推斷車的外觀、品牌和型號等。
但對於電腦來說,這張圖片只是一堆數字。每個數字代表圖片中每個像素的顏色和亮度。對電腦而言,這些數字表面上沒有特殊意義,畢竟他沒有像我們一樣聰明的大腦,它無法理解這是一張車子的圖片,更無法識別車子的外觀、品牌或型號。
影像處理的主要作用是從影像中提取或增強有用資訊。通過這些技術讓電腦像人一樣「看懂」影像中的重要資訊,進而辨識出影像中的特定物體,如人臉、車輛和標誌。這種能力使得電腦能夠從看似無意義的數字數據中尋找影像中的資訊,並根據這些有用的資訊做出自主的決策和行動。這種「理解」影像的能力,使得影像處理技術在自動化、機器視覺和醫學診斷等領域得到廣泛的應用。
Photo by jay pizzle: https://www.pexels.com/photo/photo-of-black-lamborghini-3802510/
OpenCV 是一個開源的電腦視覺和影像處理函式庫,全稱為Open Source Computer Vision Library。它由Intel於1999年創立,現在由一個由開發人員和社區組成的團隊維護和開發。
OpenCV 提供了許多強大的影像處理和電腦視覺函式,涵蓋了各種領域,包括特徵檢測、物體識別、影像分割、影像增強、三維重建等。它支援多種程式語言,如C++、Python、Java等,使得開發人員能夠輕鬆使用這些功能來開發各種應用。
OpenCV 的應用非常廣泛,它在電腦視覺、自動駕駛、醫學影像處理、監控系統、虛擬現實、藝術創作等領域都有重要的應用。由於其開源自由的特性和龐大的社區支持,OpenCV 成為了電腦視覺和影像處理領域中領先的影像處理函式庫之一,被廣泛應用於學術研究和商業開發。
By Adi Shavit - http://opencv.willowgarage.com/wiki/OpenCVLogo, Public Domain, https://commons.wikimedia.org/w/index.php?curid=26547749
萊娜圖(Lenna)是指刊於1972年11月號《花花公子》雜誌上的一張裸體插圖相片的一部分。這張圖片大小為512x512像素,這張圖片很好的包含了平坦區域、陰影和紋理等細節,這些都有益於測試各種不同的影像處理演算法,使它成為一幅很好的測試相片,據說甚至成為了一種工業標準,是一幅很有價值的數位圖片。
在接下來幾天的教學,你也會時常看到她的身影,陪伴你走入影像處理學問的大門。
由 南加州大學訊號及圖像處理學院圖庫, Fair use, https://zh.wikipedia.org/w/index.php?curid=102343Q