用Python結合Open Cv建立簡易圖片辨識

python系列文章 #opencv python opencv 初學者影像辨識

xiangcheng 2024-05-23 13:23:26 ‧ 742 瀏覽

分享至

使用python製作簡易OpenCV影像辨識的小實作，有提供Pycharm及Spyder的opencv庫安裝方式，後續將實作Androidstudio安卓系統與OpenCV結合的APP，以下言論純個人分享，如有大神能建議及改善的地方非常歡迎留言!!!
開發流程:

使用Pycharm、Spyder安裝OpenCV庫
引入OpenCV庫(圖像、視頻處理)、Nympy庫(陣列數值計算)及導入下載圖片
灰階(使用opencv運算COLOR_BGR2GRAY)
二值化(Threshold)
邊緣化Canny
膨脹/侵蝕

使用Pycharm、Spyder安裝OpenCV庫

Pycharm
pip install numpy
pip install opencv-python
下載失敗時可重新安裝
pip uninstall numpy
pip uninstall opencv-python
Spyder (Anaconda)
到此位置安裝
pip install numpy
pip install opencv-python

開始實作前須先了解OpenCV圖像處理

灰階(Grayscale):將色彩圖片轉成0~255的灰色圖片，而中間的數值表示不同程度的灰色，0表黑色，255表白色。
二值化(Threshold):將圖片轉成只有兩種顏色的圖像，黑、白。通常會先灰階後，再由0~255內定義閥值及最大值255，大於閥值=255白色，小時閥值0黑色。
邊緣化(Canny):檢測圖片中的邊緣，進行高斯濾波(GaussianBlur)處理，減少細節，讓邊緣化準確率提高。
膨脹(Dilate):增強特定區域的範圍，使特定區域變大膨脹，其目的是填補之間縫隙與小孔。
侵蝕(Erode):與膨脹相反，其目的是將兩者相連更好分開。
輪廓(contours):代表了物體的外形或邊界，常使用輪廓來描述物體的形狀、計算物體的面積、計算物體的矩形或圓形等。
矩形框(Rectangles):包圍物體或物體的輪廓，需要先找到物體的輪廓，然後才能計算或劃出矩形框。
Canny 邊緣檢測和輪廓是圖像處理中兩個不同的概念，Canny前者，輪廓後者。

引入OpenCV庫(圖像、視頻處理)、Nympy庫(陣列數值計算)及導入下載圖片
import cv2
import numpy as np
提供圖片使用:
將圖片匯入並顯示

import cv2
img = cv2.imread("E:/2024_NTNU/Python/NN.JPG")
img = cv2.resize(img, (700, 500))
cv2.imshow("image1", img)
cv2.waitKey(0)
cv2.destroyAllWindows()

imread:讀取圖片位置("X:/../../../XX.JPG")
resize:將圖片轉成自己調整的大小(寬,高)
imshow:顯示圖片("image1"標題框, img定義的圖片名變數)
waitKey:無限等待時間，這個沒打圖片會消失or當機
cv2.destroyWindows(Windows_name):刪除單一指定影像視窗
cv2.destroyAllWindows():刪除所有Open Cv影像視窗

灰階(使用opencv運算COLOR_BGR2GRAY)

import cv2
img = cv2.imread("E:/2024_NTNU/Python/NN.JPG")
img = cv2.resize(img, (700, 500))
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
cv2.imshow("image1", gray_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

gray_img為灰階後的圖片

二值化(Threshold)
binary_img = cv2.threshold(gray_img, 128, 255, cv2.THRESH_BINARY)[1]
使用threshold會返回兩個值，[0]是原本的灰階後圖片，[1]是二值化後的圖片
也可以寫成
_, binary_img = cv2.threshold(gray_img, 128, 255, cv2.THRESH_BINARY)
記得底下cv2.imshow("image1", img)的img改成你定義的圖片
Canny邊緣化

import cv2
img = cv2.imread("E:/2024_NTNU/Python/NN.JPG")
img = cv2.resize(img, (700, 500))
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
canny_img = cv2.Canny(gray_img, 60, 0)
cv2.imshow("image1", canny_img)
cv2.waitKey(0)
cv2.destroyAllWindows()

圖片邊緣=與周圍像素質差很大(圖片,最低門檻值(200以下過濾),最高門檻值(超過當邊緣))
可以自行設定閥值

膨脹
需要使用到import numpy as np矩陣運算

import cv2
import numpy as np
kernel = np.ones((5, 5), np.uint8)
img = cv2.imread("E:/2024_NTNU/Python/NN.JPG")
img = cv2.resize(img, (700, 500))
gray_img = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
canny_img = cv2.Canny(gray_img, 60, 0)
dilate = cv2.dilate(canny_img, kernel, iterations=1)
cv2.imshow("image1", dilate)
cv2.waitKey(0)
cv2.destroyAllWindows()

kernel = np.ones((5, 5), np.uint8)
使用創建NumPy庫中的np.ones創建一個5*5正方形結構(5行5列)
dilate = cv2.dilate(canny_img, kernel, iterations=1)
膨脹效果=邊緣線條變粗(圖片,2微陣列的和(np),膨脹次數)

侵蝕
eroded_img = cv2.erode(canny_img, kernel, iterations=0)
侵蝕效果=邊緣線條變細(圖片,2微陣列的和(np),侵蝕次數)
canny_img未膨脹過的:iterations我用成1就都讀不到了
dilate = cv2.dilate(canny_img, kernel, iterations=1)
eroded_img = cv2.erode(dilate, kernel, iterations=2)
這是先經由膨脹後再決定侵蝕程度
矩形框將陸續更新，希望各位大大都能成功!!!
以上言論是我自己所定義的沒有完全是對的，如有大神能建議及改善的地方非常歡迎留言!!!

直播研討會

{{ item.channelVendor }} {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 13th鐵人賽 14th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 2018鐵人賽 javascript 2017鐵人賽 python windows php c# windows server linux css react 程式設計 vue.js

IT邦幫忙

用Python結合Open Cv建立簡易圖片辨識

尚未有邦友留言

標記使用者