iT邦幫忙

2021 iThome 鐵人賽

DAY 16
0
AI & Data

Python 機器學習實驗室 ʘ ͜ʖ ʘ系列 第 16

[Python]文字識別模型-PaddleOCR

  • 分享至 

  • xImage
  •  

今天剛好找到一個有趣的文字識別模型,想來和大家介紹一下~

PaddleOCR

PaddleOCR是百度研究出來的文字識別模型,主要可以把圖片當成input然後判斷裡面的文字,實際用python操作起來非常的容易,大家有空可以自己玩一下,因為本身模型非常小,用cpu也是可以跑得動的呦!接下來就直接來用python實作吧!

下載paddleocr之前需要先裝paddle,可以把它想像成是基礎架構,如果用gpu跑的人記得把code換成:
!python -m pip install paddlepaddle**-gpu**==2.0.0 -i https://mirror.baidu.com/pypi/simple

# GitHub repo installation of paddle
!python3 -m pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple

接下來下載paddleocr

!pip install "paddleocr>=2.0.1" # Recommend to use version 2.0.1+
from paddleocr import PaddleOCR,draw_ocr
from matplotlib import pyplot as plt 
import cv2 #opencv
import os 

直接開始蓋model,使用gpu的把use_gpu改成True,或是刪掉因為default就是True,另外paddleocr支援多國語言識別,大家也可以把lang換掉玩玩看
https://ithelp.ithome.com.tw/upload/images/20210930/20142004e9toifBNdV.png

# Setup model
ocr_model = PaddleOCR(lang='en',use_gpu=False)

放入一張圖片分析一下:

img_path = os.path.join('.', 'test.jpg')
# Run the ocr method on the ocr model
result = ocr_model.ocr(img_path)

來看看識別結果,回傳的資料為文字的位置,文字內容,與準確度:

result

https://ithelp.ithome.com.tw/upload/images/20210930/20142004SiwWAhBGNr.png

也可以單獨把文字列出來,最後放上原圖比較:

for res in result:
    print(res[1][0])

https://ithelp.ithome.com.tw/upload/images/20210930/20142004ROeay6yKaZ.png

https://ithelp.ithome.com.tw/upload/images/20210930/20142004PlVHagn0NV.jpg

這個方便程度還有準確度真的是非常的神奇啊~

[reference]
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_en/quickstart_en.md#paddleocr-quick-start
https://pypi.org/project/paddleocr/
https://www.youtube.com/watch?v=t5xwQguk9XU


上一篇
回歸模型的衡量標準:MSE. RMSE. MAE. MPE
下一篇
p value到底怎麼解釋
系列文
Python 機器學習實驗室 ʘ ͜ʖ ʘ30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

0
effytseng
iT邦新手 5 級 ‧ 2023-08-07 01:41:09

不知道有沒有人在安裝的時候遇到問題 “an error in building wheel for PyMuPDF.”

貼一下解法:
https://stackoverflow.com/questions/76379293/how-can-i-fix-the-error-in-pymupdf-when-installing-paddleocr-with-pip

謝謝文章分享

我要留言

立即登入留言