[Python]文字識別模型-PaddleOCR

2021 iThome 鐵人賽

DAY 16

AI & Data

Python 機器學習實驗室 ʘ ͜ʖ ʘ系列第 16 篇

13th鐵人賽 ocr

nancysunnn

2021-09-30 23:39:12

24986 瀏覽

分享至

今天剛好找到一個有趣的文字識別模型，想來和大家介紹一下～

PaddleOCR

PaddleOCR是百度研究出來的文字識別模型，主要可以把圖片當成input然後判斷裡面的文字，實際用python操作起來非常的容易，大家有空可以自己玩一下，因為本身模型非常小，用cpu也是可以跑得動的呦！接下來就直接來用python實作吧!

下載paddleocr之前需要先裝paddle，可以把它想像成是基礎架構，如果用gpu跑的人記得把code換成：
!python -m pip install paddlepaddle**-gpu**==2.0.0 -i https://mirror.baidu.com/pypi/simple

# GitHub repo installation of paddle
!python3 -m pip install paddlepaddle==2.0.0 -i https://mirror.baidu.com/pypi/simple

接下來下載paddleocr

!pip install "paddleocr>=2.0.1" # Recommend to use version 2.0.1+

from paddleocr import PaddleOCR,draw_ocr
from matplotlib import pyplot as plt 
import cv2 #opencv
import os

直接開始蓋model，使用gpu的把use_gpu改成True，或是刪掉因為default就是True，另外paddleocr支援多國語言識別，大家也可以把lang換掉玩玩看

# Setup model
ocr_model = PaddleOCR(lang='en',use_gpu=False)

放入一張圖片分析一下：

img_path = os.path.join('.', 'test.jpg')
# Run the ocr method on the ocr model
result = ocr_model.ocr(img_path)

來看看識別結果，回傳的資料為文字的位置，文字內容，與準確度：

result

也可以單獨把文字列出來，最後放上原圖比較：

for res in result:
    print(res[1][0])

這個方便程度還有準確度真的是非常的神奇啊～

[reference]
https://github.com/PaddlePaddle/PaddleOCR/blob/release/2.3/doc/doc_en/quickstart_en.md#paddleocr-quick-start
https://pypi.org/project/paddleocr/
https://www.youtube.com/watch?v=t5xwQguk9XU

回歸模型的衡量標準：MSE. RMSE. MAE. MPE

p value到底怎麼解釋

系列文

Python 機器學習實驗室 ʘ ͜ʖ ʘ 共 30 篇

RSS系列文訂閱系列文

6 人訂閱

完整目錄

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

1 則留言

effytseng

iT邦新手 5 級 ‧ 2023-08-07 01:41:09

不知道有沒有人在安裝的時候遇到問題 “an error in building wheel for PyMuPDF.”

貼一下解法：
https://stackoverflow.com/questions/76379293/how-can-i-fix-the-error-in-pymupdf-when-installing-paddleocr-with-pip

謝謝文章分享

回應
檢舉

登入發表回應

我要留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

Python 機器學習實驗室 ʘ ͜ʖ ʘ系列 第 16 篇