圖片來源:Jaided AI
在了解EasyOCR是什麼之前,我們先來認識一下光學字元辨識(OCR),OCR的用途是將文字影像轉換為機器可讀文字格式的程序,簡單舉個例子,如果你掃描了發票,電腦會將掃描的結果存為圖片檔,這個圖片檔不能進行文字編輯、搜索、或是針對文字進行計算,但使用OCR可以將圖片的結果轉為文字文件,並對其進行編輯。
回到主題上,EasyOCR是一個開源的OCR工具,由Jaided AI開發。他利用深度學習技術,特別是卷積神經網路(CNN)和循環神經網路(RNN),來提取和識別圖片中的文字。目前EasyOCR支持的語言多達80多種,包括中文、英文、日文、韓文以及泰文等,使得他非常適合處理多種語言的識別任務。
EasyOCR 是一個用 Python 編寫的光學字符識別(OCR)資料庫,其設計目的是簡化圖像中文字的提取和識別過程。它的檢測部分使用 CRAFT 算法,識別模型為 CRNN,整個深度學習過程基於 PyTorch 實現。詳細的說明會在明天的章節中說明。
EastOCR相較其他OCR軟體的優勢比較。圖片來源:EasyOCR中文
以上就是EasyOCR的基礎介紹,我們下篇見。