iT邦幫忙

2024 iThome 鐵人賽

DAY 21
0
AI/ ML & Data

我的深度學習-從0開始實作物件偵測系列 第 21

【Day 21】深入探索EasyOCR:高效的文字識別工具介紹

  • 分享至 

  • xImage
  •  

一、EasyOCR是什麼?

EasyOCR_OSS3

圖片來源:Jaided AI

在了解EasyOCR是什麼之前,我們先來認識一下光學字元辨識(OCR),OCR的用途是將文字影像轉換為機器可讀文字格式的程序,簡單舉個例子,如果你掃描了發票,電腦會將掃描的結果存為圖片檔,這個圖片檔不能進行文字編輯、搜索、或是針對文字進行計算,但使用OCR可以將圖片的結果轉為文字文件,並對其進行編輯。

回到主題上,EasyOCR是一個開源的OCR工具,由Jaided AI開發。他利用深度學習技術,特別是卷積神經網路(CNN)和循環神經網路(RNN),來提取和識別圖片中的文字。目前EasyOCR支持的語言多達80多種,包括中文、英文、日文、韓文以及泰文等,使得他非常適合處理多種語言的識別任務。

二、EasyOCR的原理

EasyOCR 是一個用 Python 編寫的光學字符識別(OCR)資料庫,其設計目的是簡化圖像中文字的提取和識別過程。它的檢測部分使用 CRAFT 算法,識別模型為 CRNN,整個深度學習過程基於 PyTorch 實現。詳細的說明會在明天的章節中說明。

三、EasyOCR的優勢

  • API 極簡,一個方法,一行程式碼即可完成
  • 純本地化SDK,JAVA原生支持,可作為引擎嵌入各種項目,支援 Android 行動裝置集成
  • 支援 API 等級的識別白名單限定,限定識別範圍
  • 支援上百種語言識別,並支援混合語言識別,如:英文 + 日文 + 德文
  • 專門針對常用票據、驗證碼圖片的清理、識別一體化實現,內建多種常見類型的驗證碼圖片選項
  • EasyOCR Suite 跨平台 GUI 套件支持,為開發人員和消費者提供設計和使用工具
  • 支持辨識訓練,基於規則的結果修正訓練,讓辨識準確合理,提供後天能力成長
  • 可脫離環境變數運行
  • 跨平台支援:Window, Linux, Unix, Android
    image

EastOCR相較其他OCR軟體的優勢比較。圖片來源:EasyOCR中文

以上就是EasyOCR的基礎介紹,我們下篇見。
image


上一篇
【Day 20】實戰演練 - 微調模型測試!
下一篇
【Day 22】深入探索EasyOCR:探討運作方式
系列文
我的深度學習-從0開始實作物件偵測30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言