iT邦幫忙

2021 iThome 鐵人賽

DAY 2
1
AI & Data

手寫中文字之影像辨識系列 第 2

【第2天】開賽準備

環境安裝

  1. Python
    1.1 版本與下載

    • Python2於2020/1/1官方宣布停止維護與更新。且網路上查詢的教學或分享文,Python3資源是比較多的。
    • 我現在使用的Python版本是3.7.8_64位元(last bugfix release),可按 官網載點 下載。
    • 大家可以到 Python官網,查詢版本詳細資訊。如果有更推薦的版本歡迎補充。

    1.2 安裝流程,請參考此處

  2. Pycharm
    1.1 版本與下載

    • 官網載點
    • 進入頁面後,後請點選下載Community版本。

    1.2 安裝流程,請參考此處


解題思路

  1. 流程圖

  2. 我將解題思路大致區分為下列章節,希望大家對接下來的分享,有一個初步的認識。

    2.1 資料前處理

    • YOlOv4與自動框選中文字
    • 圖檔分類與裁切
    • 去除雜訊與灰階
    • 資料擴增

    2.2 訓練模型

    • 前置作業
    • 訓練方法
    • 遷移學習
    • Keras Application
    • Model訓練實例(辨識800類/字)
    • 模型加權組合與辨識isnull(辨識第801類-其他)

    2.3 部署API服務

    • GCP架設VM
    • API服務(Python+Flask)

    2.4 探討與改善

    • 增加訓練樣本
    • 數據不平衡

※註:考量到文章完整性與閱讀的流暢度,章節可能進行微調。


小結

下一站,我們從資料前處理出發,介紹「YOlOv4與自動框選中文字」。


上一篇
【第1天】前言
下一篇
【第3天】資料前處理-YOLOv4與自動框選中文字
系列文
手寫中文字之影像辨識31

尚未有邦友留言

立即登入留言