手寫中文字之影像辨識 :: 2021 iThome 鐵人賽

Ethan Chen (midnight_tired)

iT邦新手 2 級 ‧ 點數 1015

深度學習工程師

23483

累計瀏覽數

29人

在追蹤

站內簡訊追蹤

鐵人檔案

2021 iThome 鐵人賽

回列表

AI & Data

手寫中文字之影像辨識系列

1.前言：此系列文章，乃「玉山人工智慧挑戰賽2021夏季賽」之比賽歷程與學習成果。
2.目標：透過Image Processing與Computer Vision演算法，準確辨識手寫中文字。
3.期望透過分享此次實作經驗，跟對影像辨識有興趣的朋友們交流，激盪出不同的解題思維。

鐵人鍊成｜共 31 篇文章｜ 15 人訂閱訂閱系列文 RSS系列文

1 Like 0 留言 2469 瀏覽

DAY 1

【第1天】前言

背景曾任職被動元件廠的品保工程師，鑒於以往資料分析無法滿足龐雜的資料與客戶端需求，希望培養資料洞察力與建模預測能力，到資策會AI/Big Data資料分析班...

2021-09-16 ‧ 由 Ethan Chen 分享

1 Like 0 留言 2134 瀏覽

DAY 2

【第2天】開賽準備

環境安裝 Python1.1 版本與下載 Python2於2020/1/1官方宣布停止維護與更新。且網路上查詢的教學或分享文，Python3資源是比較多的...

2021-09-17 ‧ 由 Ethan Chen 分享

1 Like 0 留言 7065 瀏覽

DAY 3

【第3天】資料前處理-YOLOv4與自動框選中文字

現況觀察主辦單位提供的資料集(約7萬張圖檔)，發現圖檔大致分為下列幾種。1.1 圖檔內只有1個中文字 1.2 圖檔內中文字有其他字跡或只有半個字 1.3...

2021-09-18 ‧ 由 Ethan Chen 分享

1 Like 0 留言 5072 瀏覽

DAY 4

【第4天】資料前處理-圖檔分類與裁切

現況以YOLOv4模型框選中文字後，將資料集(約7萬張)區分為以下類別： 1.1 word(僅有1個中文字) 1.2 words(2個以上中文字)...

2021-09-19 ‧ 由 Ethan Chen 分享

2 Like 0 留言 12788 瀏覽

DAY 5

【第5天】資料前處理-去除雜訊與灰階

現況清洗後的圖檔，部分仍有紅框等雜訊，或是中文字體顏色不同(藍色、黑色)，如下圖。若將含有不同顏色中文字或不同位置紅框的圖檔納入模型訓練，可能影...

2021-09-20 ‧ 由 Ethan Chen 分享

1 Like 0 留言 5761 瀏覽

DAY 6

【第6天】資料前處理-資料擴增

現況辨識手寫中文字時，若圖檔內中文字跡有部分缺失，或是油墨洩漏造成字跡髒汙，可能導致模型辨識錯誤，如下圖。訓練影像辨識模型時，總不可避免地面臨...

2021-09-21 ‧ 由 Ethan Chen 分享

1 Like 0 留言 10382 瀏覽

DAY 7

【第7天】訓練模型-前置作業

現況在開始訓練模型之前，先和大家分享如何在Windows 10安裝CUDA、cuDNN。藉由tensorflow-GPU訓練模型，降低訓練模型的時間。以下...

2021-09-22 ‧ 由 Ethan Chen 分享

0 Like 0 留言 5146 瀏覽

DAY 8

【第8天】訓練模型-CNN與訓練方向

摘要 CNN的來源淺談CNN架構 CNN的應用訓練模型方向內容 CNN的來源 1.1 啟發：動物視覺皮質組織與神經元間連結，到最後辨識物件的過程...

2021-09-23 ‧ 由 Ethan Chen 分享

1 Like 0 留言 6999 瀏覽

DAY 9

【第9天】訓練模型-遷移學習

摘要遷移學習說明遷移學習類型淺談預訓練與微調如何進行遷移學習內容說明：基於資料集(ImageNet分類包括蛇、蜥蜴)、任務(皆為圖片分類)...

2021-09-24 ‧ 由 Ethan Chen 分享

0 Like 0 留言 5032 瀏覽

DAY 10

【第10天】訓練模型-預訓練模型

摘要 Keras Application 預訓練模型種類模型選用考量選用結果內容 Keras Application 1.1 簡介： ILSV...

2021-09-25 ‧ 由 Ethan Chen 分享

Ethan Chen的鐵人檔案

Ethan Chen的收藏

Ethan Chen的追蹤

Ethan Chen的Like

Ethan Chen的紀錄

Ethan Chen的訂閱列表

鐵人檔案

手寫中文字之影像辨識 系列

標記使用者

手寫中文字之影像辨識系列