iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
AI & Data

手寫中文字之影像辨識 系列

1.前言:此系列文章,乃「玉山人工智慧挑戰賽2021夏季賽」之比賽歷程與學習成果。
2.目標:透過Image Processing與Computer Vision演算法,準確辨識手寫中文字。
3.期望透過分享此次實作經驗,跟對影像辨識有興趣的朋友們交流,激盪出不同的解題思維。

鐵人鍊成 | 共 31 篇文章 | 13 人訂閱 訂閱系列文 RSS系列文
DAY 1

【第1天】前言

背景 曾任職被動元件廠的品保工程師,鑒於以往資料分析無法滿足龐雜的資料與客戶端需求,希望培養資料洞察力與建模預測能力,到資策會AI/Big Data資料分析班...

2021-09-16 ‧ 由 midnightla 分享
DAY 2

【第2天】開賽準備

環境安裝 Python1.1 版本與下載 Python2於2020/1/1官方宣布停止維護與更新。且網路上查詢的教學或分享文,Python3資源是比較多的...

2021-09-17 ‧ 由 midnightla 分享
DAY 3

【第3天】資料前處理-YOLOv4與自動框選中文字

現況 觀察主辦單位提供的資料集(約7萬張圖檔),發現圖檔大致分為下列幾種。1.1 圖檔內只有1個中文字 1.2 圖檔內中文字有其他字跡或只有半個字 1.3...

2021-09-18 ‧ 由 midnightla 分享
DAY 4

【第4天】資料前處理-圖檔分類與裁切

現況 以YOLOv4模型框選中文字後,將資料集(約7萬張)區分為以下類別: 1.1 word(僅有1個中文字) 1.2 words(2個以上中文字)...

2021-09-19 ‧ 由 midnightla 分享
DAY 5

【第5天】資料前處理-去除雜訊與灰階

現況 清洗後的圖檔,部分仍有紅框等雜訊,或是中文字體顏色不同(藍色、黑色),如下圖。 若將含有不同顏色中文字或不同位置紅框的圖檔納入模型訓練,可能影...

2021-09-20 ‧ 由 midnightla 分享
DAY 6

【第6天】資料前處理-資料擴增

現況 辨識手寫中文字時,若圖檔內中文字跡有部分缺失,或是油墨洩漏造成字跡髒汙,可能導致模型辨識錯誤,如下圖。 訓練影像辨識模型時,總不可避免地面臨...

2021-09-21 ‧ 由 midnightla 分享
DAY 7

【第7天】訓練模型-前置作業

現況 在開始訓練模型之前,先和大家分享如何在Windows 10安裝CUDA、cuDNN。藉由tensorflow-GPU訓練模型,降低訓練模型的時間。以下...

2021-09-22 ‧ 由 midnightla 分享
DAY 8

【第8天】訓練模型-CNN與訓練方向

摘要 CNN的來源 淺談CNN架構 CNN的應用 訓練模型方向 內容 CNN的來源 1.1 啟發:動物視覺皮質組織與神經元間連結,到最後辨識物件的過程...

2021-09-23 ‧ 由 midnightla 分享
DAY 9

【第9天】訓練模型-遷移學習

摘要 遷移學習說明 遷移學習類型 淺談預訓練與微調 如何進行遷移學習 內容 說明:基於資料集(ImageNet分類包括蛇、蜥蜴)、任務(皆為圖片分類)...

2021-09-24 ‧ 由 midnightla 分享
DAY 10

【第10天】訓練模型-預訓練模型

摘要 Keras Application 預訓練模型種類 模型選用考量 選用結果 內容 Keras Application 1.1 簡介: ILSV...

2021-09-25 ‧ 由 midnightla 分享