第十三屆 佳作

ai-and-data
手寫中文字之影像辨識
midnightla

系列文章

DAY 1

【第1天】前言

背景 曾任職被動元件廠的品保工程師,鑒於以往資料分析無法滿足龐雜的資料與客戶端需求,希望培養資料洞察力與建模預測能力,到資策會AI/Big Data資料分析班...

DAY 2

【第2天】開賽準備

環境安裝 Python1.1 版本與下載 Python2於2020/1/1官方宣布停止維護與更新。且網路上查詢的教學或分享文,Python3資源是比較多的...

DAY 3

【第3天】資料前處理-YOLOv4與自動框選中文字

現況 觀察主辦單位提供的資料集(約7萬張圖檔),發現圖檔大致分為下列幾種。1.1 圖檔內只有1個中文字 1.2 圖檔內中文字有其他字跡或只有半個字 1.3...

DAY 4

【第4天】資料前處理-圖檔分類與裁切

現況 以YOLOv4模型框選中文字後,將資料集(約7萬張)區分為以下類別: 1.1 word(僅有1個中文字) 1.2 words(2個以上中文字)...

DAY 5

【第5天】資料前處理-去除雜訊與灰階

現況 清洗後的圖檔,部分仍有紅框等雜訊,或是中文字體顏色不同(藍色、黑色),如下圖。 若將含有不同顏色中文字或不同位置紅框的圖檔納入模型訓練,可能影...

DAY 6

【第6天】資料前處理-資料擴增

現況 辨識手寫中文字時,若圖檔內中文字跡有部分缺失,或是油墨洩漏造成字跡髒汙,可能導致模型辨識錯誤,如下圖。 訓練影像辨識模型時,總不可避免地面臨...

DAY 7

【第7天】訓練模型-前置作業

現況 在開始訓練模型之前,先和大家分享如何在Windows 10安裝CUDA、cuDNN。藉由tensorflow-GPU訓練模型,降低訓練模型的時間。以下...

DAY 8

【第8天】訓練模型-CNN與訓練方向

摘要 CNN的來源 淺談CNN架構 CNN的應用 訓練模型方向 內容 CNN的來源 1.1 啟發:動物視覺皮質組織與神經元間連結,到最後辨識物件的過程...

DAY 9

【第9天】訓練模型-遷移學習

摘要 遷移學習說明 遷移學習類型 淺談預訓練與微調 如何進行遷移學習 內容 說明:基於資料集(ImageNet分類包括蛇、蜥蜴)、任務(皆為圖片分類)...

DAY 10

【第10天】訓練模型-預訓練模型

摘要 Keras Application 預訓練模型種類 模型選用考量 選用結果 內容 Keras Application 1.1 簡介: ILSV...