iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
AI & Data

手寫中文字之影像辨識 系列

1.前言:此系列文章,乃「玉山人工智慧挑戰賽2021夏季賽」之比賽歷程與學習成果。
2.目標:透過Image Processing與Computer Vision演算法,準確辨識手寫中文字。
3.期望透過分享此次實作經驗,跟對影像辨識有興趣的朋友們交流,激盪出不同的解題思維。

鐵人鍊成 | 共 31 篇文章 | 13 人訂閱 訂閱系列文 RSS系列文
DAY 21

【第21天】訓練模型-模型組合與辨識isnull(二)

摘要 作業流程 設定資料集路徑 找出每個中文字的閾值 任意選擇奇數個模型組合後,產生模型權重表與利用新模型權重得到的機率表。 判斷isnull 內容...

2021-10-06 ‧ 由 midnightla 分享
DAY 22

【第22天】訓練模型-模型組合與辨識isnull(三)

摘要 交叉驗證不同方法組合的模型準確率 1.1 參數說明 1.2 程式碼 選擇模型組合方法 2.1 交叉比對結果 2.2 結論 內容 交叉驗證...

2021-10-07 ‧ 由 midnightla 分享
DAY 23

【第23天】部署API服務-GCP架設VM(一)

【第23天】部署API服務-GCP架設VM(一) 摘要 作業流程 啟用GCP服務 建立VM ssh連線 內容 作業流程(今日進度為1.1~1.3) 1...

2021-10-08 ‧ 由 midnightla 分享
DAY 24

【第24天】部署API服務-GCP架設VM(二)

摘要 作業流程 安裝環境/套件 上傳打包後模型 介紹Vim編輯器 慘痛經歷 內容 作業流程(今日進度為1.4~1.6) 安裝環境/套件 2.1...

2021-10-09 ‧ 由 midnightla 分享
DAY 25

【第25天】部署API服務-Python Flask

摘要 導入套件 模型初始化資料 API初始化 server_uuid 轉換圖片格式 模型辨識手寫中文字 檢查預測結果是否為字串 API服務 啟用API服務...

2021-10-10 ‧ 由 midnightla 分享
DAY 26

【第26天】探討與改善-增加訓練樣本(一)

摘要 前言 作業流程 手寫中文字開源資料 空白背景圖片 篩選出官方800字內 內容 前言 1.1 從賽後的交流中得知,勝出的隊伍將重心放在資料集本身,...

2021-10-11 ‧ 由 midnightla 分享
DAY 27

【第27天】探討與改善-增加訓練樣本(二)

摘要 作業流程 OpenCV合成新訓練集2.1 讀取中文路徑圖檔2.2 顯示圖檔2.3 侵蝕圖檔白色區域2.4 圖檔前處理2.5 手寫中文字旋轉2.6 前後景...

2021-10-12 ‧ 由 midnightla 分享
DAY 28

【第28天】探討與改善-資料不平衡(一)

摘要 說明1.1 資料類別不平衡1.2 示例1.3 多元分類 前置作業2.1 分類中文字2.2 計算每個類別的樣本數量 改善方法3.1 模型訓練時調...

2021-10-13 ‧ 由 midnightla 分享
DAY 29

【第29天】探討與改善-資料不平衡(二)

摘要 前言 實驗設計2.1 預訓練模型2.2 資料集 模型訓練方式3.1 最初模型(model_origin)3.2 模型訓練時調整類別權重(mod...

2021-10-14 ‧ 由 midnightla 分享
DAY 30

【第30天】最終回

玉山競賽心得 從朋友口中得知玉山銀行和趨勢科技舉辦了中文手寫字辨識的比賽,於是我們召集資策會夥伴們組團參加。 拿到資料後,我們興奮地討論要如何處理圖片、訓練模...

2021-10-15 ‧ 由 midnightla 分享