第十三屆 佳作

ai-and-data
手寫中文字之影像辨識
midnightla

系列文章

DAY 21

【第21天】訓練模型-模型組合與辨識isnull(二)

摘要 作業流程 設定資料集路徑 找出每個中文字的閾值 任意選擇奇數個模型組合後,產生模型權重表與利用新模型權重得到的機率表。 判斷isnull 內容...

DAY 22

【第22天】訓練模型-模型組合與辨識isnull(三)

摘要 交叉驗證不同方法組合的模型準確率 1.1 參數說明 1.2 程式碼 選擇模型組合方法 2.1 交叉比對結果 2.2 結論 內容 交叉驗證...

DAY 23

【第23天】部署API服務-GCP架設VM(一)

【第23天】部署API服務-GCP架設VM(一) 摘要 作業流程 啟用GCP服務 建立VM ssh連線 內容 作業流程(今日進度為1.1~1.3) 1...

DAY 24

【第24天】部署API服務-GCP架設VM(二)

摘要 作業流程 安裝環境/套件 上傳打包後模型 介紹Vim編輯器 慘痛經歷 內容 作業流程(今日進度為1.4~1.6) 安裝環境/套件 2.1...

DAY 25

【第25天】部署API服務-Python Flask

摘要 導入套件 模型初始化資料 API初始化 server_uuid 轉換圖片格式 模型辨識手寫中文字 檢查預測結果是否為字串 API服務 啟用API服務...

DAY 26

【第26天】探討與改善-增加訓練樣本(一)

摘要 前言 作業流程 手寫中文字開源資料 空白背景圖片 篩選出官方800字內 內容 前言 1.1 從賽後的交流中得知,勝出的隊伍將重心放在資料集本身,...

DAY 27

【第27天】探討與改善-增加訓練樣本(二)

摘要 作業流程 OpenCV合成新訓練集2.1 讀取中文路徑圖檔2.2 顯示圖檔2.3 侵蝕圖檔白色區域2.4 圖檔前處理2.5 手寫中文字旋轉2.6 前後景...

DAY 28

【第28天】探討與改善-資料不平衡(一)

摘要 說明1.1 資料類別不平衡1.2 示例1.3 多元分類 前置作業2.1 分類中文字2.2 計算每個類別的樣本數量 改善方法3.1 模型訓練時調...

DAY 29

【第29天】探討與改善-資料不平衡(二)

摘要 前言 實驗設計2.1 預訓練模型2.2 資料集 模型訓練方式3.1 最初模型(model_origin)3.2 模型訓練時調整類別權重(mod...

DAY 30

【第30天】最終回

玉山競賽心得 從朋友口中得知玉山銀行和趨勢科技舉辦了中文手寫字辨識的比賽,於是我們召集資策會夥伴們組團參加。 拿到資料後,我們興奮地討論要如何處理圖片、訓練模...