DAY12：玉山人工智慧挑戰賽-中文手寫字辨識（前言） - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2021 iThome 鐵人賽

DAY 12

0

自我挑戰組

資料分析及AI深度學習-簡單基礎實作系列第 12 篇

DAY12：玉山人工智慧挑戰賽-中文手寫字辨識（前言）

13th鐵人賽

2021-09-27 15:53:39

1505 瀏覽

分享至

參賽契機

之前參加資策會，結訓時都會做個專題啦，但因為我自己對我們組的專題挺不滿意，而且對於深度學習這塊，資策會老師由於課堂太少，講話跟開飛機一樣快，這個部分完全沒涉略到！結訓後，剛好看到有這比賽，跟資策會小夥伴們就組隊參加啦！
想實作圖像辨識，實作一次超越只看書所得到的東西，可以與隊友討論，做的結果好不好其次，還可以得到前三名的分享，我相信對於未來工作也是非常有幫助的。

比賽內容介紹

名稱：玉山人工智慧挑戰賽2021夏季賽-中文手寫影像辨識
比賽時間：2021/4/12-2021/6/18
比賽內容：
- 玉山提供約70000張中文手寫字的圖檔，檔名即是那個圖檔的字（標籤）。
- 參賽者需要辨識的有800個中文字，若圖檔文字非在800字內或無法辨識，則要判定為isnull。
- 參賽者利用各種方法去做辨識，只要API不連結人工（例如：Line）皆可。
- 將訓練好的模型及完成的API，部署到Google Cloud Platform進行比賽。
比賽成績：
- 比賽成績為所有參賽隊伍前10%，不是特別好的成績，但對我們來說初體驗得到這樣得結果，我們已經很開心了，從比賽中得到的收穫更是滿載而歸。

觀察資料集

拿到資料後，我們觀察到玉山給的圖檔裡面有些許問題：
- 空白圖檔
- 一張圖片多個文字
- 標籤錯誤
- 圖檔的字不明確
我們討論過後，決定用YOLOv4來處理多字的部分，將他切割成一個字一個字。
標籤錯誤的部分，我們只能人力分工去手動更改標籤。
最後還會用OpenCV將邊框紅線部分去掉。

今日小結

我怕我上述那樣打好像我在黑資策會，我並沒有那個意思喔！師資沒問題，是因為只有半年的時間，幾乎每天上課，要學程式、學資料庫、學統計等等，真的很多課程很豐富，只可惜時間太少，我個人比較笨一點，吸收比較慢，我還是很感謝去資策會所學到的，以及在資策會交到共同興趣的好朋友們，讓我能在結訓後還能與他們一起研究學習。
今天只是先簡單介紹一下，此比賽的規則及內容，明天會以資料前處理YOLOv4的部分來做分享。

DAY11：機器學習模型_筆記分享

DAY13：玉山人工智慧挑戰賽-中文手寫字辨識（資料前處理）

系列文

資料分析及AI深度學習-簡單基礎實作共 30 篇

目錄

RSS系列文訂閱系列文

14 人訂閱

完整目錄

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

AI會議轉錄如何盡可能縮小明文攻擊面？

IT邦幫忙