iT邦幫忙

2021 iThome 鐵人賽

DAY 1
1
AI & Data

手寫中文字之影像辨識系列 第 1

【第1天】前言

背景

  1. 曾任職被動元件廠的品保工程師,鑒於以往資料分析無法滿足龐雜的資料與客戶端需求,希望培養資料洞察力與建模預測能力,到資策會AI/Big Data資料分析班進修,初步認識這個領域。
  2. 在進修期間確立了往資料科學發展的想法,在朋友的推薦下,開始到Kaggle Playground Competitions尋找有興趣的主題(主要是影像辨識),參考前輩們的解題邏輯自己摸索。
  3. 目前程度大約是:觀察資料集與確定目標後(ex.多元影像分類),可以自己安排資料清洗方式與模型訓練流程,及嘗試可能的模型優化方法。
  4. 「一個好的工程師,必須有自己的Side projects。可以是磨練新技術,或是解決生活中遇到的問題」。因此,我找了以前的夥伴組隊報名2021年的玉山人工智慧挑戰賽,才有了這系列的文章。

參賽契機

  1. 玉山人工智慧挑戰賽結束後,想找時間彙整競賽歷程和學習成果,但總是提不起勁。頻繁使用阿Q的精神勝利法安慰自己:「工作太忙、假日要適度休息...」,就這樣延宕了3個月。恰逢iThome鐵人賽,需要連續30天寫作分享,故把握這次機會,強迫自己走出舒適圈。
  2. 從一開始接觸Deep learning影像辨識,追隨前輩們步伐的懵懂前行,到伙伴們合力完成玉山AI競賽。藉由此次的沉澱,跟大家分享中文字辨識可能遇到的問題與解決方式,希望可以拋磚引玉、教學相長。

主題介紹

  1. 名稱:玉山人工智慧挑戰賽2021夏季賽-中文手寫影像辨識
  2. 期間:4/12/2021-6/18/2021
  3. 內容:
    • 主辦單位提供約七萬張手寫中文字圖檔,每個圖檔命名對應該中文字。參賽者透過CV演算法,精準辨識圖片內手寫文字。
    • 需要辨識的中文字共有800個,當該圖檔文字「無法辨識」或「不屬於800字的任何一類」,須判定為isnull(其他類別)。
    • 需要將訓練好的模型打包,在Google Cloud Platform部屬API Server,提供手寫中文字辨識服務。

小結

  1. 第1天的前情提要到此告一段落,接下來準備踏入影像辨識的領域。
  2. 請大家多指教,有任何問題或建議,歡迎留言討論。
  3. 由於撰文時間緊湊,實作的完整程式碼,會緩慢更新到GitHub上,請多見諒。

下一篇
【第2天】開賽準備
系列文
手寫中文字之影像辨識31

尚未有邦友留言

立即登入留言