iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
自我挑戰組

資料分析及AI深度學習-簡單基礎實作 系列

1.於2021年參加玉山銀行AI競賽,以此記錄比賽歷程,分享中文字圖像辨識。
2.需透過CV演算法,訓練影像辨識模型,精準辨識圖片內手寫文字。
3.將從取得data開始,紀錄每天比賽進度以及學習狀況。
4.專案需求的文字匹配應用。
5.專案需求的驗證碼辨識,自動輸入資料,取得所需資訊。
6.人工智慧平台及Kaggle資料分析實作。

皆為實作學習心得,與各位喜好資料分析及AI的同仁分享,教學相長。

鐵人鍊成 | 共 30 篇文章 | 10 人訂閱 訂閱系列文 RSS系列文
DAY 11

DAY11:機器學習模型_筆記分享

摘要 1. 監督式學習 多元迴歸分析 正規化回歸 羅吉斯迴歸 樸素貝葉斯模型 KNN 支援向量機 CART樹 類神經網路ANN 2. 非監督式學習 主成分...

2021-09-26 ‧ 由 Frank 分享
DAY 12

DAY12:玉山人工智慧挑戰賽-中文手寫字辨識(前言)

參賽契機 之前參加資策會,結訓時都會做個專題啦,但因為我自己對我們組的專題挺不滿意,而且對於深度學習這塊,資策會老師由於課堂太少,講話跟開飛機一樣快,這個部...

2021-09-27 ‧ 由 Frank 分享
DAY 13

DAY13:玉山人工智慧挑戰賽-中文手寫字辨識(資料前處理)

問題及解決方法 資料集問題: 圖檔沒有文字卻有標籤。 一張圖片多個文字。 標籤錯誤。 圖檔的字不明確。 解決方法: 我們先用抽樣的小量樣本(這裡我...

2021-09-28 ‧ 由 Frank 分享
DAY 14

DAY14:玉山人工智慧挑戰賽-中文手寫字辨識(OpenCV圖像處理)

問題及解決方法 用YOLOv4模型裁切出來的文字,大部分的圖檔,都有紅框等雜訊的存在,如下圖。若將含有雜訊的圖檔丟進模型訓練,可能會造成失焦而影響準確度。  ...

2021-09-29 ‧ 由 Frank 分享
DAY 15

DAY15:玉山人工智慧挑戰賽-中文手寫字辨識(Pytorch 自訂義資料集)

資料擴增 我們組的資料擴增這部分,因為第一次比賽,這個方法效果沒有到非常好,採取的是用mask的方式,讓圖檔多加一些遮蔽物,如下圖。詳細操作參考組員的分享(傳...

2021-09-30 ‧ 由 Frank 分享
DAY 16

DAY16:Pytorch transforms(上)

torchvision.transforms transforms可以用來改變樣本的多樣性,例如:旋轉、平移等等,訓練圖像辨識時,一定會用到的工具,現在來跟大家...

2021-10-01 ‧ 由 Frank 分享
DAY 17

DAY17:Pytorch transforms(下)

torchvision.transforms transforms可以用來改變樣本的多樣性,例如:旋轉、平移等等,訓練圖像辨識時,一定會用到的工具,現在來跟大家...

2021-10-02 ‧ 由 Frank 分享
DAY 18

DAY18:激活函數

激活函數 每個神經元都有一個激活函數,由這層神經元輸出給下層神經元的輸入,中間就會有個函數關係,將之做非線性轉換。 使用激活函數,可使上一層節點做非線性...

2021-10-03 ‧ 由 Frank 分享
DAY 19

DAY19:學習率(上)

學習率(learning rate) 學習率為控制模型中梯度下降的速度,也有人稱為步長。 公式:新權重 = 舊權重 - 學習率 * 梯度 learning r...

2021-10-04 ‧ 由 Frank 分享
DAY 20

DAY20:學習率(下)

學習率 學習率為控制模型中梯度下降的速度,也有人稱為步長。 公式:新權重 = 舊權重 - 學習率 * 梯度 learning rate的設置很重要,一般大家都...

2021-10-05 ‧ 由 Frank 分享