iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
自我挑戰組

資料分析及AI深度學習-簡單基礎實作 系列

1.於2021年參加玉山銀行AI競賽,以此記錄比賽歷程,分享中文字圖像辨識。
2.需透過CV演算法,訓練影像辨識模型,精準辨識圖片內手寫文字。
3.將從取得data開始,紀錄每天比賽進度以及學習狀況。
4.專案需求的文字匹配應用。
5.專案需求的驗證碼辨識,自動輸入資料,取得所需資訊。
6.人工智慧平台及Kaggle資料分析實作。

皆為實作學習心得,與各位喜好資料分析及AI的同仁分享,教學相長。

鐵人鍊成 | 共 30 篇文章 | 14 人訂閱 訂閱系列文 RSS系列文
DAY 21

DAY21:優化器(上)

優化器 優化器演算法 在反向傳播的過程中,優化器的用途在於最小化損失函數的loss值,期望找到全局的最佳解。 有可能會遇到昨天我們所說的鞍點,這時搭...

2021-10-06 ‧ 由 Frank 分享
DAY 22

DAY22:優化器(中)

開始比較各種優化器 這邊都先固定學習率0.01。 SGD+momentum(學習率設置0.001時,訓練出來每回合準確度都為0,於是改設置0.6) ba...

2021-10-07 ‧ 由 Frank 分享
DAY 23

DAY23:優化器(下)

開始比較各種優化器 這邊都採用變動學習率CosineAnnealing。示範我這邊T_max只用6。 scheduler = torch.optim.lr_...

2021-10-08 ‧ 由 Frank 分享
DAY 24

DAY24:模型訓練ResNet152

ResNet 簡介 在當時的CNN中,都是較淺層的設計,較深層的訓練未必會帶來正面效果,容易訓練不起來,帶來更差的效果。在2015年提出的ResNet改變...

2021-10-09 ‧ 由 Frank 分享
DAY 25

DAY25:模型訓練DenseNet201

DenseNet201 簡介 DenseNet繼承了ResNet的短路連線機制,並調整為密集連接機制。密集連線比傳統的網路有更少的參數,因為不需要重新學...

2021-10-10 ‧ 由 Frank 分享
DAY 26

DAY26:判斷800字外為isnull的方法

組合模型判斷非800字內的字為isnull 獲得各模型預測字的機率表 800字內 800字外 測試賽資料集 資料總筆數 官方800字內:train...

2021-10-11 ‧ 由 Frank 分享
DAY 27

DAY27:GCP架設VM

GCP啟用 點擊此處開啟免費試用。 申請免費試用,先填寫個人資料,並且需填寫信用卡號(會扣款1美金測試,測試完會退還)。 通過驗證後前往主控台。...

2021-10-12 ‧ 由 Frank 分享
DAY 28

DAY28:VM安裝套件以及GCP注意事項

VM環境安裝及打包上環境 安裝環境及套件 輸入sudo apt update 更新apt 輸入sudo apt-get install python...

2021-10-13 ‧ 由 Frank 分享
DAY 29

DAY29:開啟API服務(完賽)

部署及開啟API服務-flask 導入套件 import base64 import datetime import hashlib import time...

2021-10-14 ‧ 由 Frank 分享
DAY 30

DAY30:賽後心得檢討

完賽檢討 資料處理 雖然我們有大致上把紅框等雜訊去除掉,但我們還是沒有完全把照雜訊清除乾淨。 YoloV4去框中文字,可是有些圖片會被框失誤,會浪費幾張框...

2021-10-15 ‧ 由 Frank 分享