iT邦幫忙

鐵人檔案

2025 iThome 鐵人賽
回列表
AI & Data

從0開始:傳統圖像處理到深度學習模型 系列

逐步介紹基礎圖像處理與電腦視覺的領域,到近現代常見的機器學習模型於相關領域的應用。

參賽天數 23 天 | 共 23 篇文章 | 3 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day 11 - 機器學習初探(二) HOG 與 SVM

線性模型 前一天我們學到了最直觀的 KNN 演算法,但他在預測時需要計算與所有訓練樣本的距離,這在數據量大時會變得非常緩慢。它並沒有真正「學習」到一個濃縮的、高...

2025-08-21 ‧ 由 hibiki 分享
DAY 12

Day 12 - 深度學習初探

深度學習是機器學習的一個分支,它試圖模仿人類大腦中神經網路的結構和功能來進行學習。所謂的「深 (Deep)」,通常指的就是神經網路的「層數」很多。這些層層堆疊的...

2025-08-22 ‧ 由 hibiki 分享
DAY 13

Day 13 - 卷積神經網路(一) CNN 入門

ANN 的缺點 雖然 ANN 能夠自動學習特徵,但是他在處理影像時會把二維的圖片攤平成一維的向量,這會造成空間結構資訊的喪失。ANN 沒辦法理解相鄰或上下左右這...

2025-08-23 ‧ 由 hibiki 分享
DAY 14

Day 14 – 卷積神經網路(二) AlexNet 與 VGG

AlexNet 在 2012 年之前,舉世聞名的 ILSVRC (ImageNet Large Scale Visual Recognition Challen...

2025-08-24 ‧ 由 hibiki 分享
DAY 15

Day 15 - 卷積神經網路(三) GoogLeNet 與 ResNet

雖然昨天我們知道 VGGNet 在一定程度上有著網路越深、效果越好的特性,但是當研究人員把網路堆疊約 20 層以上時,模型的準確率反而開始下降。這不是過擬合所導...

2025-08-25 ‧ 由 hibiki 分享
DAY 16

Day 16 - 卷積神經網路(四)Grad-CAM

雖然我們學會了怎麼用各種不同 CNN 模型來進行圖像辨認,但對他的認識仍停留在黑盒子的階段。模型在做出「這是一隻貓」的決斷時,還是不知道它是依據什麼做判斷的,而...

2025-08-26 ‧ 由 hibiki 分享
DAY 17

Day 17 - 卷積神經網路(五)MobileNet

至今我們學習的 VGG、ResNet 等模型,它們的設計目標都是追求極致的準確率。然而,這些模型龐大的參數數量和巨大的計算量,使得它們很難被部署到手機、無人機、...

2025-08-27 ‧ 由 hibiki 分享
DAY 18

Day 18 - 遷移學習與資料增強

如果我們手上只有數百張貓狗的照片,是沒辦法像前幾天一樣訓練出像 ResNet 這種好的分類器,反而會遇到過擬合的問題。在這種缺乏數據的情況下,我們能用遷移學習...

2025-08-28 ‧ 由 hibiki 分享
DAY 19

Day 19 - 物件偵測(一)R-CNN

現實中的視覺任務,往往遠比我們前幾天所做的圖像分類還複雜,例如物件偵測:不只要知道圖片有一隻貓,還要知道貓在哪裡。物件偵測的目標是同時在一張圖片完成兩件事...

2025-08-29 ‧ 由 hibiki 分享
DAY 20

Day 20 - 物件偵測(二)YOLO 與 SSD

R-CNN 系列演算法都有獲取候選區域這個步驟,然而也是因為分為兩步驟進行,雖然精準,但偵測速度受到了限制。因此另一派演算法選擇拋去這個步驟,最具代表性的模型為...

2025-08-30 ‧ 由 hibiki 分享