這是一場新手上路的 30 天鐵人挑戰。身為剛踏進深度學習世界的新手玩家,我會和大家一起從零開始,像在遊戲裡從「入門村」出發,一步步練功、解鎖技能,直到挑戰最終 BOSS!前期我打算先搞懂基礎任務:什麼是神經元?梯度下降怎麼讓模型學習?接著升級到卷積神經網路 (CNN),挑戰影像辨識副本。隨著等級提升,會遇到更高難度的關卡。至於最終 BOSS,可能是圖像辨識、生成式 AI、可能是大型語言模型,也可能是一路上發現的新挑戰。讓我們一起開始吧~
我們完成了數據的結構化分割,並實作了 DataLoader,將乾淨的圖片轉化為模型可食用的數據流。今天,我們將正式進入訓練環節:首先進行快速的 Stage 1...
我的三個模型 ResNet34、VGG16、EfficientNetB0 都完成了 Stage 1 和 Stage 2 的訓練與微調,並在驗證集上取得了不錯的準...
我們在測試集上確認了 ResNet34 是我們的冠軍模型。今天,我們將使用兩大評估工具——混淆矩陣 (Confusion Matrix) 和 ROC 曲線 (R...
我將介紹最後一項關鍵的定量指標 ROC 曲線 (Receiver Operating Characteristic),以衡量模型在區分不同災害類別時的信心程度。...
為了快速且免費地將我們的深度學習模型上線,我選擇了 Hugging Face Spaces。 平台優勢與工具選擇平台特性: Spaces 是一個專門為機器...
在這段深入的學習旅程中,我們成功地應用深度學習技術解決了自然災害的快速識別問題。我們建立了一個高效能的 災害影像分類系統,並將其部署至雲端,實現了從學術研究到實...
我們已經完成了 CV 模型的部署,確定了 LLM 是下一步的重點。目標:打造一條「開始 → 模板轉換 → 知識檢索 → LLM → 結束」的可用工作流,讓系統輸...
今天把 RAG 取回的多段結果(result 陣列),在 LLM 端用 map + join 合併,並用「政策型 System Prompt」強化可溯源與行動化...
風格遷移是一種很帥、但其實概念蠻優雅的技術:把一張圖片的內容,配上另一張圖片的風格,生出一張既保留原始場景、又帶有名畫或特定質感的新圖。想像:把你家的街景照,畫...