🎯 目標
模型(與規則)可版本化、可切換、可灰度(百分比分流/A/B)
推論與業務指標可觀測(metrics + 日誌樣本)
內建回滾與快取失效機制,確...
前言
模型表現,三分看網路、七分看資料。就算你用的是 ResNet 或 ViT,如果原始資料夾裡混著空白圖、壞圖、重覆檔,加上類別不均衡,訓練再久也事倍功半。今...
CNN 的學習循環:圖片來自:https://anstekadi.com/article/Detail/3315
Forward Pass:輸入 → 特徵提取...
前言
今天我們要進一步探索如何更有效地使用 Decoder-only 模型進行微調。不過在正式進入主題之前,我想先帶入一點小巧思如果語言模型本身已經夠強大,那我...
連續 22 天了,今天把前幾天踩到的坑一次收尾:1. 解掉 AsyncWebhookHandler 不存在的錯誤、2. 讓金價與彩券查詢更穩、3. 語音 TTS...
前情提要
昨天介紹了數據類型以及如何簡單模型模型參數量,最後有提到激活的部分,我們針對這個更加詳細介紹。
參考連結 & 圖片來源:
https://ww...