在實際應用機器學習的過程中,模型的架構與訓練固然重要,但這僅僅是整個系統中的冰山一角。真正的挑戰在於如何持續有效地佈署、測試與更新模型,而 MLOps (Machine Learning Operations) 就是結合 ML 和 DevOps ,以實現機器學習系統的自動化為目標提出的一系列解決方案。
這系列文章並不會從機器學習的基本概念開始,而是著重於實際應用,帶領讀者從零開始,逐步構建一個自動化的機器學習系統。在與我一同學習的過程中,除了獲取相關知識外,我也希望能讓讀者了解這個過程中可能遇到的各種挑戰,以及如何應對這些問題,從而實現系統的自動化與最佳化。
摘要 這篇文章將介紹這系列內容的撰寫背景與目的,並界定目標讀者,以幫助您判斷自己是否適合閱讀這系列文章,然後簡單概述整系列文章中可能出現的內容。最後,我也將...
摘要 這篇文章將首先定義什麼是 MLOps,並探討其將機器學習從概念轉化為實際運行系統的方法。接著,我們將介紹 MLOps 的整體生命週期,將其簡化為三個主...
摘要 在建構 ML 系統時,定義目標是整個專案的核心,不過問題往往相當複雜。為了將目標有效地融入系統的設計中,今天我們將介紹常見的五大類方法,包含調整損失函...
摘要 今天我們探討了資料品質對機器學習模型的影響。為了避免「垃圾進,垃圾出」的問題,我們必須關注資料的準確性、完整性、一致性和即時性等方面。這篇文章討論了如...
摘要 公平的鏡頭設計模式強調利用預處理和後續資料處理技術來確保模型預測的公平性。偏差可能來自於資料分布、表示方式或演算法選擇。解決方案包括在訓練前和訓練後對...
摘要 資料不平衡即使反映了現實,仍可能導致模型偏向多數類別,因此今天的文章將處理非人為造成的資料不平衡。除了討論問題本身,我們今天也會進一步討論加權、平衡資...
摘要 模型的再現性指的是在相同條件下,模型應能夠產生一致的結果。為了確保再現性,可以透過手動設定隨機種子、固定套件版本,以及妥善管理平行處理和並行處理中的隨...
摘要 當資料隨時間變動,可能導致原有的模型無法得到預期結果。資料漂移、概念漂移和資料庫漂移是資料變動的三種形式,分別影響模型的輸入特徵分布、輸出標籤和資料結...
摘要 當資料格式或特徵發生變更時,舊資料可能不再直接適用於新模型。針對這種情況,可以透過橋接方法來過渡,將舊資料中的類別以新資料的比例進行機率補值或靜態補值...
摘要 擴展問題指的是如何從原型轉換為完整系統時所需考慮的挑戰,涵蓋資料蒐集、預處理、訓練到部署等方面。討論時大致可分為兩個面向:再現性、復原力,其中復原力涉...