行百哩路半九十,即便各種先進的AI模型如雨後春筍般化為現實,AI成功落地佈署至商業情境仍是困難重重,營運中的商業服務如何調整其ML算法,讓服務經得起時間及使用者的考驗,必須反覆推敲範疇、資料、模型及佈署的問題,進一步而言,有沒有關於AI落地、ML in Production、MLOps的解決方案?
既然佈署機械學習ML的工程實務逐漸歸納並越受重視,也多虧軟體工程DevOps精神興起與CI/CD實務越漸普及,本系列期待透過鐵人賽將系列知識做個梳理,拋磚引玉,協助銜接ML商務落地的一哩路,以及對AI有志趣者,補充除了AI建模以外需要關注的面向。
標註資料與特徵工程是處理資料重要的步驟,目的都是為了讓模型效果最佳化,標註的一致性、特徵工程到位都對模型影響至關重要。現實生活情境的資料標註向來不是件容易的事情...
當您需要更高效率標註大量資料時,人工標註不符合自動化的機械學習需求,採用靠著程式寫條件就分類完成的 Snokel 就可以參考。 而且在2021年 AI 台灣人...
接續 Day 12的弱監督式 Snorkel 範例,今天再花點時間示範用 Snorkel 標註影像資料。 Snorkel 透過簡易廣泛的程式撰寫判斷邏輯後,交...
資料是機械學習重要的核心,用於生產的機械學習必須考量大量且快速的資料情境,使用自動化、可擴展的資料分析、驗證以及監控方法相當重要。 TensorFlow Dat...
特徵工程是機械學習相當重要的一環,有處理數據以及實行 ML/DL 任務經驗者對特徵工程一定不陌生,一般來說常以 Pandas 及 Sklearn 完成任務,也...
接續 Day 15 的 tf.Tramsform 介紹,今日進行實作,先以TensorFlow Transform 預處理數據的入門範例 作為演示過程,官方 C...
特徵選擇是機器學習中的核心概念之一,不相關或部分相關的特徵會對模型性能產生負面影響,也會有效能的問題,適當的挑選與目標變量最相關的特徵集,有助降低模型的複雜性,...
接續將關注焦點來到 Model 的主題,在您閱讀本系列文章之前,您或許已有建模經驗,在用於生產的機械學習情境,手動調參優化模型與資料是耗費人時的吃重工作,自動...
隨著 ML/DL 模型研究屢有突破,現今模型訓練成果已經相當具有水準,但如果需要藉由手動選擇最佳的模型確實較花時間,因此已經出現取多自動化機械學習 AutoM...
當我們訓練模型需要部署在硬體較為受限的智慧型裝置、IOT設備,模型運算在吃緊的硬體資源中顯得笨重,此時可以採取模型優化策略改進。 量化 Quantizatio...