CDF 基金會 MLOps 小組的白皮書中不斷提到,MLOps is not "putting Jupyter Notebooks into production environments". 因為 Jupyter Notebooks 在開發時非常地好用,但這類快速開發工具為了實現「快速」這件事,而犧牲掉一些需求,如可維護性、可測試性、可擴展性等。原文可在此連結中找到。所以在佈署階段時,讀者可以嘗試將現行 Jupyter Notebooks 開發環境的程式碼換成單純的 py 檔,再交由 MLOps 工具執行。
在資料庫的使用與管理上,由於訓練資料會不斷更新,因此需要一個資料庫來管理與記錄每個版本的變異。在版本控制上,如果需要對程式碼進行版本控制,多數開發者會使用 git 來管理,上傳的位置除了 github、gitlab 外,也可以考慮使用自行架設的資料庫做為存放位置,同樣也有 MLOps 的工具可以達成這些任務。
看完以上導入前後的差異後,簡單做個結論:
若能成功導入 MLOps,其優點為:
不過,導入 MLOps 也有缺點為:
最後,這篇文章只說明 MLOps 如何改變既有的 ML 開發流程,至於有哪些 MLOps 工具可以使用,後續將有更詳細的 MLOps 工具介紹文章。
在未來,ML 將會改變現在的生活型態,諸多的產品應用也會因應 ML 而生,相信 MLOPs 的精神也會越來越被重視,甚或成為未來顯學,現在開始理解一定不遲!
完整內容 >> https://bit.ly/3zrP9JX
Line 官方帳號,看最新技術文章:https://user137910.pse.is/aif2024ironman
(撰稿工程師:王維綱)