這系列文章我會以一個 Data Scientist 的角度,並以一個 Fintech 公司實際的例子,來分享我們怎麼在雲上或開源專案中建立一個系統來解決以下問題:
- 如何減少從 Experiment 實作到 Serving Pipeline 遇到鬼的
- 如何化解 Data Scientist 間的穀倉效應,並讓 DS 間可以互相合作
- 如何整理雜亂的訓練資料並不會被埋沒在奇怪命名的研究結果汪洋中
- 如何安心的睡覺,不用擔心模型壞掉
在進到 Health Check Monitoring 前,先講兩個我認為在部署 Inference Service 常會遺漏的兩個事情: Error Hand...
昨天提到 Timeout 的其中一個原因,就是機器資源不足或是超載的異常,當大量的 Request 發生時,可能會讓機器在 Memory, Disk, CPU...
監控除了 Alarm 之外,最重要的就是 Dashbaord,但是監控並不是越多越好,就和 Alarm 一樣,Alarm 和 Dashboard 的目的就是要把...
最後一個主題,介紹一下 Explain AI,目的是為的達到可解釋性,幫著使用方解釋和理解模型 為什麼需要可解釋性? 信任和接受度: 使用者更可能信任和接受...
到目前為止我們算是把 Binary Classification 中和 MLOps 有關的部分講告一個段落了,昨天做後講到關於 Computer Vision...
在 Unstructured Data 中計算效能變得格外重要,而計算效能不外乎是平行化, 分散式 和 Caching 三大方向,當然也會針對演算法去做優化,像...
前天提到了優化應該不要想說把你的所有 Unstructured Data 都想要用同一個方式來處理,舉例來說把影像辨識, OCR, Sentence Comp...
回顧 27 天,嘗試做了我對 MLOps 的理解: 順著文章思路,對於一個 Binary Classification 我分成三個區塊,並把這三個區塊我認為重...
這一篇我會以非常主觀的方式並根據我的觀察來描述一些 Data Team 常見的職位,然而每一間公司對每個職位的定義通常有非常大的差異,最準確的方式絕對是根據 J...
記得要開始寫這篇的時候,一直在想什麼是 MLOps,第一個想法,應該就是 Machine Learning 界的 DevOps 吧,但很好我又不知道什麼是 De...