主題說明
本次參加鐵人賽的主題是AI平台初學者工作坊: 從training、tracking到serving
, 想要使用AI工具說明如何安裝AI平台、執行訓練、tracking訓練參數,最後可以將訓練好的model部署到指定的環境讓end user可以存取endpoint之後取得推論的結果.
下圖是這次主題的示意圖:
平台需求
對於Training、training與serving的需求, 分別說明如下:
- Training
- 需要有一個工具可以執行jupyter notebook
- 這個jupyter notebook可以是jupyterlab或jupyterHub
- 需要支援python3環境
- 需要能自行安裝自己所需的package, 例如pytorch、tensorflow與fastai
- 需要能下載訓練完成之後的模型檔
- Tracking
- 可以記錄每次執行training時的參數
- 可以記錄每次執行training時的metric
- 可以列表比較不同training後的結果
- Serving
- 可以將訓練好的model完成部署並提供endpoint
- 外部使用者可存取endpoint並取得推論結果
- model serving工具可以自建或使用現成的工具
範例簡介
本次的鐵人賽預計會以四個範例進行說明, 這四個範例簡述如下:
- 範例一:訓練圖像資料(MNIST)並且部署到自行開發的Web Server
- 範例二:訓練文字資料(心血管疾病資料)並且使用seldon整合PVC與MinIO部署model
- 範例三:使用AutoML工具自動產生最佳(較佳)的model
- 範例四:使用現有工具(使用Nilvana)操作影像標註功能, 並且將訓練好的model進行部署
最後, 本次的說明以平台工具串接
為主, 因此重點不在演算法的撰寫、最佳化或調教, 故上述四個範例所使用的jupyter notebook會以現有且公開的文件進行說明, 而且不會強調model的精確度.