在第一個範例中將會使用MNIST手寫辦識資料集進行訓練與模型部署.
MNIST database((Modified National Institute of Standards and Technology database)裡面有手寫數字的圖片, 是由美國國家標準暨技術研究院所收集, 可以參考這個網站
會使用MNIST的原因, 一來這個資料集的資料size不會占用過多儲存空間(大約需要20多MB), 另一方面目前已有很多MNIST的資料可以看參考, 是初學者執行機器學習應用中常使用的資料集.
下圖是MNIST database中的一個圖像:數字6
針對MNIST再提供下列資訊:
train
目錄與valid
目錄, 而且在train
目錄與valid
目錄下會有0-9共10個目錄, 這10個目錄就是做為標籤(Label)使用, 因為會將所屬的數字圖像放在所屬的目錄中, 例如數字6的圖像就會放在目錄名稱為6的目錄在本範例中, 將會在jupyer notebook下載資料集進行使用, 因此不需要事先下載.
在本範例所使用的平台工具會使用到JuypterHub, MLflow與Web Server(Django), 如下圖所示:
我們下一篇就來安裝JupyterHub
http://yann.lecun.com/exdb/mnist/