在docker內使用TensorFlow Serving
image:tensorflow/serving:latest-gpu
docker run -t --runtime=nvidia -p 8501:8501
--name tf_serving_gpu
-v "$TESTDATA:/models/fashion_model"
-e MODEL_NAME=fashion_model
tensorflow/serving:latest-gpu &
當container啟動後GPU都一直完全滿載,停止後馬上釋放出memory
是否有辦法可以設定使用率
謝謝
https://docs.docker.com/config/containers/resource_constraints/
啟動container時可以透過 --gpus設定使用量