iT邦幫忙

2019 iT 邦幫忙鐵人賽

DAY 11
0
自我挑戰組

深度學習所需入門知識--一位初學者的認知系列 第 11

安裝GPU 加速的 CUDA 驅動

昨天 Fields帶大家使用 mxnet,Cash 看到大家總是打好幾個指令,忍不住告訴大家,他可不會那麼愛打字,要幫自己建立 alias

nano ~/.bash_aliases

#添加這一行,後續就直接用 gluon alias
alias gluon=’source activate gluon && cd ~/mxnet-the-straight-dope && jupyter notebook’

CTRL+X 按 Y 保存,

source ~/.bash_aliases
gluon

這樣就一氣呵成的開啟帶有安裝好 mxnet 的 Jupyter notebook


因為Fields後續需要 GPU 加速運算,Cash 查了一下無論 Tensorflow 還是 Mxnet 甚至 PyTorch 都是依賴 Nvidia CUDA 來驅動。

前期準備工作,首先從BIOS(看機器,開機時按下 F12, Delete, ESC 建等等進入)設定

UEFI Secure Boot 設定為 Disable

以免除後續更新驅動時,會出現討厭的設定開機密碼。這可以讓後續安裝或升級 Nvidia 顯示卡驅動少許多麻煩。要安裝 CUDA,可以一併安裝 Nvidia Driver,但是他與Ubuntu 自帶的 nouveau 驅動是衝突的,下面的設定避開衝突:

sudo bash -c "echo blacklist nouveau > /etc/modprobe.d/blacklist-nvidia-nouveau.conf"
sudo bash -c "echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist-nvidia-nouveau.conf"

其實也可以直接

sudo nano /etc/modprobe.d/blacklist-nvidia-nouveau.conf

然後輸入這兩行

blacklist nouveau
options nouveau modeset=0

按下 CTRL+X 回答Y 以儲存。

sudo update-initramfs -u
sudo reboot now

重開機後,然後先從官網 取得下載網址

https://ithelp.ithome.com.tw/upload/images/20181025/20105283YrjQpSgnMq.png

wget https://developer.nvidia.com/compute/cuda/10.0/Prod/local_installers/cuda_10.0.130_410.48_linux
sudo apt install gcc make #CUDA 需要 gcc相關,Desktop預設有安裝,但是Server沒有
sudo sh cuda_10.0.130_410.48_linux

出現下列的選項,記得要安裝 NVIDIA Accelerated Graphics Driver(y)

Do you accept the previously read EULA?
accept/decline/quit: accept

Install NVIDIA Accelerated Graphics Driver for Linux-x86_64 410.48?
(y)es/(n)o/(q)uit: y

安裝結束後編輯 /etc/environment 讓 PATH 多了『:/usr/local/cuda-10.0/bin』;加上

sudo nano /etc/environment

PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/local/cuda-10.0/bin:/usr/games:/usr/local/games"
LD_LIBRARY_PATH="/usr/local/cuda-10.0/lib64"

後續重開機後,環境變量生效。可以下

nvcc -V #取得CUDA版本
nvidia-smi #顯示卡耗電,溫度,使用率,記憶體使用,哪些程式正在使用GPU


Moore 有點嫌囉唆,他這兩天晚上回到家也惡補了一下 Tensorflow,發現有 notebook codelab 可以使用,連安裝都不需要安裝,更棒的是他免費提供 GPU或者 TPU 來加速計算。為了推廣,Moore 決定下次有機會他帶大家用 Tensorflow。

這話題又引起議論紛紛,不過大家還是在質疑全部只有5位成員可以做開發(Gavin 與佳麗 修正應該是7 位,他們宣稱年輕的時候都是程式高手。眾人知道要趕快表現佩服的樣子,不可有任何懷疑狀,否則會議無法結束),人數少為何不乾脆只挑一個,那就是挑人氣最旺的 Tensorflow 。這個 Gavin 還是堅持要百家爭鳴,主要是他們這家公司主業是軟體代工,現在還不知道哪個有利於他們未來的業務,大家忍著痛,多學學吧。

備註:

專案緣起記錄在 【UP, Scrum 與 AI專案】


上一篇
用 mxnet 操作數值, ndarray 最基礎的資料結構
下一篇
Docker 與 Nvidia runtime 安裝
系列文
深度學習所需入門知識--一位初學者的認知31
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言