聊到自己的機器只要有Nvidia 顯示卡也可以做深度學習練習。大家又馬上感興趣了,請 Cash 提供方案,Cash 大略條列了幾個條件:
硬體雖然搞定,Fields 先前主要是在 Windows 環境開發,無法只安裝 Ubuntu,詢問是否可以裝 VirtualBox 再啟動 Ubuntu VM。這個情境 Cash 早已測試過,GPU於VM環境下無法啟動深度學習一般常用的CUDA,同時也發現同要是 Tensorflow GPU 在 Ubuntu跑訓練很順利,但是奇怪的是偶而在 Windows 下會有異常而中止執行,原因不明。提議Fields 瞭解一下 GRUB2 做開機雙OS切換。
Moore 逮到機會,馬上質疑:”為何選 Ubuntu,我也看到許多人談 CentOS適合在雲端"
Cash半開玩笑的說:
”因為如果我選 CentOS 也會有另外一位質疑說為何不用 Ubuntu。其實Linux超過百個以上的Distribution,能被廣為採用的,我認為都可以,與其我們大家花很多力氣在討論哪個OS,我覺得倒不如大膽決定一個,熟悉了一種,改天想用其他的,應該不難。Linux除了Molly與我較熟悉外,考慮到大家都邊做邊學,Ubuntu 的資源比CentOS多的,而且如果在個人環境需要安裝桌面版本, Ubuntu Desktop 是比較穩定的。” 中間穿插 Gavin 與 Pete 捧場的笑聲。
Fields 有點期望停在 Windows 就可以,不用再學新OS,弱弱的問:”我們有可能採用 Microsoft Cognitive Toolkit嗎? 是否就可以維持 Windows?”
Pete 搶回;”這個應該就是以前的CNTK,我看過一篇文章比較Tensorflow、Pytorch、Caffe、Mxnet等等,CNTK使用的比例偏低喔! 而且他 Windows, Linux 下都可以執行,我敢跟在場的每一位打賭我們最終不會採用Microsoft Cognitive Toolkit。"
Molly加入戰局;”我個人幾年的經驗,如果大家要共用資源連到同一台Server上,不太科學的比較,Linux 文字終端機連線似乎比較順,雖然文字指令模式有點囉嗦,但是熟悉了,你不會想再用圖形介面去處理大數據資料的。建議你就從這個專案開始學 Linux,從長遠的角度看,當資訊技術人員跑不掉的。”
佳麗建議 Gavin 以 Product Owner 提出需求,但 Gavin 覺得這應該是專業決定,但是又依他克勤耐勞的天性,希望大家必須考慮成本效益。其中成本必須納入未來如果要採購 DGX Server 或是使用雲計算時,不用再多學一套。Moore 立即上官網一查 NVIDIA DGX OS 就是採用 Ubuntu Server,而且最新版本居然就是 Cash 要推薦的 Ubuntu 18.04 LTS,這個要求讓 Cash 很得意,自誇已經有產品經理的視野。
終於大家搞定硬體與OS 的學習用環境,大家無異議OS 要採用 Ubuntu 18.04 Server,方便未來在雲計算環境或是採購DGX 時直接具備技能使用。但因為多數人不熟悉使用 Linux 或者說Ubuntu使用環境, Cash 允諾將會辦簡易的使用訓練說明會。
專案緣起記錄在 【UP, Scrum 與 AI專案】