今天要來說說本課程中的開發環境,終於到這一章節了,終於有實作的機會了,那廢話不多說馬上進入我們今天的課程吧!
我們會使用Google雲端上的python notebook進行編寫
開發我們的機器學習模型,這次使用的開發環境是Cloud Datalab
Cloud Datalab在VM上運行,也會介紹到Compute Engine與Cloud Storage
在VM上運行有兩件事情,一是可以輕鬆的實際控制與更改notebook的機器內容
例如增加更多了GPU或RAM而且不需用重寫。
另一點是,VM是短暫的,所以如果要保留任何資料,必須儲存在外部,尤其是那些大型的二進制文件...
當然是儲存在Cloud Storage中啦,與此同時也會回顧Cloud Storage基礎概念,
我們將儲存在Cloud Storage notbook,使其受到版本控制。
最後會介紹如何將Cloud Datalab和BigQuery結合使用,
BigQuery是雲端上的數據分析服務,可以讓超越傳統數據庫的執行速度與規模進行queries的查詢,
然後研究如何在Cloud Datalab訓練ML模型。
這邊簡單介紹了Datalab的環境,是基於開源的Jupyter,下面介紹簡單控制:
code:你的python程式碼,執行程式碼只要shift+enter
或 按上方的 Run botton
即可
output:就是你的程式碼輸出,注意輸出也包含圖表
markup:寫一些註記
綠色部分:可以匯出你的程式碼並提供下載,
或者提交到Google Cloud Platform上的code repository(代碼儲存庫(應該是這樣翻..))。
上圖為Datalab的樣子,並演示了一些簡單的程式碼,
你幾乎可以使用python,Bash等等運行,
基本上你可以點擊運行所有代碼,
所有將會輸出。
上圖大概說明了整個Datalab的運作,
從編程->運行->輸出->註記->分享,再循環。
最重要的大概就是這裡@@
Datalab的線上合作模式,Datalab架設於雲端上的VM
任何人只要透過網址,就可以共同編輯
另一種方式可以利用版本控制系統,例如Git
因為是雲端的方式,還不受硬體限制影響,任何人隨時可使用,
用完即可關閉,一大福利啊啊啊啊啊。。。
感謝閱讀 今日里程數-1906字