這次 Machine Learning with TensorFlow on Google Cloud Platform 的課程中,如 Day1 提到的,共有 5 個子課程:
今天就來整理這次鐵人賽的文章,也方便日後自己或是想參考的人可以快速查找相關的主題。
這個部分主要在了解ML的商用方式和過程,並且知道何時該使用ML以及在GCP上使用的優點。
這個部分主要在了解ML的基礎知識,包含術語、模型的優化、模型泛化的重要性和訓練模型時分割資料的方式與必要性。
這個部分主要在了解 TensorFlow 的運作和程式撰寫,並且如何結合 GCP 來做到規模化、分散式的模型訓練。
tf.get_variable() 與 tf.placeholder() 之間的差異這個部分主要在了解特徵工程的重要性與做法,並且透過 GCP 來達到規模化、快速、一致的資料前處理。
tf.transform 來實作特徵處理和特徵建立
這個部分主要在了解ML訓練當中一些重要的關鍵點如超參數,神經網路的概念和嵌入方法的強大。
| Day # | Lab # | 主旨 |
|---|---|---|
| Day2 | --------- | 簡介如何使用ML商用化的方式 |
| Day3 | --------- | 了解 Google 所謂的 AI-first 策略是什麼意義 |
| Day4 | --------- | 了解 Google 在使用ML商用化的經驗與知識 |
| Day5 | Lab 1 | 介紹雲端開發環境,Google Cloud Platform (GCP) |
| Day6 | Lab 2, 3 | 介紹雲端開發環境,Cloud Datalab |
| Day7 | --------- | 了解在ML中所會提到的術語以及重要知識 |
| Day8 | --------- | 了解模型是怎麼優化的 |
| Day9 | Lab 4 | 了解泛化和取樣的重要 |
| Day10 | Lab 5 | 了解資料的探索和分割 |
| Day11 | --------- | 介紹 TensorFlow 的核心元件 |
| Day12 | Lab 6 | 透過實作了解 TensorFlow |
| Day13 | Lab 7 | 了解Estimator API並實際操作 |
| Day14 | Lab 8 | 了解遇到巨大資料集時如何訓練模型 |
| Day15 | Lab 9 | 了解何時需要分散式訓練以及如何使用 |
| Day16 | Lab 10 | 了解如何在GCP訓練、監測和部署ML模型 |
| Day17 | Lab 11 | 了解特徵工程的領域有哪些 |
| Day18 | Lab 12 | 了解前處理和特徵建構的做法 |
| Day19 | Lab 13 | 了解如何大規模的執行 data pipeline |
| Day20 | Lab 14 | 了解如何使用 Cloud Dataprep 做資料前處理 |
| Day21 | Lab 15 | 了解特徵組合的目的與做法 |
| Day22 | Lab 16 | 了解如何使用 tf.transform 來實作特徵處理和特徵建立 |
| Day23 | Lab 17 | 了解ML裡面的藝術如正規化、學習率和批次大小 |
| Day24 | Lab 18 | 了解超參數與如何調整其值 |
| Day25 | --------- | 深入了解正規化和邏輯迴歸 |
| Day26 | Lab 19 | 了解和訓練神經網路 |
| Day27 | --------- | 認識 Embedding |
| Day28 | Lab 20 | 了解如何撰寫客製化 Estimator |
今天總結了前面所有鐵人賽中,課程的學習內容,明天是最後一天,就來寫寫這次參賽的心得感想吧!