今天就廢話不多說直接來進入 How Google does Machine Learning 的課程吧~
這次鐵人賽的30天中,我目前所寫文章的所有課程目錄如下:
裡面又有五大章節,今天就先從第一章節開始看吧
第一章節的課程地圖:(紅字標記為本篇文章中會介紹到的章節)
Introduction to specialization
Introduction
Intro to ML on GCP Specialization
Specialization Agenda
Why Google?
Why Google?
Why Google Cloud?
Latest from Google
Module 1 Quiz
課程地圖
此章節有一個影片,介紹了 Google Cloud Platform (GCP)的服務,
另外有提到未來會使用於機器學習的程式語言是python(在GCP上),
以及提到 Google BigQuery 的服務與 Open Source 的 Tensorflow 的整合,
替整個數據研究與機器學習對於公司組織應用上更加的便利了
(以自己的經驗來說,將整個機器學習的服務移至雲端,
這樣確實能在買硬體的成本應該能省下不少錢,
而且需要時再訂閱也不擔心買了硬體擱置不用的問題。)
課程地圖
這章提到了 GCP 上的 ML 整體的運作流程,
主要分別五大步驟,影片中提到的圖片如下
(不確定有沒有版權問題,有的話我再將圖拿掉)
影片中提到這章節也許單純的介紹會無聊會讓你想直接跳下章學習(笑,真懂XDD)
但有一句話提到這張的重點,我們還是必須清楚整個 GCP上的ML的架構,
這樣未來在使用時你才能夠在大方向的掌握使用上的進程。
The big picture is very important for you to be able to get buy-in from the rest of the organization.
想藉由完成TensorFlow完成Machine Learning,至少需要兩件事情,
影片中有特別提到準備"好的"資料集是一個不能忽略的重點,
有許多訓練好的模型結果最後的產品失敗(甚至是某些企業都會失敗),
這時候通常原因都是需要回來檢查我們的資料集。
這個章節會灌輸你一大堆能精進ML模型結果準確度的想法與觀念,
然而不同的情況自然會使用不同的想法與對應方式,
所以這章節更多是教觀念,幫助我們在之後面對更多 Machine Learning 上面的問題,
而且還提到需要花時間去消化觀念並能運用到code中,不可只知其觀念名。
這個章節主要會提到如何讓訓練完成的ML模型進入產品化的階段,
這個部分可能又比前面還要更加的困難,許多企業級的ML projects也經常失敗在此處。
Operationalizing a Machine Learning model 大概又可以分成以下幾步驟
而在此章節將依照以下順序講解:
最後會回到 Machine Learning的理論講解,
不過ML理論本身是多屬於heuristic(啟發式)的,
也就是我們幾乎只能仰賴一些工具與技巧。
因此我們將介紹一些工具跟技巧,提供的範例主要是在訓練圖片時有效,
但這些也有助於在處理時間序列數據或文本數據更佳有效。
最後這章節會介紹一些能建立 powerful recommendation systems 的方法,
Recommendation systems是一種ML model,
指的是你怎麼建立你個人化的演算法的方式,
大多數ML工程師也會在職涯的某些階段中會逐漸建立起來這樣的個人化演算法。
事實上這部影片認為,也許最後只會有一種ML system被大家所建,
但在建立powerful recommendation engines之前,
我們都會反覆碰到前四章所學的東西,不論是對工具與技巧的理解等等,
我們可能在各種不同的地方學習ML,但儘管如此,細節也有可能完全不同,
所以當你在碰到的新的ML教材時,也不要完全跳過他,將他視為有用的複習課程,
並在一次確定自己還記得這些部分中提出的想法。
課程地圖
影片中提到了一些machine learning與我們日常的關係,
特別是以下的圖片中的應用大家應該都不陌生。
此外一個驚人的事實是,近幾年使用machine learning逐漸上升,
就連google已推出了突破4000個有關於machine learning應用的產品。
(近幾年的飆升真的滿驚人的)
課程地圖
影片中提到一般人認為的ML服務(ML serving, not just ML training)可能像下圖,
很多人可能花了非常大量的時間再處理圖片的左半部,
然而,ML service最主要的核心應用的卻是在圖片的右半部
Google有提到,training data(batch data)與streaming data的相容性,
會是一個影響訓練模型成功機率的關鍵因素,
他們嘗試能在batch data與streaming data的進行一樣的處理方式以減少失敗的機會。
ML的簡圖,基本上也代表著訓練的每個階段,
而這部分透過GCP的服務,很多東西都已經先準備好了,
我們可以用GCP的系統,具有彈性、可靠,且非常好的工程能力
不知道是不是因為英文的關係...我覺得有點難,
有幾題考得滿細的,不過忘記答案的話可以回去課程找答案,
這章應該幾乎都考很介紹的東西,所以感覺超級像背科(背他介紹的東西XDDD
不過都幾乎快把整個影片翻譯完的我,當然就直接交了
耶依~ Module 1 Quiz結束囉~
coursera - How Google does Machine Learning 課程
若圖片有版權問題請告知我,我會將圖撤掉