iT邦幫忙

第 11 屆 iT 邦幫忙鐵人賽

DAY 11
0
Google Developers Machine Learning

ML Study Jam 30天初體驗系列 第 11

[Day #11] Google 如何運用機器學習技術 [10]

(廢文模式 on)
Day 11 繼續加油~
(廢文模式 off)


本日文章

  1. Introduction to specialization
  2. What it means to be AI first
  3. How Google does ML
    • Introduction
    • ML Surprise
    • The secret sauce
    • ML and Business Process
    • The Path to ML
    • End of phases of deep dive
  4. Inclusive ML
  5. Python notebooks in the cloud
  6. Summary

Introduction

這節簡單提點一下後續這個章節的方向,主要會著重在商業與ML的結合。

ML Surprise

  • 機器學習其實很像是一台電腦在寫程式,透過觀察成千上萬的樣本之後,自己歸納出一套方法來完成指定的任務。
  • (這邊谷歌提出了一個例子,但筆者認為並不是那麼好理解,所以直接摘取寓意,不確定意思跟例子想表達的是否一樣... 如果有錯還請讀者們儘速糾正)有時候外在的現象,可能會使我們有些既定的想法,但實際上是否如此,得需要實際嘗試才能下定論。

接下來的內容其實比較偏向在談論機器學習在整個商業模式上的概念:

  • 對於企業而言,要如何能建構一個完整的機器學習生態系實際上是需要耗費非常多的資源的,舉凡從定義 KPI、收集數據、建構模型到整個系統的基礎架構、資料儲存方案、資料流、後續維運等等,甚至跟原有的系統進行整合,這些項目實際上都是一個良好的機器學習專案所需要的基石。
  • 但從谷歌的角度觀察,資歷比較年輕的機器學習從業人員與跟谷歌合作的外部夥伴等,大多數都傾向專注於模型的算法研究,例如想使用目前擁有 SOTA (state-of-the-art) 效能的模型或是將所有的超參數都優化完畢等等,而這些都是機器學習中非常技術性的細節。
  • 然而,在以機器學習專案聞名全世界的谷歌裡,它們卻發現了一件事,絕大多數谷歌工程師在建立這些大型機器學習專案並取得巨大成功的同時,他們所花在優化機器學習演算法的時間遠比多數人預期的還少。
  • 值得為人稱道的是,在谷歌工程師與許多外部合作夥伴接觸時,基本上都沒有人高估了收集資料的難度,由此可知「收集資料」本身確實是一件非常重要的事情。
  • 接著,需要密切注意整個資料生態系統的基礎建設,有了這些穩定的架構,才能讓工程師們快速地嘗試各種機器學習模型,並且加速整個開發的流程。更甚者,這樣地基礎也將成為日後大規模最終使用者使用時的良好根基。
  • 由於在使用機器學習的前提是必須先有效地定義使用者的行為模式甚至是操作上的所有細節,才能得到模型真正需要的資料,也因此在決定使用機器學習模型的同時,甚至可以減少定義 KPI 的時間與組織討論的時間,加速整體專案的進行。
  • 透過清楚且透明的呈現客戶的使用數據(也就是機器學習模型需要的資料),組織能直接了解市場的脈動,不必再依靠理論來猜測市場趨勢,並同時也減少許多不必要的 KPI,使得真正有效的 KPI 能夠更快被發掘。

最後谷歌下了一個筆者認為很有意思地結尾:
(內容已經過筆者自行解讀並修飾,若想了解原意,請逕行修習課程XD)

機器學習的價值不僅僅是在解決問題,即便最後無法使用機器學習解決問題,但在實踐機器學習的道路上,實際上都能發掘出許多意想不到的價值。因此,即便最後的解決方案並不是採用機器學習的方式,但可以確信的是,實踐機器學習的道路上,所有參與的人都將從中獲益, 無論是技術或是觀念。

小結

谷歌終於開始談論有關機器學習在商業以及企業組織內部使用的概念了XD
衷心希望每一位企業組織的主管,在決定踏入機器學習的世界前,都能有機會觀看過谷歌的這系列課程,這樣世界就會更美好的... :D

(準備放假囉ya~)


上一篇
[Day #10] Google 如何運用機器學習技術 [9]
下一篇
[Day #12] Google 如何運用機器學習技術 [11]
系列文
ML Study Jam 30天初體驗13

尚未有邦友留言

立即登入留言