iT邦幫忙

第 11 屆 iT 邦幫忙鐵人賽

DAY 6
0
Google Developers Machine Learning

ML Study Jam 30天初體驗系列 第 6

[Day #6] Google 如何運用機器學習技術 [5]

(廢文模式 on)
寫著寫著,漸漸發現可能會走向純粹地紀錄與分享修這堂課程的過程(基本上會採用條列式流水帳的方式來記錄),並穿插一些筆者自己對ML的看法與心得(翻譯),實作技術層面的介紹與討論的篇幅可能相對非常少甚至忽略...(其實就是忽略 XD
希望有興趣看下去的讀者可以先大致了解往後的文章方向~
(廢文模式 off)


本日文章

  1. Introduction to specialization
  2. What it means to be AI first
    • ...
    • Replacing heuristics
    • It's all about data
    • ...
    • Pre-trained models
    • The ML marketplace is evolving
    • ...
  3. How Google does ML
  4. Inclusive ML
  5. Python notebooks in the cloud
  6. Summary

Replacing heuristics

  • 谷歌說明其實機器學習就是在思考如何從資料中找出重複且可被預測的內容(derive repeated predictive insights from data)
  • 谷歌說在前面課程中介紹非常多的產品與服務都是出自谷歌之手,那對於一般企業要如何能與谷歌一樣將機器學習套用在現實生活的產品上呢?
  • 前谷歌母公司 Alphabet 執行董事(亦為前谷歌 CEO)施密特 (Eric Schmidt)表示:「Machine learning... This is the next transformation. The programming paradigm is changing. It's not programming a computer. You teach a computer to learn something and then it does what you want.」
  • 施密特的說法可能會讓許多人覺得訝異,因為前面也曾提到機器學習的本質是在資料本身,但在施密特的一番話中卻看不到任何有關「資料 (data)」 的字眼,難到施密特認為資料不重要嗎?
  • 不是的,施密特的說法是從另外一個角度出發(但不代表他認為資料不重要), 施密特在談論的是「以機器學習來取代某種程度的程式語言編程
  • 機器學習對施密特而言,更像是一種「邏輯」而非單純的只有資料。那代表什麼意思呢?
  • 谷歌以自家的搜尋引擎為例,在古老的年代,當使用者輸入一個關鍵字「巨人 (Giants)」,我們該秀出哪種結果呢?是舊金山巨人隊 (隸屬於美國職棒大聯盟 MLB) 還是紐約巨人隊 (隸屬於美國國家美式足球聯盟 NFL)?
  • 在幾年前,谷歌實際上還是採取以規則基礎為主的編程方法,透過制定一系列的規則來控制搜尋引擎顯示的結果(例如回傳紐約巨人給東岸使用者、西岸的則是舊金山巨人等規則)
  • 很明顯地,這樣的編程架構非常難以維護,除了有成千上萬種不同種類的搜尋關鍵字詞外,當新的事物被創造或是發明出來,又有新的規則需要制定等等,導致日後維護的成本非常驚人,程式碼也相當難被規模化。
  • 在這樣的情況下,機器學習就是一個非常好的工具,除了能自動化學習外,規模化的成本也大幅降低,甚至可以透過更多使用者的使用,來進一步提升模型的表現
  • 因此,我們可以使用機器學習來取代目前使用人工判斷為主的規則,降低整體的資源成本
  • 谷歌以一句話來貫穿本節的內容:「Replacing heuristic rules by ML」這也就是機器學習的目的
  • 最後,什麼樣的問題可以用機器學習解呢?谷歌爽快地給出了一個回答:「任何時至今日還在使用人工規則來解決的問題

小結

這個小節透過谷歌前 CEO 施密特的一番話,來帶出機器學習的另一個核心觀點:

取代人力

不同於前面幾個小節提過的,資料是機器學習不可或缺的一環,這是機器學習要成功的關鍵無庸置疑。但機器學習在應用層面的本質,其實一直到了這一小節才由施密特所帶出,機器學習所要完成的事情其實是需要大量人力來解決的任務,無論是提供腦力或是勞力。但這中間又會衍伸出其他的問題:

什麼樣的問題是需要大量人力的呢?(腦/勞)

這邊筆者礙於自身見識,還沒辦法有一個很明確的推論或是想法,但筆者在此可以提供一個討論點:

當今人類無法解決的事情,是否能用機器學習來完成呢?

筆者認為這其實是一個值得探討的問題,以現今廣為人知的機器學習為例:

  • 照片分類問題可以由人來判斷這張照片屬於哪個分類(只是很耗時間)
  • 語言翻譯問題可以聘請專業的翻譯人員(同樣也很耗時間,如果量大的話)
  • 機器異常狀況偵測(受過訓練的專業人員同樣可以發現異常狀況
  • etc.

如果是像「全自動人類情感判讀系統」這種乍看天馬行空,卻又能給出一點像樣道理的題目呢?

  • 例如可以說給了一百萬個人對於同件事情發生後的情感連結及反應 (inputs & labels)
  • 希望能了解某個人類對於某件事情的想法或是情緒反應

乍看之下似乎有理,但這可以透過機器學習來完成嗎?即便是周遭最親密的人們,我們有辦法判讀出他/她對於某件事情的反應或是看法嗎?

(終於捱到週末了,不過,覺得維持寫一點點一點點的好像才能持續... 所以之後的篇幅可能都不會太長XD)


上一篇
[Day #5] Google 如何運用機器學習技術 [4]
下一篇
[Day #7] Google 如何運用機器學習技術 [6]
系列文
ML Study Jam 30天初體驗13

尚未有邦友留言

立即登入留言