在準備使用機器學習解決問題,欲創造更大的價值時,有個很重要的問題,那就是除了表面上明顯可以藉由預測分析來完成的商業問題,如銷售量預測與預測性維護等問題之外,到底什麼樣的問題可以使用機器學習來解決呢? 要回答這個問題,我們可以先回到機器學習解決問題的方式來看。機器學習是透過收集資料(包括特徵與解答),加上使用一套從資料中學習辨識模式的方法來學習出資料中特徵對應到解答所蘊含的規則,而過往我們在使用非機器學習方式解決問題的路徑則是藉由觀察到的資料(沒有解答),加上一道道手動撰寫及不斷增添的規則組去得出我們要的答案。
因此,機器學習可解決的問題就是現象與答案之間存在著規則,並且我們可以取得相關資料的問題,而基於這樣的一個標準來看的話,機器學習可解決的問題就不僅僅只涵蓋預測分析的範疇,像是課程中就以Google Search為例,Google Search以建構機器學習模型RankBrain(見圖1)的方式,預測針對搜尋關鍵字來說最相關的搜尋結果,並且可根據使用者的使用行為不斷地進行優化。機器學習在解決問題上,比起過往基於啟發式(Heuristic)與手動建立規則的方式有著規模化、自動化與個人化之三大優勢。
圖1
Source: Coursera - How Google does Machine Learning
在了解什麼樣的問題可以使用機器學習來解決之後,我們要更進一步地去探討如何明確地框架出一個機器學習問題。在這邊,課程給出了一個框架供大家參考(註1):
同時,課程也提供了多個產業底下的商業情境(見圖2、圖3)供大家將上述框架套用至各式問題上,而在下方我將以金融服務業的交叉銷售(Cross-selling)與向上銷售(Up-selling)問題為例,給出一個簡單的範例供各位參考:
圖2
Source: Coursera - How Google does Machine Learning
圖3
Source: Coursera - How Google does Machine Learning
註1: Source: Coursera - How Google does Machine Learning