iT邦幫忙

2021 iThome 鐵人賽

DAY 2
0
AI & Data

後端工程師的ML入門理解與Vertex AI系列 第 2

了解必要的概論 | ML#Day2

ML 最主要的目的是得到一個數學函式,或者是說數學模型,然後運用該模型來得到想要的結果。

所謂模型,以資訊工程的角度簡單解釋,可以像是MD5或者sha1 那樣的東西。


如上圖示意,1 個input 對應到1個output,前後關係容易理解,如果有心想研究,進一步討論md5或sha1裡面的計算過程,耐心研讀也是還在人類看得懂的範疇當中。

ML想要得到的數學模型,實務上要能夠應用並且解決問題,需要更多的參數input,以及可能比md5的運算規則更複雜的運算方式去處理,才有機會得到想要的答案。

然而進入到ML的第一個門檻,自己主觀認為首先最大的困難,是「接受」並且「認知」到模型的內在運作方式,大部分時候我們無法理解。

訓練出來的模型,其實都是各式各樣的數學函式組合,得出來很醜很詭異,基本上無法理解、無法解釋為什麼要那樣運算,但經過驗證後,以統計的科學證明,卻會是有用的東西,產生出來的答案可以非常接近我們預期的數值或結果。

無法理解,但有用,理性上要接受它這樣,可能就是一道心理門檻。

這個時候我喜歡拿72法則來舉例,72法則是愛因斯坦歸納出來的一種簡單方式,估計資產翻倍所需報酬率的時間。

利用72法則得出來的結果並不會非常精確,但是已經符合我們的需求,另一個好處是計算成本也相對低廉,譬如說報酬率是8%,72/8 = 9,我們馬上就知道需要約9年的時間,資產就會翻倍。

如果要求非常精準,往往要求的算法也跟著相對複雜,計算成本會跟著相對高昂,試想為了得到一個預測結果,將參數餵到電腦運算,可能需要好幾個小時或好幾天,甚至需要超級電腦才有可能得到答案,誰想要這麼做呢?實務上必定不符所需。

精準程度與否,在人類社會上視其目的,其實大多只需要到某種程度的評估結果即可,譬如說圓周率可是無窮循環小數,我們實務上通常只需要抓3.14,或者3.1415,根本不需要到一個完美的標準答案。

所以若能夠找到一個像72法則那樣的模型,有效地幫助我們快速簡易的評估出一個符合所需的答案,就是ML的最大價值,尤其是現實社會問題往往沒有一個標準答案,原本沒有標準答案的問題,科學就很難推演,但今天只是需要有方向、有用、有大概範圍的答案,尋找問題的解答模型相對就比較容易,成本也能夠下降到一個我們更容易接受的程度。

總結來說,ML就是想要找到一個能夠解決我們問題的聖杯公式,或許不會懂得聖杯的運作原理,但有用,而這個聖杯公式(數學模型)也只能適用單一問題,如果情況改變就派不上用場。

所以說,團隊是否投入發展ML,是需要審慎衡量一下團隊的目的與條件。


上一篇
前言 | ML#Day1
下一篇
ML是一種方法 | ML#Day3
系列文
後端工程師的ML入門理解與Vertex AI30

尚未有邦友留言

立即登入留言