了解必要的概論 | ML#Day2 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

2021 iThome 鐵人賽

DAY 2

AI & Data

後端工程師的ML入門理解與Vertex AI系列第 2 篇

了解必要的概論 | ML#Day2

13th鐵人賽

虎斑貓

團隊神龍特攻隊 - it 宏的逆襲

2021-09-10 08:48:54

889 瀏覽

分享至

ML 最主要的目的是得到一個數學函式，或者是說數學模型，然後運用該模型來得到想要的結果。

所謂模型，以資訊工程的角度簡單解釋，可以像是MD5或者sha1 那樣的東西。

如上圖示意，1 個input 對應到1個output，前後關係容易理解，如果有心想研究，進一步討論md5或sha1裡面的計算過程，耐心研讀也是還在人類看得懂的範疇當中。

ML想要得到的數學模型，實務上要能夠應用並且解決問題，需要更多的參數input，以及可能比md5的運算規則更複雜的運算方式去處理，才有機會得到想要的答案。

然而進入到ML的第一個門檻，自己主觀認為首先最大的困難，是「接受」並且「認知」到模型的內在運作方式，大部分時候我們無法理解。

訓練出來的模型，其實都是各式各樣的數學函式組合，得出來很醜很詭異，基本上無法理解、無法解釋為什麼要那樣運算，但經過驗證後，以統計的科學證明，卻會是有用的東西，產生出來的答案可以非常接近我們預期的數值或結果。

無法理解，但有用，理性上要接受它這樣，可能就是一道心理門檻。

這個時候我喜歡拿72法則來舉例，72法則是愛因斯坦歸納出來的一種簡單方式，估計資產翻倍所需報酬率的時間。

利用72法則得出來的結果並不會非常精確，但是已經符合我們的需求，另一個好處是計算成本也相對低廉，譬如說報酬率是8%，72/8 = 9，我們馬上就知道需要約9年的時間，資產就會翻倍。

如果要求非常精準，往往要求的算法也跟著相對複雜，計算成本會跟著相對高昂，試想為了得到一個預測結果，將參數餵到電腦運算，可能需要好幾個小時或好幾天，甚至需要超級電腦才有可能得到答案，誰想要這麼做呢？實務上必定不符所需。

精準程度與否，在人類社會上視其目的，其實大多只需要到某種程度的評估結果即可，譬如說圓周率可是無窮循環小數，我們實務上通常只需要抓3.14，或者3.1415，根本不需要到一個完美的標準答案。

所以若能夠找到一個像72法則那樣的模型，有效地幫助我們快速簡易的評估出一個符合所需的答案，就是ML的最大價值，尤其是現實社會問題往往沒有一個標準答案，原本沒有標準答案的問題，科學就很難推演，但今天只是需要有方向、有用、有大概範圍的答案，尋找問題的解答模型相對就比較容易，成本也能夠下降到一個我們更容易接受的程度。

總結來說，ML就是想要找到一個能夠解決我們問題的聖杯公式，或許不會懂得聖杯的運作原理，但有用，而這個聖杯公式(數學模型)也只能適用單一問題，如果情況改變就派不上用場。

所以說，團隊是否投入發展ML，是需要審慎衡量一下團隊的目的與條件。