3-1 黑盒子的秘密
「現在為您介紹的是經由最新AI科技研發的智慧分析軟體,一鍵按下就能自動幫您找到適合的分析手法,再搭配機器學習與深度學習達到最理想的統計分析......」,在科技博覽會中,兩邊碩大的螢幕介紹著當今最火的人工智能分析軟體,整個會場擠滿了人潮與攤位,與會者都對新科技與新的分析技術充滿了興趣。
「飛哥,機器學習最近好熱門啊! 有人說他跟統計很像,但也有人說是另一種新的方法,你怎麼看這個領域呀?」小博看著螢幕的廣告後,轉向飛哥問問題。
「之前有說過所有的科學源頭都是來自數學,以我的觀察來看的話,數學生統計,統計又生機器學習, 很多機器學習的理論來自於機率論或是統計理論,加上機器學習有不少的矩陣和距離的運算,所以我會把它視為數學的一塊 ,而且是將許多數學理論活用的一個新領域。」飛哥眼神發著光邊述說著。
「雖然先有機器學習才有深度學習,不過我看網路上有人在戰機器學習跟深度學習是黑盒子(戰:激烈辯論的網路用語;黑盒子:指透過未知的方法在操弄結果),我看這兩個領域的理論好像也不是說很完整。」小博心生疑惑地提問。
「你這麼說也不是沒道理,但是你要想想看,大家都在推崇這兩新領域就代表著它也有一些統計做不到的事情,而這兩個領域建的模型樣式也可能跟一般認知的統計模型不太一樣,假設現在有個機器學習模型在內部驗證與外部驗證都有很高的準確率,但大家都不了解模型怎麼篩選要因時,不能去責怪模型式黑盒子,反而 要去思考是不是有哪些邏輯跟我們原本的認知不同,或者是有我們還未發現的新知識 ,當然我相信機器學習大部分的理論都已經被建構了,反而是深度學習這塊還有很多待開發與驗證的理論。」飛哥詳細地說明著對這兩個新領域的看法。
小博點了點頭:「那你覺得我要先學習哪一種比較好?」
飛哥聽完想了下並說:「會使用方法跟會改編方法是兩件事情,一般來說還是建議先學統計,再接觸機器學習與深度學習,很多人會用很多模型套件做出各種分析,但可能並不理解那些方法的假設或是背後的限制,常常會發生模型效果很好,但邏輯上不通或是不懂如何解釋。如果是偶爾才用的話,稍微會解釋結果其實無傷大雅,但是如果將這個當成工作的話,還是建議要多了解該方法背後的理論依據,可能還是需要接觸數學夠久的經歷。」
走著走著,眼前映入一塊大大的招牌寫著「幫你解決維度災難(curse of dimension)」,飛哥指著招牌說:「走吧!我們去看看那個攤位。」
資料參考:
https://ccjou.wordpress.com/%E5%B0%88%E9%A1%8C%E6%8E%A2%E7%A9%B6/%E6%A9%9F%E5%99%A8%E5%AD%B8%E7%BF%92%E5%B0%88%E9%A1%8C/
https://buzzorange.com/techorange/2019/05/02/difference-between-statistics-and-machine-learning/