在嘗試建立模型時,我們要先預選一個方程式的基底形狀,這個方程式需要一定程度可以描述足夠多元的形狀,但什麼樣的 function 才是足夠好的 function,用一個 sin, cos 可以嗎?
到底 Activation Function 原先想要達成什麼目的,以此為契機所以才有後續這些方程式的選擇。
從數學觀點,我們要能產生出一個足夠描繪此現實狀況且同時可以猜測到未來狀況的模型。現實狀況轉換成數學時,即便是單純的單變數環境 e.g. 從現在的觀看數來預測未來的觀看數,也有可能會有很複雜的線段特質(可以想像就跟股票的起伏一樣,即便只是價格走勢,線段也是每天起伏不定的曲線)
如果要找到一個單位 function 可以描述這些曲線,這個 function 應該會有以下特質: