小時候看到的模型,通常說明的是與實際物件相仿的物件。
這個概念也一樣可以用到機器學習上。
如同在前幾章提及,描述一個群體,如果夠接近常態分布,可以嘗試用平均數及標準差來說明。
而想描述ML模型,就從參數及超參數來著手。
首先要定義什麼叫最佳化(Optimization)。
平常說話,有人會說我想當「最棒的」,浩克是「最強」的,小明年紀「最小」。
這個最字,隱含著遠離平均值的概念;而數學上來說,就是斜率為零的變化點。
有些人習慣用微分後為零來說明,這也是另一個表達方式;但牽涉到該函數是不是可微分,故暫時先跳過。