當世界上收集資料的方法還不是很齊全的狀況下,統計學者認為:(現在)拿到的就是能拿到所有的資料了。
因此,統計方法論被建立了。
而統計方法的存在,幫助我們衡量出所謂的離群偏差值(outliers)。
由於能看到的資料數量少,無法代表群體的偏差值若存在於數據資料集中,則有很大的機率會影響我們判讀資料。
在這種前提之下,對於偏差值的處理就顯得重要,有可能會需要消除偏差值。
在不斷進步的時代,資料收集越來越多,如何能夠判讀如此大量的資料變成模型適當與否或是商業上勝敗的關鍵。
與前面提到的呼應,更快速的生成簡易模型、更多次的迭代將有助於模型的修正與適應。
這種環境挑戰下,簡約的高階API提供使用者建立機器模型成為一個非常有誘因的選項。
Google聽到了,因此TensorFlow出現了所謂的estimator。
TensorFlow Core->Estimator:根據官方說法,目前推薦使用的Estimator應屬於
tf.estimator.Estimator
類別,注意不要使用到tf.contrib.learn.Estimator
喔。