哈囉大家好~~~
之前我們說過,一個好的特徵必須與你的目標(你要解決的問題)有關聯,除了相關性,我們也要注意我們的特徵是不是與預測的目標在時間上是吻合的,也就是說我們的數據集和預測目標要在某個時間範圍內,我們以房價預測模型為例,如果我們只有今天房屋的價格和房屋資訊相關的數據集,那麼在訓練模型期間所輸出的價格會是較準確的,但是如果預測目標的時間範圍不同(過了一段時間),你訓練的模型就無用武之地了。
我們再來舉另一個例子,信用卡系統需要三天的時間才能處理,當你要在5月15日進行預測,你信用卡系統最新的數據只會到5月12日,這兩個時間的延滯時間會影響你訓練出的模型和預測的準確度,你必須針對三天的延滯去修改你要做為特徵的數據,才能得到表現更好的機器學習模型。
明天連假開始第一天,也是倒數7天完賽!
大家加油~~明天見!