分享至
請問當機器學習建立模型上線正式使用後使用了一陣子後多了些資料預測錯誤的資料想要進行re-train的動作1.使用原本的model直接fit新資料2.將所有的資料合併後,再對全部資料重新fit一個新model這兩種是否有不同的用途抑或是都用哪一種居多呢謝謝指點
已邀請的邦友 {{ invite_list.length }}/5
第一種是不太好的方法,這樣 model 會忘記舊的東西,只認得新的第二種從頭訓練要訓練很久,每次都這樣做實在很浪費時間
通常是用第三種:將所有的資料合併後,使用訓練過的 model 訓練這樣 model 不但可以看到全部的資料,而且不用重新開始訓練
先將錯誤資料找出並剔除,用之前準確率高的權重檔,再進行新資料的訓練不就好了,若所有資料再訓練一次,當模型複雜,資料量大...除非你的時間很充裕且公司允許的話。
IT邦幫忙