哈囉大家好,今天是day11,向各位報告今天的影片進度:
ML最厲害之處在於其模型數量之多及產速之快,而非模型架構複雜度;許多小ML模型結構都很簡單。
如果你正在建構生產大量的ML模型,但其中一定會有一堆模型的結果不好是你不要的,你需要一個能夠快速嘗試錯誤的環境讓你篩掉不好的模型,以此做依據繼續迭代訓練,這在做ML是很重要的。舉例來說就像,有個人生病,及早發現越早治療;不要拖到已病入膏肓,屆時只能亡羊補牢。
雖然講者demo用的資料是已結構化整理過的,但實際上在企業界的資料可就沒那麼好了,有90%的資料是未結構化的,意即很凌亂,ex:電子郵件、錄像、文字、報告、目錄、熱門表演、大事、新聞...等。