在訓練Model之前我們習慣上先將資料分成好幾塊。你可能看過大多數人的做法是將原本的Data Set分成Training Data以及Testing Data,而Testing Data又分成public以及private,不過還有一種做法是將Training Data再分成Training Set以及Validation Set。而這些小小的分類其實就是為了驗證我們的 Model 是不是真的學會了甚麼而不是只是背了一些虛假的知識。本章節會講述一般最簡單的 training/validation/testing dataset,也會介紹 cross-validation 以及 Recall 以及 Precision 等知識。