由於在上一篇的文章中提到,我們可以從訓練一個模型或使用別人的預訓練模型做使用,但這邊會以自己訓練一個模型為主,那我們的第一步就是要先去準備我們需要的資料集。
由於我們需要蒐集大量的資料集,可以上網去尋找別人提供的資料集,或自己進行拍攝的動作,但資料集一定要相對豐富、足夠,才有辦法使訓練的模型準確率、泛用率提高,在這邊推薦一個網站,Kaggle 的資料集通常可以免費使用~
https://www.kaggle.com/datasets/ananthu017/emotion-detection-fer?resource=download
雖然通常是免費使用的,但使用者還是需要注意一些使用條款和限制。
以下是使用 Kaggle 資料集時需要考慮的事項:
條款和條件:每個 Kaggle 資料集都有自己的使用條款和許可協議。你應該仔細閱讀這些條款,以確保你的使用方式符合相關的規定。某些資料集可能有特定的使用限制,例如僅用於非商業目的或需要進行特定的引用。
下載和使用:Kaggle 提供了方便的下載功能,以便用戶可以獲取資料集。一旦你下載了資料,你可以在自己的分析項目、研究或應用程序中使用它。然而,確保你不會濫用或未經授權地分享這些資料。
競賽資料集 vs. 公共資料集:Kaggle 提供了兩種主要類型的資料集。競賽資料集通常與特定的競賽相關聯,其使用可能受到該競賽的規則限制。公共資料集通常更容易自由使用,但也要查看相關的使用條款。
遵守法律和隱私:當使用 Kaggle 資料集時,你應該遵守當地的法律法規,並尊重用戶的隱私。確保你處理數據時不會觸犯法律或侵犯他人的隱私權。
我這邊也整理好我需要用到的資料集,各位也可以先準備一下,明天會教大家該如何整理自己的資料集!