Kaggle 是全世界公認最大的資料科學社群平台;可以下載資料、閱讀別人的 Notebook、參加實戰競賽,邊做邊學,還能把成果放進履歷或作品集。所以不管是在大學要推甄研究所,擔心自己缺少作品集的;抑或在求職欄看到加分條件是參加Kaggle競賽的。我覺得無論如何練習參加Kaggle中的競賽,刷刷分數,都會是一個很好充實自己的機會。
前往kaggle,沒有帳號也可以直接點選右上角 Sign in 用 Google/Facebook/Email/Yahoo 帳號進行註冊。
或是點選Register也可以註冊喔!
點擊Competitions,裡面就有很多比賽可以參加,有獲勝有獎金的,也有適合新手的
首先他在9/1就截止了,但還是想拿它作為本次kaggle的開場,所以讓我們進入本次的比賽Binary Classification with a Bank Dataset,下載資料的部分我先教一種很簡單的方式,若後面有需要我再教大家用API的方式下載
1.進到競賽頁(本文主角:Playground Series S5E8 – Binary Classification with a Bank Dataset)。
2.點選 Data 分頁,點選下載全部 。(下載完後若後續要再colab撰寫、執行程式可以不用急著解壓縮!)
(⚠️注意:第一次參加必須先在 Rules 分頁按 Join Competition / Accept Rules,才看得到下載按鈕,也才能送交結果。)
從kaggle 下載資料的地方也可以看見下載資料包含了甚麼。下載完比賽資料後,第一步最重要的並不是立刻開始建模,而是先充分理解比賽的任務目標、評分方式以及資料型態。
這三個步驟,就像是遊戲的攻略,先搞懂規則和地圖(就像打傳說、lol要先知道藍buff跟紅buff),才能更快找到破關方法。