在資料科學的世界裡,實戰才是最好的學習方式。Kaggle 是全球最大的資料競賽平台,聚集了無數的有獎挑戰與高手討論集,可以說是「資料科學家的遊樂場」。本系列將以 30 天不間斷的鐵人挑戰,帶大家一起「遛咖狗」,一路體驗 Kaggle 的各種競賽,逐步拆解參賽流程。內容包含資料下載、EDA、前處理、建模、調參與模型融合。透過持續實戰,我們不只累積資料分析的經驗,還能打造自己的作品集,甚至認識志同道合的戰友。30 天連續挑戰,讓「咖狗」陪你一起,把資料科學從陌生變成日常!
為什麼選 Kaggle? Kaggle 是全世界公認最大的資料科學社群平台;可以下載資料、閱讀別人的 Notebook、參加實戰競賽,邊做邊學,還能把成果放進...
繼昨天說的,下載完比賽資料後,第一步最重要的並不是立刻開始建模,而是先充分理解比賽的任務目標、評分方式以及資料型態。今天這篇文章,我會帶大家一步步認識 Bina...
昨天我們理解了比賽的任務、評分方式,並完成資料解壓與前處理。今天,我們要進一步了解資料的分布與特徵,這一步叫做探索式資料分析(Exploratory Data...