參賽的方向旨在為讀者探索資料科學的精髓,不僅講述理論知識,也強調實際操作的重要性,分享的內容包括資料清洗與分析、視覺化圖形、機器學習和深度學習,讀者將透過了解基礎知識並學習程式碼的運用,學會如何處理真實世界的數據以及建立預測模型,在未來有機會透過實作專案來應用所學,並提升自己的資料科學能力。
今天是鐵人賽挑戰的第一天~ 嗨~大家好,我是一位剛從大學畢業的學生,大學期間我學習了許多資料處理與建模的知識與方法。在今年的暑假,我報考了iPAS的中級巨量資料...
在進入正題之前先來了解一下python在做資料分析與機器學習模型時常常會使用到的套件吧~ Pandas(Panel Data):描述:Pandas提供了Dat...
~今天要分享的是「檔案介紹與匯入匯出」~在做資料分析時,我們常見的檔案類型有: .csv:為純文字檔案,資料以逗號字元分隔。 .tsv:為純文字檔案,資料以t...
~今天要分享的是「資料清洗」~資料清洗是資料分析前的關鍵步驟之一,同時也是資料預處理的一部分。它的主要目的是處理原始數據中的錯誤和不一致性,以確保資料的品質。以...
~今天要分享的是「ETL的介紹」~ ETL是在資料預處理的階段執行,目的是讓結構資料與非結構資料經過此技術後,變得更容易分析。它由三個英文單字所組成,分別是:E...
~今天要分享的是「探索式資料分析中的統計摘要資訊與整潔數據」~ 探索式資料分析(Exploratory Data Analysis,縮寫為EDA)顧名思義就是我...
~今天要分享的是「索引值及排序」~ 在學生時期,我們每個人都會有專屬於自己的學號,每次考完試之後,學校都會根據學生的成績進行排名,同樣地,在資料分析中,為了方便...
~今天要分享的是「關聯式分析」~ 說到關聯式分析,相信大家一定聽過購物籃分析的尿布和啤酒,這是在一家超市觀察到的現象:許多人在買尿布的同時會購買啤酒。這兩個看似...
~今天要分享的是「資料視覺化圖形介紹」~ 人類是典型的視覺動物,因為人類傾向於透過視覺來理解世界和記憶訊息,因此如果能將數據以直觀的方式展示,就可以幫助我們快速...
~今天要分享的是「資料視覺化圖形 — 繪圖設定」~ 在這篇我要向大家介紹的是,如何使用python進行繪圖設定一般來說,我們想要繪製一個最簡單的資料視覺化圖形步...