主題是【從資料庫到資料分析視覺化】,
希望可以更深入的了解data,
從資料庫的架構,資料的攫取,資料清理,
結合統計學到的知識挑出有用的數據,
最後加以視覺化。
主要還是邊做邊學,
看哪個部分是自己有興趣,或是想要加強的,
看是想要加強統計、決策分析、演算法、數據探勘、machine learning 還是NLP ,
讓大三選課更有方向!
也可以同時思考自己適不適合走data,
因為也要挑研究所的program了~
前言 這篇文章會進到資料的合併,通常在處理資料的時候並不會只出現一筆會需要同時處理很多比有關聯的資料這時候會資料的合併就很重要! 也是會繼續利用kaggle上的...
前言 這篇文章主要會提到資料分組 會繼續利用kaggle上的開源資料進行更多的pandas練習 Kaggle: Your Machine Learning an...
前言 這篇文章想學習的主題是常見的資料分析函數 前一篇學到了利用groupby.() 搭配聚合函數進行資料的統計分析 像是最大值,最小值,中位數等等 但是pan...
前言 前面學習了很多pandas的功能 在標籤的處理上還有資料的分析上也有進行介紹跟實際資料的演練 今天要練習的是更適用在真實應用場景的用法關於日期與時間的處理...
前言 今天這篇要進入到資料視覺化 在前幾篇的文章裡,資料的形式多半是呈現在表格化的資料表上 為了讓數據的呈現更為淺顯易懂 此時資料變成圖表就派上用場了! 可以讓...
前言 今天這篇要進入matplotlib的詳細概念介紹 這篇文章會分成兩大部分 放進繪圖函式的資料型態 圖表繪圖通用概念介紹 因為圖表的繪製本來就會根據不同...
前言 這篇文章主要是將前幾篇關於matplotlib的概念 實際應用在資料上 畫出各種的圖表 會搭配不同的參數調整表現出來的圖 文章分成4個部分 分別是 前置...
前言 這篇文章會延伸昨天所學 改變參數的使用 並且畫出更多的圖表 文章內容分別是3. 折線圖、散佈圖跟柱狀圖4. 長條圖5. 繪製在子圖上 折線圖、散佈圖跟柱狀...
前言 Seaborn是比matplotlib功能更強大的繪圖套件 是建立在matplotlib的基礎之上 主要用來和matplolib搭配使用 這篇的內容專注在...
前言 現在要進入網路爬蟲的自學紀錄了!!! Such a long way 網路爬蟲可以說是非常實用的功能 這篇文章會學習到 網路爬蟲的功用 HTML簡介 使...