為什麼標題是羽化為資料科學初學者,而不是資料科學大師?
因為阿~怎麼可能有人能在30天就專精這個領域呢~
正題:
本篇將教你認識 numpy、pandas、pytorch、sklearn、seaborn 各套件
注重於如何實際操作
為你整理各套件的實用方法
最後實際帶領操作Kaggle Titanic 進入前5%
先備知識: 基本python能力 : 熟悉各基本型態,認識串列、字典、函式、class 了解深度學習原理: 需要具有深度學習的基本知識,那需要到什麼程度...
numpy介紹: 一個可操作高維度陣列的套件,可快速的對整個資料做運算。就不多說了,讓我們直接實際操作從中認識numpy吧! 首先要使用一個套件,最一開始就是i...
今天的重點 索引 基本索引: 先建立一個4x3的ndarray來讓我們實際操作 陣列索引是由外而內的,以上列ndarray作為範例因為都只有一層的索引,所以回傳...
布林索引:布林索引就是在索引裡放入布林陣列,為True的值會被挑出來一樣先建立一個ndarray來讓我們實際操作 先看布林陣列的產生我們想要知道陣列裡資料是否小...
ndarray的運算: 相同大小的陣列之間進行運算,稱作為 向量化意味著同時對整批的資料一起做運算相同位置的數值之間做運算 不同大小的陣列之間進行運算,稱作為...
pandas基本介紹: pandas資料處理的強大套件具有各種豐富有多便的資料操作函式大部分的資料前處理、資料探勘等工作都需要靠此套件與sklearn、seab...
DataFrame介紹 就像是個二維陣列具有欄(column)與列(raw)列就是前面介紹Series所說的資料標籤欄就是各column擁有的欄位名稱DataF...
DataFrame索引: DataFrame在使用索引時,必須填入欄位名稱 那我們如果只想選取某個raw的資料,而不是一個columns上述索引是沒辦法的可以使...
Series間的運算: Series在互相做數學運算時會根據對應index的位置來做互動如沒有對應的index此位置會被保留並且填上空值我先建立test_1、t...
什麼是匯總統計值呢?舉凡:mean(平均值)、sum(加總)、median(中位數)等...而DataFrame提供了需多方法讓我們輕鬆取得這些值 先建立資料讓...