為什麼標題是羽化為資料科學初學者,而不是資料科學大師?
因為阿~怎麼可能有人能在30天就專精這個領域呢~
正題:
本篇將教你認識 numpy、pandas、pytorch、sklearn、seaborn 各套件
注重於如何實際操作
為你整理各套件的實用方法
最後實際帶領操作Kaggle Titanic 進入前5%
往往我們在拿到一份資料時,數據都是很大很恐怖的而且我們並無足夠的時間將每個數值好好得看過一遍pandas提供了許多方法穰我們能有效率的做資料探勘我會使用Kagg...
當我們拿到一份資料時,往往其中有許多缺失值以下我會介紹如何檢視及各缺失值處理方式 我先建立各raw及columns都有些缺失值的DataFrame isnull...
seaborn資料視覺化的強大套件能有效率的配合pandas快速地讓我們檢視資料我會跟Day11時一樣藉由Titanic的資料集來做示範 import seab...
直方圖直方圖與上一篇所介紹長條圖差別在哪裡呢?直方圖通常用來觀察連續性資料對於相同屬性值的呈現結果直方圖的x軸為連續性資料,例:年齡、年份等而長條圖的x軸為類別...
盒鬍圖可用來觀察資料的分布情形最大值、最小值、中位數、四分位數一樣使用Titanic資料集做示範 使用seaborn的boxplot繪製長條圖長方形最上面那條線...
正規化縮小資料的呈現比例可使數值呈現在一定的範圍內使我們在訓練模型時,增加梯度下降的容易度並提升模型效果 StandardScaler:使均方差為1 impor...
今天要介紹這兩個sklearn的方法也是資料前處理常用到的 LabelEncoder:就如同字面上意思,會將標籤做編碼當我們想把一筆資料拿去train時,必須將...
tensor簡介:tensor是在pytorch運算時所使用的資料型態就像numpy一樣,可支持高維度的運算大部分方法與numpy雷同,可能只有些方法名稱不同而...
backward計算微分後的結果backward可自動算出function微分後的結果也就是算出斜率,之後我們可根據backward的計算結果來更新參數 以下範...
我們透過簡單的regression來認識如何設置model及如何使用pytorch設置loss function及updata參數先設個範例資料,總共4筆資料x...