iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
AI & Data

30Day 從一介凡人羽化成資料科學初學者 系列

為什麼標題是羽化為資料科學初學者,而不是資料科學大師?
因為阿~怎麼可能有人能在30天就專精這個領域呢~

正題:

本篇將教你認識 numpy、pandas、pytorch、sklearn、seaborn 各套件

注重於如何實際操作

為你整理各套件的實用方法

最後實際帶領操作Kaggle Titanic 進入前5%

鐵人鍊成 | 共 30 篇文章 | 13 人訂閱 訂閱系列文 RSS系列文
DAY 11

Day11- pandas(6)DataFrame有效率的檢視資料方法

往往我們在拿到一份資料時,數據都是很大很恐怖的而且我們並無足夠的時間將每個數值好好得看過一遍pandas提供了許多方法穰我們能有效率的做資料探勘我會使用Kagg...

2021-09-13 ‧ 由 Eating_o 分享
DAY 12

Day12- pandas(7)DataFrame遺失值處理

當我們拿到一份資料時,往往其中有許多缺失值以下我會介紹如何檢視及各缺失值處理方式 我先建立各raw及columns都有些缺失值的DataFrame isnull...

2021-09-14 ‧ 由 Eating_o 分享
DAY 13

Day13-seaborn(1)長條圖barplot、countplot

seaborn資料視覺化的強大套件能有效率的配合pandas快速地讓我們檢視資料我會跟Day11時一樣藉由Titanic的資料集來做示範 import seab...

2021-09-15 ‧ 由 Eating_o 分享
DAY 14

Day14-seaborn(2)直方圖histplot、散佈圖jointplot

直方圖直方圖與上一篇所介紹長條圖差別在哪裡呢?直方圖通常用來觀察連續性資料對於相同屬性值的呈現結果直方圖的x軸為連續性資料,例:年齡、年份等而長條圖的x軸為類別...

2021-09-16 ‧ 由 Eating_o 分享
DAY 15

Day15-seaborn(3)盒鬚圖boxplot、熱力圖heatmap

盒鬍圖可用來觀察資料的分布情形最大值、最小值、中位數、四分位數一樣使用Titanic資料集做示範 使用seaborn的boxplot繪製長條圖長方形最上面那條線...

2021-09-17 ‧ 由 Eating_o 分享
DAY 16

Day16-sklearn(1)正規化StandardScaler、MinMaxScaler、MaxAbsScaler

正規化縮小資料的呈現比例可使數值呈現在一定的範圍內使我們在訓練模型時,增加梯度下降的容易度並提升模型效果 StandardScaler:使均方差為1 impor...

2021-09-18 ‧ 由 Eating_o 分享
DAY 17

Day17-sklearn(2)LabelEncoder、train_test_split

今天要介紹這兩個sklearn的方法也是資料前處理常用到的 LabelEncoder:就如同字面上意思,會將標籤做編碼當我們想把一筆資料拿去train時,必須將...

2021-09-19 ‧ 由 Eating_o 分享
DAY 18

Day18-pytorch(1)認識tensor

tensor簡介:tensor是在pytorch運算時所使用的資料型態就像numpy一樣,可支持高維度的運算大部分方法與numpy雷同,可能只有些方法名稱不同而...

2021-09-20 ‧ 由 Eating_o 分享
DAY 19

Day19-pytorch(2)認識backward、自己設置loss function及updata參數

backward計算微分後的結果backward可自動算出function微分後的結果也就是算出斜率,之後我們可根據backward的計算結果來更新參數 以下範...

2021-09-21 ‧ 由 Eating_o 分享
DAY 20

Day20-pytorch(3)設置model、使用pytorch設置loss function及updata參數

我們透過簡單的regression來認識如何設置model及如何使用pytorch設置loss function及updata參數先設個範例資料,總共4筆資料x...

2021-09-22 ‧ 由 Eating_o 分享