iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
AI & Data

30Day 從一介凡人羽化成資料科學初學者 系列

為什麼標題是羽化為資料科學初學者,而不是資料科學大師?
因為阿~怎麼可能有人能在30天就專精這個領域呢~

正題:

本篇將教你認識 numpy、pandas、pytorch、sklearn、seaborn 各套件

注重於如何實際操作

為你整理各套件的實用方法

最後實際帶領操作Kaggle Titanic 進入前5%

鐵人鍊成 | 共 30 篇文章 | 8 人訂閱 訂閱系列文 RSS系列文
DAY 1

Day1 - 導讀 帶你認識資料科學所需套件

先備知識: 基本python能力 : 熟悉各基本型態,認識串列、字典、函式、class 了解深度學習原理: 需要具有深度學習的基本知識,那需要到什麼程度...

2021-09-03 ‧ 由 Eating_o 分享
DAY 2

Day2 - numpy(1)基本介紹及使用

numpy介紹: 一個可操作高維度陣列的套件,可快速的對整個資料做運算。 就不多說了,讓我們直接實際操作從中認識numpy吧! 首先要使用一個套件,最一開始就是...

2021-09-04 ‧ 由 Eating_o 分享
DAY 3

Day3 - numpy(2) 基本索引

今天的重點 索引 基本索引: 先建立一個4x3的ndarray來讓我們實際操作 陣列索引是由外而內的,以上列ndarray作為範例 因為都只有一層的索引,所以...

2021-09-05 ‧ 由 Eating_o 分享
DAY 4

Day4 - numpy(3) 布林索引、轉置陣列

布林索引: 布林索引就是在索引裡放入布林陣列,為True的值會被挑出來 一樣先建立一個ndarray來讓我們實際操作 先看布林陣列的產生 我們想要知道陣列裡資...

2021-09-06 ‧ 由 Eating_o 分享
DAY 5

Day5 - numpy(4)ndarray的運算及全域函式

ndarray的運算: 相同大小的陣列之間進行運算,稱作為 向量化 意味著同時對整批的資料一起做運算 相同位置的數值之間做運算 不同大小的陣列之間進行運算,稱...

2021-09-07 ‧ 由 Eating_o 分享
DAY 6

Day6 - pandas(1)Series基本概念

pandas基本介紹: pandas資料處理的強大套件 具有各種豐富有多便的資料操作函式 大部分的資料前處理、資料探勘等工作都需要靠此套件與sklearn、se...

2021-09-08 ‧ 由 Eating_o 分享
DAY 7

Day7 - pandas(2)DataFrame基本概念

DataFrame介紹 就像是個二維陣列 具有欄(column)與列(raw) 列就是前面介紹Series所說的資料標籤 欄就是各column擁有的欄位名稱 D...

2021-09-09 ‧ 由 Eating_o 分享
DAY 8

Day8 - pandas(3)DataFrame索引與loc、iloc

DataFrame索引: DataFrame在使用索引時,必須填入欄位名稱 那我們如果只想選取某個raw的資料,而不是一個columns 上述索引是沒辦法的...

2021-09-10 ‧ 由 Eating_o 分享
DAY 9

Day9 - pandas(4)Series與DataFrame的運算

Series間的運算: Series在互相做數學運算時 會根據對應index的位置來做互動 如沒有對應的index此位置會被保留並且填上空值 我先建立test_...

2021-09-11 ‧ 由 Eating_o 分享
DAY 10

Day10- pandas(5)DataFrame匯總統計值min、max、mean等

什麼是匯總統計值呢? 舉凡: mean(平均值)、sum(加總)、median(中位數)等... 而DataFrame提供了需多方法讓我們輕鬆取得這些值 先建立...

2021-09-12 ‧ 由 Eating_o 分享