iT邦幫忙

pandas相關文章
共有 262 則文章
鐵人賽 自我挑戰組 DAY 3

技術 Day3- 建立DataFrame(1)二維的創建及取值

Pandas的DataFrame是二維陣列,是使用橫向索引(列)與直向欄位(行)組合起來的資料內容。 創建DataFrame語法為: pd.DataFram...

鐵人賽 Python DAY 7

技術 Python pandas 如何處理含有無效日期或缺失值的日期欄位?【Python 處理 Excel #7】

本篇文章同步發布於 Python pandas 如何處理含有無效日期或缺失值的日期欄位?【Python 處理 Excel #7】 前言 處理含有日期欄位的數...

技術 【資料視覺化】COVID新冠疫苗施打一覽 Seaborn

今晚來點輕鬆的。資料視覺化,複習一下DataFrame、seaborn引用資料來源:country_vaccination.csv Kaggle Datase...

鐵人賽 自我挑戰組 DAY 7

技術 Day 7|新增 Series 或 DataFrame

  嗨!大家好!了解完如何載入和觀察資料後,接著將開始一系列對資料內容的操作,今天的主題為「新增資料」,內容分別以Pandas兩種常見的數據結構說明,包含:...

技術 Python學習筆記: Pandas 欄位部份字元篩選

本文同步發表於小弟自架網站:微確幸資訊站 import pandas as pd dict = {'學年': {0: 108, 1: 108, 2:...

鐵人賽 自我挑戰組 DAY 9

技術 Day9- 資料探索(2)重覆資料

重複資料在資料清理的過程中,可以說是最常見的問題之一,使用Pandas套件,透過duplicated()方法查找資料集的重複資料後,再利用drop_dupli...

鐵人賽 自我挑戰組 DAY 18

技術 Day 18|資料的分組和聚合

  在大型數據當中,有時我們會需要透過群組的方式概括整體資料,除了用以觀察之外,也能進一步深入處理,本文將分享如何使用資料的分組和聚合操作,內容包含: 資料分...

鐵人賽 自我挑戰組 DAY 11

技術 Day 11|資料快速排序操作

  完成資料篩選後,我們可以針對特定欄位進行排序,幫助我們快速整理與觀察,以下將透過案例替大家介紹兩種資料排序的方式,內容包含: 根據數值(value)排序...

鐵人賽 自我挑戰組 DAY 30

技術 Day 30|Pandas 完賽!

嗨!大家好!我是Eva!一位正努力跨進資料科學領域的女子!沒想到寫著寫著 30 天的日子就這樣過去了,能完成挑戰實在太感動了 😭 ■ 系列回顧 在這 30 天挑...

鐵人賽 自我挑戰組 DAY 14

技術 Day 14|資料清理-填補篇

  除了採用「刪除」的方式清理資料外,為確保數據的完整性,「填補」的操作也是另一種常見的方式,本文將說明資料清理中有關填補的操作方法,內容包含: 常數填補 統...

鐵人賽 Python DAY 19

技術 [Day19] - 範例1:天干地支西元年份對照表

從[Day19]~[Day23],我們將一起運用gt來製作四張生活化表格。過程皆分為四大部份: 資料生成(或收集)。 DataFrame製作。 表格製作。 結...

鐵人賽 自我挑戰組 DAY 6

技術 Day 6|實戰讀取並觀察外部資料

  在進行數據分析前,需要先了解資料的內容,以利後續資料清理、特徵工程等處理,因此本篇將延續昨日主題,以實際案例實作一次讀取外部資料,並使用基本語法觀察資料內容...

鐵人賽 自我挑戰組 DAY 28

技術 Day 28|Interview Query - Complete Addresses

■ 題目|Interview Query - Complete Addresses You’re given two dataframes. One conta...

鐵人賽 Python DAY 1

技術 [Day01] - 緣起

What Great Tables是一個將Pandas或Polars dataframe製作為表格的Python專案,其啟發來自R語言的gt package(註...

鐵人賽 自我挑戰組 DAY 5

技術 Day5- 資料處理(1)檔案存取

Pandas可從CSV 、Excel 、資料庫,或從網頁中擷取表格資料,匯入Pandas後,再對資料進行各種處理。 讀取 存入 read_cs...

鐵人賽 自我挑戰組 DAY 28

技術 Day28- 視覺化呈現(3)圓餅分析

圓餅圖 假設我們有一組資料,記錄了某公司員工的職稱和人數 職稱 | 人數 ------- | -------- 經理 | 10 主管 | 20 專員 | 3...

鐵人賽 Python DAY 25

技術 [Day25] - 如何與FastAPI整合 - 靜態表格

今天我們來說明如何將gt表格呈現於FastAPI app中。 本日程式碼將存在main.py檔中,內容參考自官方Solar Zenith Angles範例。 步...

鐵人賽 自我挑戰組 DAY 24

技術 Day 24|Interview Query - Good Grades and Favorite Color

  先前,我們大約花了三週的時間學習 Pandas 的操作,是時候好好驗收學習成果了!從今天開始,我將每天和大家分享一道題目,親自撰寫解法,並提出我的解題思維,...

鐵人賽 AI & Data DAY 24

技術 Day24 Pandas 分析時尚商品資料集

Pandas 是一個Python程式語言中的資料處理工具,它的主要用途是幫助人們處理和分析數據。Pandas提供了一種方便的方式,讓你可以載入、整理、分析、和可...

鐵人賽 AI & Data DAY 25

技術 Day25 建立時尚商品的資料集

今天我們要將 Pandas 讀取 csv 檔案要用到的資料取出來,並且做前處理來讓資料可以建立模型的資料集,會有以下三個步驟: 得到一個長 list1 :...

鐵人賽 自我挑戰組 DAY 1

技術 Day 1|Pandas 開賽!

嗨!大家好!我是Eva!一位正努力跨進資料科學領域的女子!這是我首次撰寫技術文章,也是第一次挑戰30天日更,希望能挑戰成功!第一篇文章,就讓我簡單介紹參賽動機、...

鐵人賽 Python DAY 18

技術 [Day18] - 核心思維

本日內容為gt核心思維分享,如果只是想學習如何使用gt的朋友,可以略過。 [Day01]至[Day17]我們一起學習了gt的各種功能,接下來幾天將進入實務製表的...

鐵人賽 自我挑戰組 DAY 8

技術 Day 8|資料運算的加減乘除

  資料的運算是整理大型數據常見的操作,本篇將搭配新增資料的操作,以案例分享 DataFrame 的加減乘除,方便我們利用 Pandas 快速整理數據,以下內容...

鐵人賽 自我挑戰組 DAY 7

技術 Day7- 資料處理(3)空值處理

資料搜集過程中,難免會遇到有缺失(空)值的部份,如何處理空值才能將降低其對於資料處理的影響力,也是資料分析的必修課。 import pandas as pd...

鐵人賽 自我挑戰組 DAY 25

技術 Day25- 資料分析(8)遮照分析

目標:使用 mask() & query() 函數來計算1.計算年紀大於70歲(age>70)的存活率(survived=1)2.計算年紀小...

鐵人賽 自我挑戰組 DAY 10

技術 Day 10|資料的篩選與過濾

  在進行大量的資料處理時,有時會需要取得符合特定條件的資料,以利後續的觀察與操作,此時就會使用到資料篩選和過濾的技能,今天將以案例搭配 loc[] 函數和大家...

鐵人賽 自我挑戰組 DAY 13

技術 Day 13|資料清理-刪除篇

  在處理資料集時,資料清理是不可或缺的步驟,刪除不需要的數據或特徵以確保數據的品質是常見的操作,本文將說明資料清理中有關刪除的操作方法,內容包含: 刪除缺失...

鐵人賽 自我挑戰組 DAY 4

技術 Day4- 建立DataFrame(2)資料操作

Pandas如何對DataFrame資料排序、修改、刪除。 一、資料排序 (1)依值排序 根據資料數值排序語法如下: df.sort_values(by...

鐵人賽 自我挑戰組 DAY 29

技術 Day29- 視覺化呈現(4)箱形分析

箱形圖 假設我們有一組資料,記錄了某公司員工的月薪 月薪 | 次數 ------- | -------- 10000 | 10 15000 | 20 200...

鐵人賽 自我挑戰組 DAY 16

技術 Day 16|自定義轉換必學的apply()函數

  在昨天標籤編碼法(Label Encoding)的舉例中,我們可以透過 sklearn 中的函數 LabelEncoder 將類別型態轉為數值型態,那大家是...