iT邦幫忙

pandas相關文章
共有 262 則文章
鐵人賽 AI & Data DAY 25

技術 Day25 建立時尚商品的資料集

今天我們要將 Pandas 讀取 csv 檔案要用到的資料取出來,並且做前處理來讓資料可以建立模型的資料集,會有以下三個步驟: 得到一個長 list1 :...

鐵人賽 自我挑戰組 DAY 15

技術 Day 15|資料清理-型態轉換

  在進行資料專案時,模型是基於數學設計的,有些資料型態不適合模型存取,為了提高數據的可用性和模型的處理,本文將以案例說明如何進行資料型態轉換,內容包含: 介...

鐵人賽 自我挑戰組 DAY 15

技術 Day15- 資料探索(8)統計方法

資料到手後,首先觀察資料的組成特性,除了先前提過的shape()、len()、describe(),來看看還有其他統計方法可以更了解資料特性。 匯入表格 i...

鐵人賽 AI & Data DAY 24

技術 Day24 Pandas 分析時尚商品資料集

Pandas 是一個Python程式語言中的資料處理工具,它的主要用途是幫助人們處理和分析數據。Pandas提供了一種方便的方式,讓你可以載入、整理、分析、和可...

鐵人賽 自我挑戰組 DAY 14

技術 Day14- 資料探索(7)布林索引

布林索引又稱布林選取,就是使用布林陣列來篩選資料的方法。 先對DataFrame的其中一個欄位進行條件判斷,進而得到一個布林陣列,再從中計算摘要統計資訊。...

鐵人賽 自我挑戰組 DAY 14

技術 Day 14|資料清理-填補篇

  除了採用「刪除」的方式清理資料外,為確保數據的完整性,「填補」的操作也是另一種常見的方式,本文將說明資料清理中有關填補的操作方法,內容包含: 常數填補 統...

鐵人賽 自我挑戰組 DAY 13

技術 Day13- 資料探索(6)資料重整

當得到資料為混亂資料時,我們可使用函式將DataFrame重組成整齊的樣子。先使用stack()將所有欄位名稱旋轉成索引,再使用reset_index()來重...

鐵人賽 自我挑戰組 DAY 13

技術 Day 13|資料清理-刪除篇

  在處理資料集時,資料清理是不可或缺的步驟,刪除不需要的數據或特徵以確保數據的品質是常見的操作,本文將說明資料清理中有關刪除的操作方法,內容包含: 刪除缺失...

鐵人賽 自我挑戰組 DAY 12

技術 Day 12|觀察資料中的缺失值

  資料在產生或蒐集時可能因為各種原因出現缺失值(Missing Value),導致資料集中缺少某些觀測值或該值無法表示或測量,因此,處理缺失值是數據分析中很重...

鐵人賽 自我挑戰組 DAY 10

技術 Day10- 資料探索(3)資料篩選

篩選資料是分析時,常會使用到的操作方式,用來簡化及提取所需要的資料。 戶名 | 行政區 | 購屋年份 | 價格A | 松山區 | 2020/10/5 |22...

鐵人賽 自我挑戰組 DAY 10

技術 Day10- 資料探索(3)資料篩選

篩選資料是分析時,常會使用到的操作方式,用來簡化及提取所需要的資料。 戶名 | 行政區 | 購屋年份 | 價格A | 松山區 | 2020/10/5 |22...

鐵人賽 自我挑戰組 DAY 11

技術 Day11- 資料探索(4)類型轉換

若發現資料類型不適用於接下來的分析,可使用DataFrame.astype()函式來進行轉換,將目前資料類型轉換為特定的資料類型。 DataFrame.as...

鐵人賽 自我挑戰組 DAY 11

技術 Day 11|資料快速排序操作

  完成資料篩選後,我們可以針對特定欄位進行排序,幫助我們快速整理與觀察,以下將透過案例替大家介紹兩種資料排序的方式,內容包含: 根據數值(value)排序...

鐵人賽 自我挑戰組 DAY 10

技術 Day 10|資料的篩選與過濾

  在進行大量的資料處理時,有時會需要取得符合特定條件的資料,以利後續的觀察與操作,此時就會使用到資料篩選和過濾的技能,今天將以案例搭配 loc[] 函數和大家...

鐵人賽 AI & Data DAY 14

技術 資料處理 Python Pandas 好用的function - Part 2

繼續上一章資料處理 Python Pandas 好用的function - Part 1 #1. pd.to_datetime(df['Date']) /pd....

鐵人賽 自我挑戰組 DAY 9

技術 Day9- 資料探索(2)重覆資料

重複資料在資料清理的過程中,可以說是最常見的問題之一,使用Pandas套件,透過duplicated()方法查找資料集的重複資料後,再利用drop_dupli...

鐵人賽 自我挑戰組 DAY 9

技術 Day 9|資料運算的常見函數

  資料的運算除了基本的加減乘除之外,也能透過函數快速觀察和取得常見的統計值,完成資料匯總,以下將以實例介紹六種常見函數,包含: 最大值與最小值 資料加總與筆...

鐵人賽 自我挑戰組 DAY 8

技術 Day8- 資料探索(1)資料查看

資料類型查看,為資料探索的重要第一步。 import pandas as pd df=pd.DataFrame([[8,7,6,5,4],[3,4,2,9,...

鐵人賽 自我挑戰組 DAY 8

技術 Day 8|資料運算的加減乘除

  資料的運算是整理大型數據常見的操作,本篇將搭配新增資料的操作,以案例分享 DataFrame 的加減乘除,方便我們利用 Pandas 快速整理數據,以下內容...

鐵人賽 自我挑戰組 DAY 7

技術 Day7- 資料處理(3)空值處理

資料搜集過程中,難免會遇到有缺失(空)值的部份,如何處理空值才能將降低其對於資料處理的影響力,也是資料分析的必修課。 import pandas as pd...

鐵人賽 自我挑戰組 DAY 7

技術 Day 7|新增 Series 或 DataFrame

  嗨!大家好!了解完如何載入和觀察資料後,接著將開始一系列對資料內容的操作,今天的主題為「新增資料」,內容分別以Pandas兩種常見的數據結構說明,包含:...

鐵人賽 自我挑戰組 DAY 6

技術 Day6- 資料處理(2)資料合併

資料搜集後常會分布在不同的檔案中,使用Pandas讀取後再將資料合併。Pandas提供了append(資料附加)、concat(資料串接)及merge(資料融...

鐵人賽 自我挑戰組 DAY 6

技術 Day 6|實戰讀取並觀察外部資料

  在進行數據分析前,需要先了解資料的內容,以利後續資料清理、特徵工程等處理,因此本篇將延續昨日主題,以實際案例實作一次讀取外部資料,並使用基本語法觀察資料內容...

鐵人賽 自我挑戰組 DAY 5

技術 Day5- 資料處理(1)檔案存取

Pandas可從CSV 、Excel 、資料庫,或從網頁中擷取表格資料,匯入Pandas後,再對資料進行各種處理。 讀取 存入 read_cs...

鐵人賽 自我挑戰組 DAY 5

技術 Day 5|檔案路徑與存取外部資料

  Pandas 的優勢在於可以處理大型數據,方便使用者觀察和分析,但處理數據前需要先載入資料,因此,本文將說明如何透過檔案路徑讀取外部資料,內容包含: 介紹...

鐵人賽 自我挑戰組 DAY 4

技術 Day4- 建立DataFrame(2)資料操作

Pandas如何對DataFrame資料排序、修改、刪除。 一、資料排序 (1)依值排序 根據資料數值排序語法如下: df.sort_values(by...

鐵人賽 AI & Data DAY 4

技術 冒險前準備~Python中的資料處理工具 —— Pandas

今天早八,筆者昨天還做死玩遊戲到很晚,可以非常想睡了,但把畢業專題的老師找到了!嗚呼~那今天的內容不出意外是 Pandas 本來昨天要一起說得但晚上有點來不及所...

鐵人賽 自我挑戰組 DAY 4

技術 Day 4|資料結構 - DataFrame 篇

  上一篇文章中,介紹了 Pandas 中的 Series 結構,今天要和大家聊聊 Pandas 中最常使用的資料結構——DataFrame,其概念和操作都和...

鐵人賽 自我挑戰組 DAY 3

技術 Day 3|資料結構 - Series 篇

  學習撰寫程式時,常會遇到資料結構(Data Structure)這個詞彙,指的是如何用最有利的型態儲存或組織資料,並將其存在記憶體當中,以便電腦更有效率的使...

鐵人賽 自我挑戰組 DAY 3

技術 Day3- 建立DataFrame(1)二維的創建及取值

Pandas的DataFrame是二維陣列,是使用橫向索引(列)與直向欄位(行)組合起來的資料內容。 創建DataFrame語法為: pd.DataFram...