iT邦幫忙

2024 iThome 鐵人賽

DAY 7
0
自我挑戰組

從零開始學Python系列 第 7

[Day7] Python數據分析-Pandas基本用法

  • 分享至 

  • xImage
  •  

Pandas 是一個強大的 Python 資料處理工具,主要用於操作表格數據。

Pandas 提供了兩個主要的資料結構:

  1. Series:一維的數據結構,可以理解為一個帶有索引的一維數組。
  2. DataFrame:二維的數據結構,可以理解為一個表格,類似Excel或SQL表格,由多個Series組成。

安裝
可以使用 pip 安裝 Pandas:

pip install pandas

導入Pandas

import pandas as pd

創建 DataFrame

data = {
    '姓名': ['小明', '小紅', '小藍'],
    '年齡': [25, 30, 22],
    '城市': ['台北', '高雄', '新竹']
}

df = pd.DataFrame(data)
print(df)
#輸出:
   姓名  年齡  城市
0  小明   25  台北
1  小紅   30  高雄
2  小藍   22  新竹

查看資料

  1. 查看前幾行數據
print(df.head())
  1. 查看數據的資訊:
print(df.info())

3.查看某一列:

print(df['姓名'])
#輸出:
0    小明
1    小紅
2    小藍
Name: 姓名, dtype: object

4.查看某一行:

print(df.iloc[0])
#輸出:
姓名    小明
年齡    25
城市    台北
Name: 0, dtype: object
  1. 選擇特定行和列:
print(df.loc[0, '姓名'])
#輸出:
小明

基本操作

  1. 新增一列:
df['薪水'] = [50000, 60000, 55000]
print(df)
#輸出:
   姓名  年齡  城市     薪水
0  小明  25  台北  50000
1  小紅  30  高雄  60000
2  小藍  22  新竹  55000
  1. 刪除一列:
df = df.drop(columns=['薪水'])
print(df)
  1. 修改數據:
df.loc[0, '年齡'] = 26
print(df)
#輸出:
   姓名  年齡  城市
0  小明  26  台北
1  小紅  30  高雄
2  小藍  22  新竹
  1. 過濾數據:
filtered_df = df[df['年齡'] > 25]
print(filtered_df)
#輸出:
   姓名  年齡  城市
0  小明  26  台北
1  小紅  30  高雄

匯出和讀取數據

  1. 從 CSV 文件讀取數據:
df = pd.read_csv('data.csv')
  1. 將 DataFrame 輸出為 CSV 文件:
df.to_csv('output.csv', index=False)

數據統計分析

  1. 數據輸入(假設我們有一個包含銷售數據的 DataFrame):
data = {
    '產品': ['A', 'B', 'A', 'C', 'B', 'A'],
    '銷售額': [200, 150, 300, 250, 100, 400]
}

df = pd.DataFrame(data)
  1. 分析(計算總銷售額,按產品分組計算銷售總額):
total_sales = df['銷售額'].sum()
print('總銷售額:', total_sales)
#輸出:總銷售額: 1400
grouped_sales = df.groupby('產品')['銷售額'].sum()
print(grouped_sales)
#輸出:
產品
A    900
B    250
C    250
Name: 銷售額, dtype: int64

上一篇
[Day6] Python數據分析-NumPy基本用法
下一篇
[Day8] Python資料視覺化-Matplotlib
系列文
從零開始學Python30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言