iT邦幫忙

2024 iThome 鐵人賽

DAY 17
0
Python

讓Python不拍勝-實用套件實作與介紹系列 第 17

[DAY17]使用Python進行資料處理-Pandas(九)

  • 分享至 

  • xImage
  •  

那今天就一樣廢話不多說,繼續介紹有趣的 Pandas 統計函數吧!

.median() 用來計算元素的中位數

print('#1')
print(instrument.median())
print('\n#2')
print(instrument.median(axis=1))
print('\n#3')
print(instrument.median().median())

輸出結果

#1
guitar      3.0
bass        6.0
keyboard    9.0
dtype: float64

#2
A    7.0
B    6.0
C    5.0
dtype: float64

#3
6.0

.std() 用來計算元素的標準差

print('#1')
print(instrument.std())
print('\n#2')
print(instrument.std(axis=1))
print('\n#3')
print(instrument.std(axis=1).std())

輸出結果

#1
guitar      1.0
bass        1.0
keyboard    1.0
dtype: float64

#2
A    3.21455
B    3.00000
C    3.21455
dtype: float64

#3
0.1238706467077965

.var() 用來計算元素的變異數

print('#1')
print(instrument.var())
print('\n#2')
print(instrument.var(axis=1))
print('\n#3')
print(instrument.var(axis=1).var())

輸出結果

#1
guitar      1.0
bass        1.0
keyboard    1.0
dtype: float64

#2
A    10.333333
B     9.000000
C    10.333333
dtype: float64

#3
0.5925925925925916

.min() 用來計算元素的最小值

print('#1')
print(instrument.min())
print('\n#2')
print(instrument.min(axis=1))
print('\n#3')
print(instrument.min().min())

輸出結果

#1
guitar      2
bass        5
keyboard    8
dtype: int64

#2
A    2
B    3
C    4
dtype: int64

#3
2

.max() 用來計算元素的最大值

print('#1')
print(instrument.max())
print('\n#2')
print(instrument.max(axis=1))
print('\n#3')
print(instrument.max().max())

輸出結果

#1
guitar       4
bass         7
keyboard    10
dtype: int64

#2
A     8
B     9
C    10
dtype: int64

#3
10

.count() 用來計算元素個數

這裡要小心,計算全部元素的個數不是 .count().count() 喔,是 .count().sum()!

print('#1')
print(instrument.count())
print('\n#2')
print(instrument.count(axis=1))
print('\n#3')
print(instrument.count().sum())

輸出結果

#1
guitar      3
bass        3
keyboard    3
dtype: int64

#2
A    3
B    3
C    3
dtype: int64

#3
9

.describe() 顯示常用的統計數值

這是一個超級酷的函數,他會直接列出所有經常會用到的統計數值,就不用一個一個求值囉!

print(instrument.describe())

輸出結果

       guitar  bass  keyboard
count     3.0   3.0       3.0
mean      3.0   6.0       9.0
std       1.0   1.0       1.0
min       2.0   5.0       8.0
25%       2.5   5.5       8.5
50%       3.0   6.0       9.0
75%       3.5   6.5       9.5
max       4.0   7.0      10.0

那統計函數的部分就先簡單介紹到這邊,有任何疑問或想補充的內容都歡迎在留言區討論!

經過這幾天的學習,相信大家對 Pandas 基礎已經有很扎實的瞭解了,那資料會處理了,要怎麼把處理好的資料存起來呢?
還記得之前教過如何利用 with open() as 這個函數進行檔案處理嗎,下一篇,就要來教各位如何讀取 CSV 檔進行處理,以及如何將處理完的資料存成 CSV 檔。


上一篇
[DAY16]使用Python進行資料處理-Pandas(八)
下一篇
[DAY18]使用Python進行資料處理-Pandas(十)
系列文
讓Python不拍勝-實用套件實作與介紹30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言