iT邦幫忙

2023 iThome 鐵人賽

DAY 3
0

  學習撰寫程式時,常會遇到資料結構(Data Structure)這個詞彙,指的是如何用最有利的型態儲存或組織資料,並將其存在記憶體當中,以便電腦更有效率的使用。Pandas 本身有兩種常用的資料結構:Series 和 DataFrame!今天,就讓我先分享最基礎的 Series 篇吧!內容包含:

  1. 介紹 Series
  2. 創建 Series 物件
  3. 索引 Series 資料
  4. 瞭解 Series 屬性

■ 簡介|Series

  Series 在 Pandas 中適用於處理「單維度」的資料,以「一維陣列」呈現,每個元素都有其對應的索引(編號),就像數學線型函數中提到的「一對一」的概念。其資料內容可以包含數值、字串等多種類型的數據,因此能進行多種操作,如:新增、修改、數值運算和字串運算等。
https://ithelp.ithome.com.tw/upload/images/20230918/201622385qmaUSHzPi.jpg

■ 創建 Series 物件

使用 Series( ) 語法,搭配 Python 的列表(list)創建 Series 物件
舉例:創建名為 numbers 和 countries 的 Series 物件

import pandas as pd
numbers = pd.Series([15,25,35,45,55])
countries = pd.Series(['Taiwan','Japan','Korea','USA','Canada'])
print(numbers)
print('--------------------')
print(countries)

輸出結果:
https://ithelp.ithome.com.tw/upload/images/20230918/20162238uTxM1ZAzby.png

■ 索引 Series 資料

  「索引」,可以白話文解讀為「找到特定位置的資料」!創建 Series 時,電腦會自動從 0 開始編號,提供每一個元素一個索引值,如: countries 中,Taiwan 的索引值即為 0 。

import pandas as pd
countries = pd.Series(['Taiwan','Japan','Korea','USA','Canada'])
print(countries[0])    # 取索引值 0 的資料
print('--------------------')
print(countries[1:4])  # 取索引值 1 到 3 的資料

輸出結果:
https://ithelp.ithome.com.tw/upload/images/20230918/20162238NzKaLH3Lsk.png

若想自行定義索引值的話,可以index 參數進行設定
舉例:創建名為 coutries 的 Series 物件,並設定索引值為 No1 至 No5

import pandas as pd
countries = pd.Series(['Taiwan','Japan','Korea','USA','Canada'],index=['No1','No2','No3','No4','No5'])
print(countries)         # countries 完整資料
print('--------------------')
print(countries['No3'])  # 取索引值 No3 的資料

輸出結果:
https://ithelp.ithome.com.tw/upload/images/20230918/20162238FiFepQEhzT.png

■ 瞭解 Series 屬性

  1. Series.values:返回 Series 中的元素
  2. Series.size:返回 Series 中的元素數量
  3. Series.index:返回 Series 的索引
  4. Series.dtype:返回 Series 的數據型態
  5. Series.shape:返回 Series 的數據形狀

舉例:創建名為 numbers 的 Series 物件,並觀察其屬性

import pandas as pd
numbers = pd.Series([15,25,35,45,55])
print(numbers.values)
print(numbers.size)
print(numbers.index)
print(numbers.dtype)
print(numbers.shape)

輸出結果:
https://ithelp.ithome.com.tw/upload/images/20230918/20162238jEHmdIyzUI.png

  • (5,) 表示為一維結構,其中包含5個元素

■ 結語

以上 是今天的 Series 篇的分享,明天會再繼續介紹 DataFrame 篇唷!
如果有任何不理解、錯誤或建議的話,歡迎留言給我!喜歡的話,也歡迎按讚訂閱!
我是 Eva,一位正在努力跨進資料科學領域的女子!我們下一篇文章見!Bye Bye~
【本篇文章將同步更新於個人的 Medium


上一篇
Day 2|環境安裝 - Python、VS Code、Pandas
下一篇
Day 4|資料結構 - DataFrame 篇
系列文
Pandas|資料前處理工具 30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言