Pandas數據操作技巧:選擇和篩選數據
簡介
在上一篇教學中,我們介紹了Pandas的基本數據結構,包括數據框和系列。現在,我們將學習如何在Pandas中選擇和篩選數據,以便進行更進一步的分析和處理。
選擇列
在Pandas中,您可以通過列名來選擇特定的列。我們將演示如何使用列名來提取數據框中的列。
import pandas as pd
data = {'Name': ['Alice', 'Bob', 'Charlie'],
'Age': [25, 30, 35]}
df = pd.DataFrame(data)
name_column = df['Name']
print(name_column)
選擇行
您可以使用行索引來選擇特定的行。我們將展示如何使用 .loc[] 和 .iloc[] 選擇行。
first_row = df.loc[0]
print(first_row)
second_row = df.iloc[1]
print(second_row)
基於條件選擇
Pandas允許您根據條件篩選數據,例如選擇年齡大於30的行。
filtered_data = df[df['Age'] > 30]
print(filtered_data)
複合條件
您可以使用多個條件結合來進行篩選,例如選擇名字是'Bob'且年齡大於25的行。
filtered_data = df[(df['Name'] == 'Bob') & (df['Age'] > 25)]
print(filtered_data)
有時候,您可能需要刪除特定列或行的數據。我們將展示如何刪除列和行。
刪除列
使用 .drop() 方法可以刪除特定列。
df = df.drop(columns=['Age'])
print(df)
刪除行
使用 .drop() 方法可以刪除特定行。
df = df.drop(index=0)
print(df)