颱風天繼續在家裡打字
使用 Pandas 和 Numpy 這兩個 Python 庫在資料科學和分析領域中非常常見,提供了靈活且強大的資料操作功能。Numpy 主打高效的數值計算,特別是在處理多維陣列時展現出色效能;而 Pandas 則擅長處理結構化資料(如 CSV 或 Excel 格式),讓資料框(DataFrame)成為分析的核心結構。
以下是一個簡單的 Pandas 和 Numpy 資料分析範例,展示如何讀取 CSV 檔案、進行資料篩選及統計分析:
import pandas as pd
import numpy as np
# 讀取 CSV 資料
data = pd.read_csv('sales_data.csv')
# 檢查資料前五筆內容
print(data.head())
# 篩選出特定年份的資料,例如:2023 年
data_2023 = data[data['Year'] == 2023]
# 使用 Pandas 進行資料彙總:計算各產品在 2023 年的銷售總額
total_sales = data_2023.groupby('Product')['Sales'].sum()
print("2023 年各產品的銷售總額:\n", total_sales)
# 使用 Numpy 進行統計分析:計算銷售額的平均值和標準差
mean_sales = np.mean(total_sales)
std_sales = np.std(total_sales)
print(f"2023 年銷售額的平均值: {mean_sales:.2f}, 標準差: {std_sales:.2f}")
# 使用 Pandas 將結果儲存為新的 CSV 檔案
total_sales.to_csv('total_sales_2023.csv', index=True)
這次的學習讓我更熟悉了 Pandas 與 Numpy 的基本操作,並且理解它們如何在資料分析流程中互補。但如果真的實際應用到課題裡,我可能還是要繼續深入學習,才能將 Pandas 與 Numpy 溶入我的程式中。
那今天就先這樣。