iT邦幫忙

2022 iThome 鐵人賽

DAY 18
0
AI & Data

先別急著學 Python | The Secret to Success in Python系列 第 18

Ɖ18-溫沙拉/ 簡單樞紐分析與快速分析式輸出

  • 分享至 

  • xImage
  •  

溫沙拉 Salade Tiede

溫沙拉起源於法語"Salade Tiede",溫沙拉就是所謂的溫熱吃的沙拉,以溫熱的醬汁搭配熟成後的肉類蔬食來搭配生菜烹調。與一般沙拉不同的地方在於,溫沙拉的本質並未從沙拉做改變,而是在既有的內容上做更多的調理,在原先單調的味覺中,帶來更多色彩。溫沙拉章節主要要說明的是樞紐分析表 Pivot_Table,代表著我們在原先的資料集上做了更多元的分析。

快速分析式 Quick Data Analysis with Pandas

這篇文章的目的是讓你對一些交互式的 python 工具有一個基本了解,以及你如何使用這些工具以一種非常快速和可重複的方式進行一些複雜的分析。我計劃花時間說明這樣的例子,以顯示這個工具集有多麼有用,並繼續讓人們知道,當涉及到復雜的數據分析時,除了 Excel 外 Python 也是一個選擇。我們將銷售資料匯入進行樞紐分析,再將樞紐分析結果匯回 Excel 檔案。

dt=pd.read_csv("data/df-sample-sales.csv")
dt.head()

https://ithelp.ithome.com.tw/upload/images/20221002/20140740IHjzppmCqN.png

快速分析 describe()

實際上,我們可以從 describe 命令中了解到一些相當有用的信息。

  • 我們可以知道,客戶平均每筆交易購買了 10.56 件物品
  • 交易的平均成本是 570.17 美元
  • 以及了解最小和最大值數據的範圍
dt.describe()

https://ithelp.ithome.com.tw/upload/images/20221002/20140740qWMNmLQARh.png

Pivot_Table 樞紐分析

Pandas在處理大量數據並將其總結為多種文本和視覺表現形式方面非常出色。不費吹灰之力 Pandas 就支持輸出到CSV、Excel、HTML、json等不同格式了。之前關於 Pandas 數據透視表的文章和關於表格生成 Excel 報告的文章。它們解釋了使用的數據集以及如何使用數據透視表。

report = dt.pivot_table(index=['Account Name'],  # Rows
                        columns=['category'],    # Cols
                        values=['quantity'],     # Values
                        fill_value=0,            # fill NaN To 0
                        aggfunc=np.sum)          # Values summarize by SUM
report.head(10)

https://ithelp.ithome.com.tw/upload/images/20221002/20140740cAjVIYA3Qq.png

根據我們的需求我們能夠選擇我們想要進行的 Rows 與 Cols 數據,這些數據我們可以決定要怎麼進行調整或是 fill_value。

report = dt.pivot_table(index=['Account Name'],
                           columns=['category'], 
                           values=['ext price','quantity'],
                           fill_value=0,
                           aggfunc=np.sum)
report.head()

https://ithelp.ithome.com.tw/upload/images/20221002/20140740cFr1Wk1onY.png

輸出表格 report

或者是說我們可以將它輸出表格為報表,利用 .to_excel() 的方式,都要找到方法來處理,由此方法我們可以把預期的內容給輸出出來。

report.to_excel('data/df-sample-sales-out.xlsx', sheet_name='Sheet1')

謝謝大家的觀看,但歷史的痕跡會持續下去

今年沒組團,每一筆一字矢志不渝的獻身精神都是為歷史書寫下新頁,有空的話可以走走逛逛我們去年寫的文章。


Hi'Jerry均

Jerry 據說是個僅佔人口的 4% 人口的 INFP 理想主義者,總是從最壞的生活中尋找最好的一面,想方設法讓世界更好,內心的火焰和熱情可以光芒四射,畢業後把人生暫停了半年,緩下腳步的同時找了份跨領域工作。偶而散步、愛跟小動物玩耍。曾立過很多志,最近是希望當一個有夢想的人。

謝謝你的時間「訂閱,追蹤和留言」都是陪伴我走過 30 天鐵人賽的精神糧食。


上一篇
Ɖ17-香料/ Excel 的進階尋找過濾
下一篇
Ɖ19-溫沙拉/ Excel 試算表上的簡單樞紐分析
系列文
先別急著學 Python | The Secret to Success in Python30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言