Day 17：Mario Dashboard —— 從資料到洞察的商業應用

2025 iThome 鐵人賽

DAY 17

AI & Data

AI-ction！我的超級瑪莉歐闖關歷險記：用自動化破關，收集時間金幣系列第 17 篇

17th鐵人賽

funai

2025-10-01 23:59:36

187 瀏覽

分享至

在前幾天的冒險中，我們修煉了AI加值的魔法。接下來，我們要進一步：將這些魔法拿來應用在生活中。

想像自己是分析師或產品經理，每月初都要整理上萬筆顧客評論。如果完全手動處理，不僅耗時，也容易出錯。我們的任務目標是：從海量消費者回饋中，依各個面向找出關鍵的強弱項決定性因素，生成每月智慧報表，包含情緒統計、平均評分、正負向文字雲與雷達圖，並產出可立即洞察的報告，讓主管或團隊一眼掌握重點。

核心觀念是：把零散資料透過AI賦能的魔法、加上統計繪圖的視覺化效果，封裝成一條自動化生產線，—— 這就是我們的 Mario Dashboard。

Mario Dashboard 的冒險步驟

Step 1：資料整理與暫存

今天用到的資料集是 Yelp 資料集，它是一個完整的「用戶-商家-評論」生態資料庫，非常適合用來練習資料清理、分析、NLP 與可視化，甚至做自動化月報或商業洞察演練。不過它的資料量驚人，原始資料光是旅遊類就高達90萬筆，這就是我們遇到的第一個挑戰。

我們的解法是先將原始資料將大檔案分塊to_parquet存成 Parquet暫存為雲端，方便後續分批讀取與並行處理，提高記憶體效率與運算速度，同時也避免每次都得從頭讀取原始資料算。

Step 2：情緒分析

這次介紹的是 TextBlob 情緒分類，它是 Python 的簡單自然語言處理工具，能快速進行情緒分析、詞性標註和文字操作。特別適合分析評論或社群貼文的正負向情緒，並能輕鬆整合到資料分析流程中。簡單幾行程式就能抓取文字情緒和關鍵資訊，非常適合 NLP 入門或快速原型開發。

透過統計及分析評論文字的情緒 polarity → 正面、負面、中性，我們能快速提供量化指標，直接反映口碑趨勢，作為報表核心數據。

Step 3：關鍵字抽取