從日常生活看懂交叉分析與多元迴歸
在統計課上看到「交叉分析」和「多元迴歸」時,很多人第一反應是「這是研究人員的專利吧?」其實,這些方法每天都默默出現在我們的生活選擇中。以下用幾個貼近生活的故事來說明。
1️⃣ 交叉分析:像在看不同群體的「喜好地圖」
定義:交叉分析是用來檢視兩個類別變項的交互關係。
📦 生活例子:超商咖啡 vs. 性別與年齡層
假設一家超商想知道不同性別與年齡層對「冰美式」和「熱拿鐵」的偏好:
20–29歲 | 30–39歲 | 40–49歲 | |
---|---|---|---|
男性 | 冰美式:120人熱拿鐵:80人 | 冰美式:90人熱拿鐵:110人 | 冰美式:60人熱拿鐵:140人 |
女性 | 冰美式:100人熱拿鐵:150人 | 冰美式:70人熱拿鐵:180人 | 冰美式:50人熱拿鐵:200人 |
解讀:
年輕男性明顯更愛冰美式(120 vs. 80)。
40–49歲女性幾乎是熱拿鐵鐵粉(200 vs. 50)。
用交叉分析,店家可調整廣告:如針對年輕男性推冰飲優惠,針對熟女族群推溫暖拿鐵。
🛒 再舉一個例子:網購時段 vs. 職業
上班族 vs. 學生:上班族大多在晚上 8–10 點下單,學生在凌晨 12 點最活躍。
交叉分析幫助電商決定何時推出限時折扣。
2️⃣ 多元迴歸分析:像拼圖一樣控制多個因素
定義:多元迴歸用來探討多個自變項對一個連續依變項的影響。
🏠 生活例子:房租價格的背後秘密
想研究「房租(元/月)」受哪些因素影響,我們可以把 房租 當作「依變項」,並同時考慮:
自變項 A:距捷運站距離(公里)
自變項 B:屋齡(年)
自變項 C:是否有電梯(是=1,否=0)
假設經過分析後得到一條多元迴歸方程式:
房租 = 25,000 − 2,000 × (距離) − 150 × (屋齡) + 3,000 × (電梯)
解讀:
距離 每遠 1 公里,房租大約少 2,000 元。
屋齡 每多 1 年,房租平均少 150 元。
有 電梯 的房子,房租平均高出 3,000 元。
這種控制多因素的分析,比單純只看距離更接近現實。
🍕 另一個例子:餐廳評分
假設我們研究 Google 評分(1–5 分)受到哪些因素影響:
平均消費金額(元)
用餐等待時間(分鐘)
是否提供免費 Wi-Fi(1=是,0=否)
分析結果:
評分 = 3.0 + 0.0008 × (消費金額) − 0.03 × (等待時間) + 0.5 × (Wi-Fi)
解讀:
消費金額每多 100 元,評分平均提高 0.08 分。
等待時間每多 10 分鐘,評分降低 0.3 分。
有免費 Wi-Fi 的餐廳,評分平均高出 0.5 分。
3️⃣ 小結:從數據中找到「隱藏規則」
交叉分析:幫我們快速發現「誰喜歡什麼」,例如性別與購物品項、年齡層與支付方式。
多元迴歸分析:幫助理解「影響有多大」,像房租、餐廳評分或商品價格,通常不只一個因素決定。
生活中,當你在想「是不是這兩件事有關?」或「到底是哪些原因在影響結果?」時,其實就在用這兩種統計工具的思維。懂得運用它們,不只能做研究,還能在購物、租房、經營事業時,做出更有根據的決策。