這張 表 是用生活情境模擬的數據,目的:
受試者 | 性別 | 婚姻 | 週購物花費(元) | 月家務時間(小時) | 月社交聚會(次) | 收入等級(1-5) | 年齡 |
---|---|---|---|---|---|---|---|
1 | 男 | 未婚 | 3000 | 22 | 6 | 3 | 28 |
2 | 男 | 已婚 | 3900 | 40 | 2 | 4 | 35 |
3 | 男 | 未婚 | 3200 | 24 | 5 | 3 | 30 |
4 | 男 | 已婚 | 4000 | 45 | 2 | 5 | 38 |
5 | 女 | 未婚 | 2800 | 20 | 5 | 2 | 27 |
6 | 女 | 已婚 | 3700 | 50 | 2 | 4 | 36 |
7 | 女 | 未婚 | 3100 | 23 | 6 | 3 | 29 |
8 | 女 | 已婚 | 3950 | 48 | 2 | 5 | 40 |
… | … | … | … | … | … | … | … |
(其餘樣本依此趨勢延伸至80人:已婚者花費高、家務多、社交少;控制收入、年齡、教育後,婚姻影響仍顯著。)
變項 | 婚姻狀態 | β (模型1a) | SE (模型1a) | p (模型1a) | β (模型2b) | SE (模型2b) | p (模型2b) |
---|---|---|---|---|---|---|---|
男性 | |||||||
每週購物花費 (元) | 已婚 | +620 | 180 | 0.004* | +590 | 175 | 0.005* |
未婚 (參考) | Ref. | — | — | Ref. | — | — | |
每月家務時間 (小時) | 已婚 | +14.5 | 3.2 | 0.001* | +15.2 | 3.0 | 0.001* |
未婚 (參考) | Ref. | — | — | Ref. | — | — | |
每月社交聚會次數 (次) | 已婚 | −2.8 | 0.9 | 0.003* | −3.0 | 0.8 | 0.002* |
未婚 (參考) | Ref. | — | — | Ref. | — | — | |
女性 | |||||||
每週購物花費 (元) | 已婚 | +550 | 160 | 0.006* | +510 | 150 | 0.007* |
未婚 (參考) | Ref. | — | — | Ref. | — | — | |
每月家務時間 (小時) | 已婚 | +17.0 | 4.0 | 0.001* | +16.5 | 3.8 | 0.001* |
未婚 (參考) | Ref. | — | — | Ref. | — | — | |
每月社交聚會次數 (次) | 已婚 | −3.2 | 1.0 | 0.004* | −3.5 | 0.9 | 0.003* |
未婚 (參考) | Ref. | — | — | Ref. | — | — |
縮寫:β=迴歸係數(影響大小),SE=標準誤差,Ref.=參考組,p=顯著性值。
*p < 0.05。
模型1a:只控制年齡。
模型2b:控制年齡、教育、收入、工作時數等干擾因素。
交叉分析(只比較兩組):
婚姻狀態 | 平均每週購物花費 (元) |
---|---|
已婚 | 3,850 |
未婚 | 3,200 |
👉 乍看以為已婚花得多,但這可能是因為已婚者收入較高。
多元迴歸(公平比較):
每週購物花費 = 2,000 + 590 × (已婚=1) + 150 × (收入等級) + 100 × (教育年數)
💡 白話:把收入、教育控制後,已婚者每週仍多花590元。
➡️ 結論:婚姻本身會影響消費習慣。
交叉分析:
婚姻狀態 | 每月家務時間 (小時) |
---|---|
已婚 | 46 |
未婚 | 26 |
👉 表面看已婚者家務較多,但可能只是因為他們工作時間較短。
多元迴歸:
每月家務時間 = 10 + 15.2 × (已婚=1) − 0.5 × (每週工時) + 8 × (有小孩=1)
💡 白話:扣掉工作時數和小孩後,已婚者每月仍多15.2小時家務。
➡️ 結論:婚姻本身增加了家庭責任。
交叉分析:
婚姻狀態 | 每月社交聚會次數 |
---|---|
已婚 | 2 |
未婚 | 5 |
👉 未婚者看起來社交更頻繁,但可能只是因為年齡偏小。
多元迴歸:
每月社交聚會次數 = 1 − 3.0 × (已婚=1) − 0.1 × (年齡) + 0.05 × (收入等級)
💡 白話:控制年齡和收入後,已婚者每月仍少3次聚會。
➡️ 結論:婚姻本身讓社交活動減少,而不只是年齡差異。
方法 | 說明 | 優缺點 |
---|---|---|
交叉分析 | 就像直接比兩組平均數,快但容易被其他因素干擾。 | ✅ 簡單直觀;❌ 可能誤判。 |
多元迴歸 | 像「公平比賽」,把收入、年齡等影響排除再比較。 | ✅ 公平準確;❌ 較複雜。 |
💡 核心想法:
在迴歸分析中,「Ref.」代表 Reference group(參考組)。
把 未婚 設為參考組,是一種編碼習慣,目的是讓比較更清楚。以下用最簡單的方式說明:
🔎 為什麼要有參考組
多元迴歸需要把類別變項(如「婚姻狀態」)轉成數字。
如果「婚姻狀態」有兩種:未婚、已婚,系統不能直接處理文字,所以我們:
指定一組為基準(Ref.) → 常選樣本數較多或較「中性」的一組。
另一組變成比較對象 → β 就是「比基準組多或少多少」。
☕ 生活化例子
想像你要比較兩家咖啡店的價格:
你先選 A店 當基準(Ref.),把 A店 的價格當作「0」。
B店 貴 20 元,β=+20。
如果反過來選 B店 當基準,A店 就變成 β=−20。
➡️ 選哪個當Ref.不影響結論,只是換比較方向。
📋 婚姻狀態例子
婚姻狀態 編碼方式 (未婚=Ref.) 說明
未婚 0 當基準,不需計算β
已婚 1 與未婚比較,β=+590 → 每週多花590元
💡 白話:β=+590 代表:
已婚 的購物花費 − 未婚 的購物花費 ≈ 590 元。
如果改用已婚為 Ref.:
婚姻狀態 編碼方式 (已婚=Ref.) β值解讀
已婚 0 當基準
未婚 1 β=−590 → 未婚比已婚少590元
結果相同,只是符號相反。
✅ 總結(0基礎理解)
Ref.(參考組) 是比較的起點,不代表特別重要。
常用 未婚 當 Ref.,因為:
多數研究習慣用「變化後的狀態」與「原狀態」比較 → 已婚通常被視為「改變」。
未婚樣本數往往較多,當基準更穩定。
無論選誰當 Ref.,結果解釋相同,只是數字方向相反。