iT邦幫忙

2025 iThome 鐵人賽

DAY 5
2

婚姻狀態與生活行為:多元迴歸與交叉分析比較

📜 前言與表格設計原因

這張 是用生活情境模擬的數據,目的:

  • 了解「婚姻狀態」(已婚 vs. 未婚)對購物花費、家務時間、社交次數等行為的影響。
  • β(迴歸係數):影響大小(正數=增加,負數=減少)。
  • SE(標準誤差):估計穩不穩定。
  • p(顯著性值):檢驗差異是否真的存在。
  • Ref.(參考組):未婚是基準,用來比較已婚者。

🧾 原始模擬數據(樣本量共80人)

受試者 性別 婚姻 週購物花費(元) 月家務時間(小時) 月社交聚會(次) 收入等級(1-5) 年齡
1 未婚 3000 22 6 3 28
2 已婚 3900 40 2 4 35
3 未婚 3200 24 5 3 30
4 已婚 4000 45 2 5 38
5 未婚 2800 20 5 2 27
6 已婚 3700 50 2 4 36
7 未婚 3100 23 6 3 29
8 已婚 3950 48 2 5 40

(其餘樣本依此趨勢延伸至80人:已婚者花費高、家務多、社交少;控制收入、年齡、教育後,婚姻影響仍顯著。)


📊 表. 婚姻狀態與生活行為的多元迴歸分析(控制干擾因素後)

變項 婚姻狀態 β (模型1a) SE (模型1a) p (模型1a) β (模型2b) SE (模型2b) p (模型2b)
男性
每週購物花費 (元) 已婚 +620 180 0.004* +590 175 0.005*
未婚 (參考) Ref. Ref.
每月家務時間 (小時) 已婚 +14.5 3.2 0.001* +15.2 3.0 0.001*
未婚 (參考) Ref. Ref.
每月社交聚會次數 (次) 已婚 −2.8 0.9 0.003* −3.0 0.8 0.002*
未婚 (參考) Ref. Ref.
女性
每週購物花費 (元) 已婚 +550 160 0.006* +510 150 0.007*
未婚 (參考) Ref. Ref.
每月家務時間 (小時) 已婚 +17.0 4.0 0.001* +16.5 3.8 0.001*
未婚 (參考) Ref. Ref.
每月社交聚會次數 (次) 已婚 −3.2 1.0 0.004* −3.5 0.9 0.003*
未婚 (參考) Ref. Ref.

縮寫:β=迴歸係數(影響大小),SE=標準誤差,Ref.=參考組,p=顯著性值。
*p < 0.05。
模型1a:只控制年齡。
模型2b:控制年齡、教育、收入、工作時數等干擾因素。


🧩 案例解釋:同一題目,不同角度

🌟 案例一:購物花費差異 —— 經濟角度

  • 交叉分析(只比較兩組):

    婚姻狀態 平均每週購物花費 (元)
    已婚 3,850
    未婚 3,200

    👉 乍看以為已婚花得多,但這可能是因為已婚者收入較高。

  • 多元迴歸(公平比較):

    每週購物花費 = 2,000 + 590 × (已婚=1) + 150 × (收入等級) + 100 × (教育年數)
    💡 白話:把收入、教育控制後,已婚者每週仍多花590元
    ➡️ 結論:婚姻本身會影響消費習慣。


🌟 案例二:家務時間分配 —— 家庭角色角度

  • 交叉分析

    婚姻狀態 每月家務時間 (小時)
    已婚 46
    未婚 26

    👉 表面看已婚者家務較多,但可能只是因為他們工作時間較短。

  • 多元迴歸

    每月家務時間 = 10 + 15.2 × (已婚=1) − 0.5 × (每週工時) + 8 × (有小孩=1)
    💡 白話:扣掉工作時數和小孩後,已婚者每月仍多15.2小時家務
    ➡️ 結論:婚姻本身增加了家庭責任。


🌟 案例三:社交聚會頻率 —— 社交行為角度

  • 交叉分析

    婚姻狀態 每月社交聚會次數
    已婚 2
    未婚 5

    👉 未婚者看起來社交更頻繁,但可能只是因為年齡偏小。

  • 多元迴歸

    每月社交聚會次數 = 1 − 3.0 × (已婚=1) − 0.1 × (年齡) + 0.05 × (收入等級)
    💡 白話:控制年齡和收入後,已婚者每月仍少3次聚會
    ➡️ 結論:婚姻本身讓社交活動減少,而不只是年齡差異。


✅ 總結(0基礎理解)

方法 說明 優缺點
交叉分析 就像直接比兩組平均數,快但容易被其他因素干擾。 ✅ 簡單直觀;❌ 可能誤判。
多元迴歸 像「公平比賽」,把收入、年齡等影響排除再比較。 ✅ 公平準確;❌ 較複雜。

💡 核心想法

  • 三個案例都是同一題目:婚姻與生活習慣,只是從不同角度切入。
  • 經濟角度 → 看消費差異。
  • 家庭角色角度 → 看家務分工。
  • 社交行為角度 → 看聚會頻率。
  • 表格這樣設計,是為了用 β、SE、p 讓我們「更公平」地判斷婚姻本身的影響,而不是被其他因素誤導。

在迴歸分析中,「Ref.」代表 Reference group(參考組)。
把 未婚 設為參考組,是一種編碼習慣,目的是讓比較更清楚。以下用最簡單的方式說明:


🔎 為什麼要有參考組

多元迴歸需要把類別變項(如「婚姻狀態」)轉成數字。

如果「婚姻狀態」有兩種:未婚、已婚,系統不能直接處理文字,所以我們:

  1. 指定一組為基準(Ref.) → 常選樣本數較多或較「中性」的一組。

  2. 另一組變成比較對象 → β 就是「比基準組多或少多少」。


☕ 生活化例子

想像你要比較兩家咖啡店的價格:

你先選 A店 當基準(Ref.),把 A店 的價格當作「0」。

B店 貴 20 元,β=+20。

如果反過來選 B店 當基準,A店 就變成 β=−20。
➡️ 選哪個當Ref.不影響結論,只是換比較方向。


📋 婚姻狀態例子

婚姻狀態 編碼方式 (未婚=Ref.) 說明

未婚 0 當基準,不需計算β
已婚 1 與未婚比較,β=+590 → 每週多花590元

💡 白話:β=+590 代表:

已婚 的購物花費 − 未婚 的購物花費 ≈ 590 元。

如果改用已婚為 Ref.:

婚姻狀態 編碼方式 (已婚=Ref.) β值解讀

已婚 0 當基準
未婚 1 β=−590 → 未婚比已婚少590元

結果相同,只是符號相反。


✅ 總結(0基礎理解)

Ref.(參考組) 是比較的起點,不代表特別重要。

常用 未婚 當 Ref.,因為:

  1. 多數研究習慣用「變化後的狀態」與「原狀態」比較 → 已婚通常被視為「改變」。

  2. 未婚樣本數往往較多,當基準更穩定。

無論選誰當 Ref.,結果解釋相同,只是數字方向相反。


上一篇
從咖啡香到數據圖:用描述統計看懂日照咖啡廳的故事
下一篇
從日常生活看懂交叉分析與多元迴歸
系列文
AI 與統計在醫療與長照的應用:連結教育、收入、婚姻與居住,建構健康與照護決策支持11
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言