iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 19
0
自我挑戰組

使用R進行探索式資料分析之初探系列 第 19

用R寫論文_信度分析

  • 分享至 

  • xImage
  •  

上一篇是論文的基本分析就是將問卷發放後,觀察填寫問卷者的背景,而本篇介紹的為問卷的信度,也就是這一份問卷經多人填寫完後,問卷的結果可信度是如何?而信度分析若發放問卷,都一定會做,像我們的總統大選都會做問卷調查,調查完後一定做信度分析。

而甚麼是信度分析所謂信度是衡量沒有誤差的程度,也是測驗結果的一致性(consistency)程度,信度是以衡量的變異理論為基礎。

為什麼會有誤差,因為發放問卷填寫者會受到以下影響,第3項和第4項是可控制,而第一項和第二項是較難控制,因此需進行信度分析,以了解此份問卷的結果是否可相信。

1.由回應者(respondent)產生的誤差

2.由情境因素產生的誤差

3.由衡量者產生的誤差

4.由衡量工具產生的誤差

信度分析衡量包含了再測信度、折半信度、複本信度、庫李信度等,一般問卷都會採用庫李信度,也就是內部一致性,每一個問項的可信度。

上面概略解釋所謂的信度分析,看起來似乎有點複雜,但在R做信度分析尤其是內部一致性是很簡單,甚至比在做探索性分析還簡單。

首先我依然採用網路的資料集來,而這次下載資料集的方法有點不一樣,先建立暫存變數(存放),使用download.file()下載,在將資料讀進R,程式法如下

temp <- tempfile()
download.file("http://personality-testing.info/_rawdata/BIG5.zip", temp, mode="wb")
d <- read.table(unz(temp, "BIG5/data.csv"), header = TRUE, sep="\t")
unlink(temp); rm(temp)

str(d)
View(d)

https://ithelp.ithome.com.tw/upload/images/20200919/20120756V8IiBAnANj.png

該資料集共有19719筆資料換言之有19719人填寫問卷,共有57個變數,在看該資料集的內容如下
https://ithelp.ithome.com.tw/upload/images/20200919/201207566RQTsj3akU.png

每筆資料就是一位填寫問卷的人,變數就是問題本身,跟前面的問卷基本分析紀錄資料的方式一樣,但對於本次57個變數太多了,我們只要E1-E10的變數,及前500名的參與者,而這份問卷主要調查個性是否外向,問項列表如下
這是人們對等級從1 =不同意到5 =同意的外向性項目的列表:

E1我是聚會的一生。
E2我沒說很多。
E3我周圍的人感覺很舒服。
E4我一直在後台。
E5我開始對話。
E6我無話可說。
E7我在聚會上與許多不同的人交談。
E8我不喜歡引起我的注意。
E9我不介意成為關注的焦點。
E10我在陌生人周圍安靜。
取前500名參與者以及E1-E10變數,程式如下

d <- d[1:500, paste0("E", 1:10)]
str(d)

https://ithelp.ithome.com.tw/upload/images/20200919/201207566XanmO5wIG.png

由於(E2,E4,E6,E8,E10)為測謊題,需進行以下操作(測謊題的計算可上網了解),程式如下

d[, paste0("E", c(2, 4, 6, 8, 10))] <- 6 - d[, paste0("E", c(2, 4, 6, 8, 10))]

首先將套件載入,扣除套件的程式只需兩行,其嚴格來說只需第三行即可算出,如下

library(psych)
library(dplyr)

psych::alpha(d,check.keys = TRUE)
psych::alpha(d,check.keys = TRUE)$total$std.alpha

在Console會跑出一堆資料,其時只需看紅框的部分,內部一致性的值要大於0.7,由上至下來看,第一個紅框告你10個變數均有0.9,第二個紅框是每個問項的內部一致性大部分為0.89,所以從檢定的數值來看該份問卷的信度分析總體檢訂為0.9,每個問項均有0.89其中E6為9.0,因此該份問卷可信度符合內部一致性檢定。

https://ithelp.ithome.com.tw/upload/images/20200919/20120756QgdrmAk2yZ.png

當然在此份問卷內部一致性設為0.7,而在一些論文中也看過設0.5是最低,而你要設多少可能要跟你的指導教授討論,但最低值就是0.5,若是一般商業問卷依據自行的情況設定,相對標準值設愈高,問卷的可信度就愈高。


上一篇
用R寫論文_進入資料分析階段
下一篇
老媽說最近蒜頭很貴_用R了解一下
系列文
使用R進行探索式資料分析之初探30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言