在上一篇將問卷的資料置換成問卷的內容也算是資料清理的一種,接下來來瞭解這個組織,對知識管理資訊系統使用者背景的了解
一、這個組織年齡和性別有多少比例?主要看年齡及對操作知識管理系統使用者的了解
ggplot(data = Base,mapping = aes(x=Sex,fill=Age))+
geom_bar()
percent(prop.table(table(Base$Sex,Base$Age)))
從統計圖來看該組織女生的人數較多,而年齡的分佈在男生和女生都很平均,我的測資亂數做的太平均了。
二、該組織的教育程度如何?觀察使用者對於知識管理資訊系統基本認知
ggplot(data = Base,mapping = aes(x=Education,fill=Sex)) +
geom_bar()
percent(prop.table(table(Base$Sex,Base$Education)))
該組織教育程度不錯,男生和女生加起來擁有博士學位有22.8%,從這邊的推論對於系統操作認知應該不差。
三、觀察教育程度和和年齡的關係?
ggplot(data = Base) +
geom_bar(mapping = aes(x=Education,fill=Age),position="dodge")
percent(prop.table(table(Base$Age,Base$Education)))
統計圖中可以觀察到高中職的年齡41-50歲居多,而博士年齡在21-30居多,從統計表來看年齡及教育程度來看分佈還是很平均,除了博士和高中職資料較為突出。
四、觀察使用者使用電腦的次數?主要了解對電腦操作的熟悉度
ggplot(data = Base)+
geom_bar(mapping = aes(x=UseComputer))
從統計圖來看從未使用電腦有40人,換言之,約200多人對於電腦的使用並不陌生。
五、有使用知識管理資訊系統經驗及單位是否有知識系統之間的關係
ggplot(data = Base)+
geom_bar(mapping = aes(x=KnowledgeSys,fill=UseSysExperience),position="dodge")
若是你是一位教授,其實這張圖就可以看到有問題了,目前單位無知識系統卻有使用知識系統的經驗,顯而易見,這一區塊是無效問卷,必須將這些資料剔除並將前面的統計圖在執行一次,取得的正確統計。
而在剔除的部分以實際的問卷是將該施測者的問卷整份抽出,換言之,在資料集中就是將整筆資料刪除,而刪除的程式如下
Base.sub <- grep("目前單位無知識管理系統",Base$KnowledgeSys)
View(Base.sub)
Base <- Base[-Base.sub,]
接著使用str(Base)看資料筆數,刪除後資料筆數為169筆資料,相對前面的統計需重新執行一次並重新解釋統計完後的資料。