iT邦幫忙

2021 iThome 鐵人賽

DAY 25
0
影片教學

R語言-分群(clustering)的實戰應用系列 第 25

[Day-25] R語言 - 分群應用(五) 分群預測 - 資料清洗 ( data cleaning in R.Studio )

您的訂閱是我製作影片的動力
訂閱點這裡~/images/emoticon/emoticon39.gif

Yes

影片程式碼(延續昨天)

#步驟一: na補值&相異點or離群值偵測
library(naniar)#前置1: chk NA
library(clustMixType)
any_na(data) 
data_num <- data[,c(6,13:24)]
data_num <- as.data.frame(scale(data_num)) #前置2: standard norm 標準化
data_cla <- data[,c(2:5,7:12)]
data_cla <- lapply(data_cla, factor)
data_use <- cbind(data_num,data_cla)
kp <- kproto(data_use, 10)
kp_out <- as.data.frame(kp$cluster) #大好
final <- cbind(data,kp_out)

out <- final %>% 
  group_by(`kp$cluster`) %>% 
  summarise(筆數=n())

done <- final %>% 
  subset(`kp$cluster`!=10&`kp$cluster`!=6) 

若內容有誤,還請留言指正,謝謝您的指教/images/emoticon/emoticon07.gif


上一篇
[Day-24] R語言 - 分群應用(五) 分群預測 - 取得真實資料集&說明 ( real data from UCI )
下一篇
[Day-26] R語言 - 分群應用(五) 分群預測 - 資料分群 ( data clustering in R.Studio )
系列文
R語言-分群(clustering)的實戰應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言