iT邦幫忙

2021 iThome 鐵人賽

DAY 23
0
影片教學

R語言-分群(clustering)的實戰應用系列 第 23

[Day-23] R語言 - 分群應用(四) 建構新特徵 ( generate feature by clustering in R.Studio )

您的訂閱是我製作影片的動力
訂閱點這裡~/images/emoticon/emoticon39.gif

影片程式碼

## 應用四: 建構特徵 ####

# 用GMM,產出數值+類別型特徵
library(naniar)
data(iris)
any_na(iris) #前置1: chk NA
iris <- iris[,-5]
iris <- scale(iris) #前置2: standard norm 標準化

library(ClusterR)
gmm = GMM(iris, 4, dist_mode = "eucl_dist", em_iter = 10)  # EM調參  
gmm_out <- as.data.frame(gmm$Log_likelihood) #大好
final <- cbind(iris,gmm_out)

library(dplyr)
final <- final %>% 
  mutate(最大=pmax(V1,V2,V3,V4)) %>% 
  mutate(分群=ifelse(最大==V1,"c1",
              ifelse(最大==V2,"c2",
              ifelse(最大==V3,"c3","c4"))))

若內容有誤,還請留言指正,謝謝您的指教/images/emoticon/emoticon07.gif


上一篇
[Day-22] R語言 - 分群應用(三) 相異點偵測 ( detect dissimilar point by clustering in R.Studio )
下一篇
[Day-24] R語言 - 分群應用(五) 分群預測 - 取得真實資料集&說明 ( real data from UCI )
系列文
R語言-分群(clustering)的實戰應用30

尚未有邦友留言

立即登入留言