iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 2
0
自我挑戰組

資料處理以及視覺化系列 第 2

R語言-第二天的鐵達尼 - 基本資訊Q1

  • 分享至 

  • xImage
  •  

延續前日 , 一開始拿到這份資料對於我來說 , 我會想先知道這份資料的一些基本資訊

Q1 : 參加此遊輪的人是不是有錢人比較多呢?
Q2 : 參加的男生還是女生比較多
Q3 : 平均票價是多少錢呢?

A1 : 這個問題我們可以藉由Pclass 社會經濟地位等級來理解一下

該如何快速統計社會經濟地位這個欄位呢?

我們可以先試著使用 which() 來做統計

#先確認社經地位的種類
unique(raw$Pclass)

length(which(raw$Pclass == 1))
length(which(raw$Pclass == 2))
length(which(raw$Pclass == 3))

> unique(raw$Pclass)
[1] 3 1 2
> 
> length(which(raw$Pclass == 1))
[1] 216
> length(which(raw$Pclass == 2))
[1] 184
> length(which(raw$Pclass == 3))
[1] 491

可以發現 , 社經地位在等級2的人竟然是最少的! 這是個挺有趣的發現!


上一篇
R語言-第一天的鐵達尼
下一篇
R語言-第三天的鐵達尼 - 基本資訊Q1
系列文
資料處理以及視覺化30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言