延續前日 , 一開始拿到這份資料對於我來說 , 我會想先知道這份資料的一些基本資訊
Q1 : 參加此遊輪的人是不是有錢人比較多呢?
Q2 : 參加的男生還是女生比較多
Q3 : 平均票價是多少錢呢?
A1 : 這個問題我們可以藉由Pclass 社會經濟地位等級來理解一下
該如何快速統計社會經濟地位這個欄位呢?
我們可以先試著使用 which() 來做統計
#先確認社經地位的種類
unique(raw$Pclass)
length(which(raw$Pclass == 1))
length(which(raw$Pclass == 2))
length(which(raw$Pclass == 3))
> unique(raw$Pclass)
[1] 3 1 2
>
> length(which(raw$Pclass == 1))
[1] 216
> length(which(raw$Pclass == 2))
[1] 184
> length(which(raw$Pclass == 3))
[1] 491
可以發現 , 社經地位在等級2的人竟然是最少的! 這是個挺有趣的發現!