iT邦幫忙

2024 iThome 鐵人賽

DAY 14
0
自我挑戰組

R語言初學紀錄系列 第 14

DAY14-R語言 資料處理part.3

  • 分享至 

  • xImage
  •  

前言:資料處理的最後一篇了,今天要講的是資料組合、缺漏值處理~~如果內容有哪些錯誤的地方,請多多包涵~


正文開始-->
【資料組合】
當處理像資料框的資料時,有時候會新增刪減欄位、資料。方法如下

  1. cbind()
  2. rbind()

使用範例:
https://ithelp.ithome.com.tw/upload/images/20240917/20169228BYjLMmmGaD.png

  • cbind():增加行資料。
  • rbind():增加列資料。

也可以將兩個資料框做合併,主要使用merge()函數。
https://ithelp.ithome.com.tw/upload/images/20240917/20169228KUF16v066C.png

  • merge()函數主要寫法為merge(資料框1,資料框2,by="結合依據欄位")。會依據結合依據欄位做資料合併,但如果希望將所有資料作合併,可以在最後加上參數all,all.x或是all.y,來保留沒對應到的資料列。

【遺漏值處理】

  • 遺漏值處理的範疇為資料預處理,又稱為資料清洗。因為如果沒有正確的資料,可能會導致後來的分析或式運算出現很大的偏誤。
  • 遺漏值(Missing Value)是當出現在真實資料時,會導致進行數值運算的時候產生問題,最簡單的方法是將有遺漏值的資料移除。
  • 在R語言中,遺漏值會被表現成NA(not available)。可以使用is.na()函式來判斷資料是否存在空值NA,若為真TRUE,則將資料移除。
    使用範例:
    https://ithelp.ithome.com.tw/upload/images/20240917/20169228DqPja9GPmH.png
    • is.na():檢查資料是否有NA。
    • naVec[!is.na()]:回傳檢查為FALSE的元素。
    • sum(is.na()):計算遺漏值個數。

參考:

  1. https://yijutseng.github.io/DataScienceRBook/manipulation.html#%E8%B3%87%E6%96%99%E7%B5%84%E5%90%88
  2. https://rpubs.com/skydome20/R-Note10-Missing_Value

上一篇
DAY13-R語言 資料處理part.2
下一篇
DAY15-R語言 條件判斷與邏輯操作part.1
系列文
R語言初學紀錄22
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言