今天同樣也是要講解concat合併的應用,
主要針對DataFrame
結構的資料來做合併。
同樣也會運用到昨天的知識,
不清楚的話還是可以回上一篇看看。
這裡簡單建立兩個DataFrame
結構的資料,
這裡刻意讓資料欄位不一致,
兩個欄位差異在City欄位的有無。
studentsData1 = {
'studentId': ['001', '002', '003'],
'Name': ['A', 'B', 'C'],
'City': ['New York', 'Los Angeles', 'Chicago']
}
studentsData2 = {
'studentId': ['004', '005', '006'],
'Name': ['D', 'E', 'F'],
}
students1 = pd.DataFrame(studentsData1)
students2 = pd.DataFrame(studentsData2)
print(students1)
print(students2)
印出資料如下。
students1資料
studentId Name City
0 001 A New York
1 002 B Los Angeles
2 003 C Chicago
students2資料
studentId Name
0 004 D
1 005 E
2 006 F
DataFrame
結構資料的合併方式與Series
結構資料相同,
複習一下,
語法pd.concat([資料1, 資料2], ignore_index=True)
,
將資料1及資料2做合併,
並將index數值重新排序,
使用方式如下。
students = pd.concat([students1, students2], ignore_index=True)
print(students)
印出資料如下。
這裡要注意的是資料欄位就算沒有對齊,
仍然可以做合併,
而沒有的欄位資料則會掛上NaN(Not a Number)。
studentId Name City
0 001 A New York
1 002 B Los Angeles
2 003 C Chicago
3 004 D NaN
4 005 E NaN
5 006 F NaN
今天進一步的使用DataFrame
結構的資料來做合併,
可以看出欄位在合併上是具有彈性的,
如此一來便可將不同的資料做合併後再統一做資料處理,
以利後續的資料分析。