今天要來講在Pandas自訂資料index索引值,
那麼直接來看範例吧。
首先,先建立一個DataFrame
結構的資料,
或是有匯入的資料轉成DataFrame結構也行。
這邊為了方便對照,先印出完整的資料來看。
studentsData = {
'studentId': ['001', '002', '003'],
'Name': ['A', 'B', 'C'],
'Height': [175, 153, 164],
'Weight': [80, 45, 75],
'City': ['New York', 'Los Angeles', 'Chicago']
}
students = pd.DataFrame(studentsData)
print(students)
印出資料如下,
可以看到系統已自動將資料預設index數值0、1、2。
studentId Name Height Weight City
0 001 A 175 80 New York
1 002 B 153 45 Los Angeles
2 003 C 164 75 Chicago
在自訂index索引值時
可以是字串,
也可以是數字,
甚至是混用都沒問題,
這裡強烈不建議混用型別在index上,
因為在做資料排序或是處裡時反而容易遇到困難,
在識別時也不好維護。
首先做字串的index索引值,
這裡順序刻意將順序打亂。
students.index = ["id3", "id1", "id2"]
print(students)
印出資料如下。
可以看到資料順序不變,
僅有index索引值被改為自訂的。
studentId Name Height Weight City
id3 001 A 175 80 New York
id1 002 B 153 45 Los Angeles
id2 003 C 164 75 Chicago
接著做數字的index索引值,
這裡順序刻意將順序打亂。
students.index = [2, 0, 1]
print(students)
印出資料如下。
可以看到資料順序不變,
僅有index索引值被改為自訂的。
studentId Name Height Weight City
2 001 A 175 80 New York
0 002 B 153 45 Los Angeles
1 003 C 164 75 Chicago
今天教大家自訂index索引值是為了之後排序會用到,
另外這裡呼籲大家,
在自訂index索引值時千萬不要隨便命名喔。