今天讓我們來學習pandas中另外一個部分DataFrame吧。
DataFame:是一個二維的資料結構,每個欄位可以是不同的資料型態。建立DataFrame可以透過list也可以透過dict來建立,又或著是可以透過之前學過的numpy來建立。
以下介紹一些有關DataFrame的用法
>>> data = {'student':['a','a','b','b','c','c'],
>>> 'course':['Eng','math','Eng','math','Eng','math'],
>>> 'score':['87','45','63','75','86','95'] }
>>> dataframe = pd.DataFrame(data)
student course score
0 a Eng 87
1 a math 45
2 b Eng 63
3 b math 75
4 c Eng 86
5 c math 95
印出前後五筆資料
>>> dataframe.head() #印出前五筆資料
>>> dataframe.tail() #印出後五筆資料
印出course欄位
>>> print(dataframe.course)
0 Eng
1 math
2 Eng
3 math
4 Eng
5 math
Name: course, dtype: object
將data新增一個column,並將index改為a,b,c,d,e,f
>>>dataframe2 = pd.DataFrame(data,columns=['student','course','score','de'],
>>>index=['a','b','c','d','e','f'])
>>>print(dataframe2)
student course score de
a a Eng 87 NaN
b a math 45 NaN
c b Eng 63 NaN
d b math 75 NaN
e c Eng 86 NaN
f c math 95 NaN
透過loc擷取特定索引
>>> print(dataframe2.loc['b'])
student a
course math
score 45
de NaN
Name: b, dtype: object
加入一行與刪除一行
dataframe['apple'] = 'None' #加入一行
del dataframe['apple'] #刪除一行
加入一列與刪除一列
>>> dataframe2 = dataframe2.drop(['d']) #刪除d列
>>> dataframe2.loc['g'] = ['d','math','86','NaN'] #透過loc加入g列
>>> print(dataframe2)
student course score de
a a Eng 87 NaN
b a math 45 NaN
c b Eng 63 NaN
e c Eng 86 NaN
f c math 95 NaN
g d math 86 NaN
---20230921---