iT邦幫忙

2023 iThome 鐵人賽

DAY 6
0
自我挑戰組

python-資料分析與機器學習系列 第 6

DAY6-資料分析的工具:pandas(DataFrame)

  • 分享至 

  • xImage
  •  

前言

今天讓我們來學習pandas中另外一個部分DataFrame吧。


DataFame:是一個二維的資料結構,每個欄位可以是不同的資料型態。建立DataFrame可以透過list也可以透過dict來建立,又或著是可以透過之前學過的numpy來建立。

以下介紹一些有關DataFrame的用法

>>> data = {'student':['a','a','b','b','c','c'],
>>>         'course':['Eng','math','Eng','math','Eng','math'],
>>>         'score':['87','45','63','75','86','95']  }
>>> dataframe = pd.DataFrame(data)
  student course score
0       a    Eng    87
1       a   math    45
2       b    Eng    63
3       b   math    75
4       c    Eng    86
5       c   math    95

印出前後五筆資料

>>> dataframe.head() #印出前五筆資料
>>> dataframe.tail() #印出後五筆資料

印出course欄位

>>> print(dataframe.course) 
0     Eng
1    math
2     Eng
3    math
4     Eng
5    math
Name: course, dtype: object

將data新增一個column,並將index改為a,b,c,d,e,f

>>>dataframe2 = pd.DataFrame(data,columns=['student','course','score','de'],
>>>index=['a','b','c','d','e','f'])
>>>print(dataframe2)
  student course score   de
a       a    Eng    87  NaN
b       a   math    45  NaN
c       b    Eng    63  NaN
d       b   math    75  NaN
e       c    Eng    86  NaN
f       c   math    95  NaN

透過loc擷取特定索引

>>> print(dataframe2.loc['b'])
student       a
course     math
score        45
de          NaN
Name: b, dtype: object

加入一行與刪除一行

dataframe['apple'] = 'None' #加入一行
del dataframe['apple']      #刪除一行

加入一列與刪除一列

>>> dataframe2 = dataframe2.drop(['d'])           #刪除d列
>>> dataframe2.loc['g'] = ['d','math','86','NaN'] #透過loc加入g列
>>> print(dataframe2)
  student course score   de
a       a    Eng    87  NaN
b       a   math    45  NaN
c       b    Eng    63  NaN
e       c    Eng    86  NaN
f       c   math    95  NaN
g       d   math    86  NaN

---20230921---


上一篇
DAY5-資料分析的工具:pandas(Series)
下一篇
DAY7-資料分析的工具:pandas(練習)
系列文
python-資料分析與機器學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言