Python的pandas套件底下,有屬於pandas的特別的 資料的格式 ,其中一種,稱作Series。
以下示範Series的用法:
import pandas as pd
pd.Series(['柯南','小哀','元太','步美','光彥'])
0 柯南
1 小哀
2 元太
3 步美
4 光彥
dtype: object
s = pd.Series(['柯南','小哀','元太','步美','光彥','柯南','小哀','元太','步美','光彥'])
s.count()
10
len(s)
10
s.value_counts()
元太 2
光彥 2
柯南 2
步美 2
小哀 2
dtype: int64
s[0:5]
0 柯南
1 小哀
2 元太
3 步美
4 光彥
dtype: object
R本身的資料格式,就可以執行與pandas的Series同樣的運算,在R此種格式,稱作向量;對向量做的運算,稱作向量運算。
#### 文字向量 ####
c('柯南','小哀','元太','步美','光彥')
c('柯南','小哀','元太','步美','光彥',
'柯南','小哀','元太','步美','光彥')
r= c('柯南','小哀','元太','步美','光彥',
'柯南','小哀','元太','步美','光彥')
#個數
length(r)
#統計個數
table(r)
Python的Series 和 R的向量 運算,都可以針對 一群資料 比如[x,y,z...]裡頭 個別的資料 比如 x, y, z 進行運算,這是它們好用的原因之一。