今天我們來用鐵達尼號的乘客名單來練習,有想要一起練習的可以去這邊來下載。
首先我們先把下載好的檔案用**pd.read_csv()**這個函數來讀取它。
import pandas as pd
csv = "titanic.csv"#這邊填入你檔案的位置(因為我的csv檔和python檔式放在同一個資料夾裡,所以在這邊我只需要打檔名就可以找到了。)
data = pd.read_csv(csv)
data
我們可以看到下方這張表,這就是我們用pandas讀取出來的,接著我們就可以對它進行一些操作。
在上面那段程式我們已經把讀取出來的csv檔丟給 data 了,所以我們可以直接對 data 進行一系列的操作。
首先我們用下面這段程式碼來將 data 的格式顯示出來。
print(type(data))
<class 'pandas.core.frame.DataFrame'>
我們可以看到出來的結果跟你說 data 的格式是 DataFrame,DataFrame是pandas中很重要的核心結構,接下來我們會一一的演示出來。
接下來我們還可以用dtypes來將data所有內所有的數據結構打印出來
import pandas as pd
csv = "titanic.csv"
data = pd.read_csv(csv)
print(type(data))
print(data.dtypes)
我們可以看到每個指標都會有他自己存放資料的格式,比如Sex格式就是object,Age就是float64格式,在補充一點,pandas中的object格式其實就像是python中的string。
我們今天就先到這了,明天繼續來學pandas。