為何要介紹CSV模組,我們要將爬蟲爬到的資料做儲存,有兩種方式
1.將資料存到資料庫(建議使用NOSQL)
2.將資料存到CSV檔
因為爬回來的資料型態基本都都以字串型態先做儲存,抓回來的資訊還是要做些後製的處理,我們才可以利用他們,爬蟲絕對沒辦法100%確認資料是沒問題的直接拿來使用的,說不定妳爬到了一顆地雷
只要我們再Python程式最上方宣告
import csv
即可開始使用我們的csv的函式庫,他可File的函式庫命令很相似
1.example: 一列一列的讀取出csv資料
import csv
with open('item.csv', 'rb') as csvFile:
readFile = csv.reader(csvFile)
for row in readFile:
print row
參考資料:
https://docs.python.org/2/library/csv.html