iT邦幫忙

第 12 屆 iThome 鐵人賽

DAY 2
0
自我挑戰組

爬蟲初體驗系列 第 2

Day02_Scrapy安裝介紹以及架構說明

  • 分享至 

  • xImage
  •  

Scrapy安裝介紹
官網指定Python版本需要高於3.5.2

Installing Scrapy(安裝SCRAPY)
在WINDOWS的環境下

pip install Scrapy

即可安裝完畢

如果你是MAC或是LINUX系統的話,在官網上也有詳細的介紹。

SCRAPY運作說明

  1. 提供第一個網站網址給SCRAPY
  2. SCRAPY會針對此網址進行REQUEST動作
  3. 將其網站的內容進行下載動作,下載後生成Response
  4. 並在程序的架構中設定自己需要Extract的內容進行規劃
  5. 將要拆解的文字或者數字等列為ITEM
  6. 該ITEM會透過ITEM PIPELINE進行處理作業(例如保存、丟棄或是驗證等等)
  7. 當然你可以透過網址的篩選器海爬整個網站,直到沒有網址可以解析為止。

上一篇
Day_01 爬蟲介紹以及為什麼需要爬蟲
下一篇
Day03_Scrapy建立專案
系列文
爬蟲初體驗4
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言