iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 17
1
AI & Data

蟲王養成 - scrapy系列 第 17

DAY 17 : scrapy 爬取js畫面資料(二)

  • 分享至 

  • xImage
  •  

先前發文
DAY 01 : 參賽目的與規劃
DAY 02 : python3 virtualenv 建置
DAY 03 : python3 request
DAY 04 : 使用beautifulsoup4 和lxml
DAY 05 : select 和find 抓取tag
DAY 06 : soup解析後 list取值
DAY 07 : request_header_cookie 通過網頁18限制
DAY 08 : ppt內文爬取
DAY 09 : 資料處理 split replace strip
DAY 10 : python csv 寫入 和dict 合併
DAY 11 : python class function
DAY 12 : crawl 框架 scrapy 使用
DAY 13 : scrapy 架構
DAY 14 : scrapy pipeline data insert mongodb
DAY 15 : scrapy middleware proxy
DAY 16 : scrapy selenium
DAY 17 : scrapy 爬取js畫面資料(二)


今天就來介紹一般爬取js的方法吧!

先來說明為何要使用這個方法來爬蟲 , 當然是因為有js的資料沒有瀏覽器跑不出來阿!!!

那另外的原因是selenium跑太慢了尤其是一個頁面上千個產品 , 又要一個一個進去爬產品資訊 , 除非網路跟硬體還有code都寫的很好(就是你很有錢又有閒)的話那就使用吧

那這次用來教學的網站叫arcteryxz(始祖烏)


上一篇
DAY 16 : scrapy selenium
下一篇
DAY 18 : scrapy splash 爬取js畫面資料(三)
系列文
蟲王養成 - scrapy30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言