iT邦幫忙

2021 iThome 鐵人賽

DAY 22
0
自我挑戰組

初次接觸爬蟲的學習系列 第 22

選擇性抓取資料

我這次想做個在爬取資料中進行篩選的工作,這樣的話以後就可以只得到我想要的關鍵資料了。那我就沿用上篇抓取鐵人賽總閱覽數的程式碼,不過這次是取我發布文章的閱覽數,有點公開處行了~好吧!
下面我就直接看程式碼啦!命令提示字元上面是全部抓取的結果,下面則是篩選過後的結果,而我篩選條件是超過50閱覽數。
https://ithelp.ithome.com.tw/upload/images/20210927/2014107436trT0UUK8.png
https://ithelp.ithome.com.tw/upload/images/20210927/20141074bXkTFrcVua.png
上面看只抓取了10個文章的閱覽數,其實還有一章在第二頁,所以我在改造一下程式碼。幸好那一張有超過50,不然就要空白了!
https://ithelp.ithome.com.tw/upload/images/20210927/20141074vCwZhEJ1yF.png
https://ithelp.ithome.com.tw/upload/images/20210927/20141074siBmYcifOU.png
https://ithelp.ithome.com.tw/upload/images/20210927/20141074C9B5MxlyFJ.png


上一篇
抓取閱覽人數
下一篇
連接資料庫傳送資料
系列文
初次接觸爬蟲的學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言