iT邦幫忙

2022 iThome 鐵人賽

DAY 15
0
Software Development

爬蟲基礎入門與實際應用系列 第 15

DAY15、專題一:惜物網 (1)

  • 分享至 

  • xImage
  •  

今天來爬一下惜物網作為requests爬蟲的示範。


什麼是惜物網?

https://shwoo.gov.taipei/shwoo/newhome/newhome00/index <-這裡

一個神祕的地方,一個政府報廢物的快樂天堂。

總之政府各部門的報廢品都會在這邊拍賣,拍賣品從牆上的公佈欄到消防局的六輪賓士貨車都有看過。
因此就算只是看看各部門丟了什麼鬼東西上來也是不錯的娛樂,甚至可以推坑朋友去標奇怪的東西


這次爬蟲的目標?

單純的打算在每天新增的商品中蒐集我有興趣的並輸出成列表。

雖然看一些奇葩東西拿出來拍賣很有趣,但有時只是想看有沒有自己感興趣的所以懶得一頁一頁翻。
畢竟連好幾頁都是一樣的東西也不少見,最高紀錄我看過金門酒廠丟了整整17頁的報廢陶罈。

主要是想透過物品地點、拍賣單位、關鍵字來濾。
大概的構想是拿一個json檔來儲存我常用的設定,跑程式時在透過裡面的條件來抓取符合條件的商品後再輸出成列表。


首先看一下網頁

https://ithelp.ithome.com.tw/upload/images/20220930/20152706a1YpVXiLbS.png
上方搜尋的地方看來可以直接幫我們濾掉大部分東西了,所以現在的問題是搞懂他怎麼運作的。

打開你開發者工具的網路頁面,然後丟一次搜尋看看。
https://ithelp.ithome.com.tw/upload/images/20220930/20152706eugZz4zhj0.png
假設丟這樣的內容上去,可以發現我們POST了一點東西上去。
https://ithelp.ithome.com.tw/upload/images/20220930/20152706uw9xuITPjk.png

按一下請求頁面可以看到我們post這樣的內容下去。
https://ithelp.ithome.com.tw/upload/images/20220930/20152706c35gKlSjfn.png
裡面算容易判斷各個選項是什麼意思。多搜尋幾次應該就可以找到規律了


明天繼續


上一篇
Day14、selenium常見bug處理
下一篇
DAY16、專題一:惜物網 (2)
系列文
爬蟲基礎入門與實際應用30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言