我想要在租屋網存取資料,卻遇到HTTP Error 419錯誤,請問是遇到什麼問題了?
import urllib.request as req
import json
#建立連線網址
url="https://rent.591.com.tw/home/search/rsList?is_format_data=1&is_new_list=1&type=1®ion=1"
request = req.Request(url,headers={
"User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.61 Safari/537.36"
})
with req.urlopen(request) as response:
data=response.read().decode("utf-8")
data=json.loads(data)
print(request)
錯誤訊息
urllib.error.HTTPError: HTTP Error 419: unknown status
請問是怎麼了?謝謝
剛好我在寫「591 租屋網的爬蟲」文章,會有說明及較完整的範例程式,預計下週六發布(假如我懶惰沒發作的話?),你之後也可以參考。
來囉 -> https://blog.jiatool.com/posts/house591_spider/
簡單來說,https://rent.591.com.tw/home/search/rsList
請求的錯誤,你將網頁內容印出來,會看到"The page has expired due to inactivity.",經過我的實測,它需要代上 Cookie 與 X-CSRF-TOKEN 這兩個參數。
而這兩個參數從 https://rent.591.com.tw/
請求的回傳內可以找到。
好的,謝謝您
可以請您再針對如何獲取Cookie 與 X-CSRF-TOKEN 的參數進行說明嗎,謝謝
我預計明天會發文章,會有範例程式~
https://www.facebook.com/jiatool