iT邦幫忙

0

爬蟲urllib.error.HTTPError: HTTP Error 419: unknown status 是什麼意思?

  • 分享至 

  • xImage

我想要在租屋網存取資料,卻遇到HTTP Error 419錯誤,請問是遇到什麼問題了?

import urllib.request as req
import json
#建立連線網址
url="https://rent.591.com.tw/home/search/rsList?is_format_data=1&is_new_list=1&type=1&region=1"
request = req.Request(url,headers={
    "User-Agent":"Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/102.0.5005.61 Safari/537.36"
})

with req.urlopen(request) as response:
    data=response.read().decode("utf-8")

data=json.loads(data)
print(request)

錯誤訊息

urllib.error.HTTPError: HTTP Error 419: unknown status

請問是怎麼了?謝謝

圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

2 個回答

0
海綿寶寶
iT邦大神 1 級 ‧ 2022-05-29 08:49:55

參考HTTP error 419說明

1092B0007 iT邦新手 3 級 ‧ 2022-05-29 14:28:51 檢舉

好的,謝謝您

0
jiatool
iT邦研究生 3 級 ‧ 2022-05-29 10:44:11

剛好我在寫「591 租屋網的爬蟲」文章,會有說明及較完整的範例程式,預計下週六發布(假如我懶惰沒發作的話?),你之後也可以參考。
來囉 -> https://blog.jiatool.com/posts/house591_spider/

簡單來說,https://rent.591.com.tw/home/search/rsList 請求的錯誤,你將網頁內容印出來,會看到"The page has expired due to inactivity.",經過我的實測,它需要代上 Cookie 與 X-CSRF-TOKEN 這兩個參數。

而這兩個參數從 https://rent.591.com.tw/ 請求的回傳內可以找到。

https://ithelp.ithome.com.tw/upload/images/20220529/20139617CZiEUZ3VAj.png

  • 如果對文章有興趣,可以追蹤「IT空間」FB 粉專
1092B0007 iT邦新手 3 級 ‧ 2022-05-29 14:28:41 檢舉

好的,謝謝您

1092b0016 iT邦新手 5 級 ‧ 2022-06-03 18:12:27 檢舉

可以請您再針對如何獲取Cookie 與 X-CSRF-TOKEN 的參數進行說明嗎,謝謝

jiatool iT邦研究生 3 級 ‧ 2022-06-03 21:57:52 檢舉

我預計明天會發文章,會有範例程式~
https://www.facebook.com/jiatool

我要發表回答

立即登入回答