各位好
我是最近開始學習爬蟲的初學者,自己寫了一段代碼,想爬取104的工作列表,代碼如下:
import urllib.request
url="http://www.104.com.tw/jobs/search/?ro=0&order=11&asc=0&page=1&mode=s&jobsource=2018indexpoc&indArea=8018000000,8020000000,8083000000,8019000000"
headers=("User-Agent","Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.103 Safari/537.36")
opener=urllib.request.build_opener()
opener.addheaders=[headers]
urllib.request.install_opener(opener)
file=opener.open(url)
print(file.getcode())
da=file.read().decode("utf-8","ignore")
print(da)
但是結果卻顯示另一個網址的網頁原始碼https://tls.support.104.com.tw/
說瀏覽器版本過舊需要升級瀏覽器,想請問有沒有方法可以解決?
我用的是chrome瀏覽器的User-Agent