requests 函式庫是 Python 外部函式庫,具備了 GET、POST...等各種 request 用法,透過 requests 能夠輕鬆抓取網頁的資料,這篇會介紹 requests 函式庫的基本用法。
$pip install requests
import requests
請求伺服器提供資源可用的功能選項
# GET :獲取網頁內容, GET 如果有提交參數,其參數是放在標頭中傳送 (公開)
r = requests.get(url [, params])
# POST :提交請求, POST 如果有提交參數,則是放在內容中傳送 (隱密)
r = requests.post(url [, data])
# PUT : 提供最新內容
r = requests.put(url [, data])
# DELETE : 刪除指定的資源
r = requests.delete(url)
# HEAD : 提供資源的回應標頭 ( 不含內容 )
r = requests.head(url)
# OPTIONS : 請求伺服器提供資源可用的功能選項
r = requests.options(url)
requests 在使用方法時,有時候也會加入指定的參數,以下為常用參數 :
接下來試試看,使用 get 的方式發送 request,並加入 params 參數 => get 範例網址
當伺服器收到 requests HTTP 所發出的請求後,會傳回一個 Response 物件,物件裡包含伺服器回應的訊息資訊,以下為常用方法 :
當使用 requests 進行 HTTP 請求時,伺服器的回應(即回傳的資料)可以通過「status_code」讀取網頁的回應狀態代碼,知道網頁的狀態
假設讀取一個不存在的網頁,然後判斷 status_code 是否等於 404,則印出「找不到網頁」的文字
import requests
# 使用 get 方法 ,獲取輔大首頁內容
web = requests.get('https://www.fju.edu.tw/')
# 讀取並印出 text 屬性
print(web.text)
參考資料 :
https://steam.oxxostudio.tw/category/python/spider/requests.html
https://utrustcorp.com/python-requests/
https://yhhuang1966.blogspot.com/2020/06/python-requests-beautifulsoup.html