本篇會簡單介紹 HTTP 的結構。 HTTP Messages 什麼是 HTTP Messages?就是兩個端點之間,透過 HTTP 協定交換數據的方式。 假設...
了解 HTTP Message 的結構後,接下來要講解的是 HTTP Method,這對爬蟲來算是重要的一環,原因在於當我們對某個網站發送 Requset 時,...
本篇主要講解 HTTP 狀態碼代表的意思。主要是針對狀態碼的類別做講解,所以不用擔心會太多。且並不是所有狀態碼都很常被使用到,通常只要看狀態碼的 Status...
本篇將會簡單介紹 TCP / IP 是什麼,及透過 TCP / IP 資料是怎麼傳輸的。但老樣子,不會做太過複雜的解釋,只會做概念上的介紹,想讓讀者至少先對 T...
相信 Cookie 與 Session 很多人常常搞不清楚,今天就用超級簡單的方式來讓大家了解。 Cookie 與 Session 不知道大家還記不記得,HTT...
雖然爬蟲只需要使用到 URL 送 Request 就好,但我們還是需要對 API / CGI 有一些簡單的了解。 因為一個網站是基於 API 還是 CGI 設計...
爬蟲事前準備 本篇章之後將進入爬蟲環節,但開始撰寫程式前,我們先來安裝會使用的套件吧! 本系列文將使用 Requests,是一個基於 urllib3 為基礎開發...
實戰演練開始前,稍微來講解一下 Requests 的基本使用,當作是暖身。 用 Requests 送 Request 記不記得之前有提過 HTTP 有不同的 M...
今天要來講的是,讀取送出 Request 後拿回來的 Response。 讀取 Response 以下幾種為常用到的方式: String import...
這篇是基礎應用的最後一篇,主要補充講解幾個基本功能。 檢查 Response Status 當我們在爬蟲拿到 Response 時,通常為了要確保內容正確,...