前言 在「大數據」紅透透的時代,相信大家都聽過 Python、爬蟲。網路上亦有著大量的範例及 Solutions,對使用者來說是非常好的學習資源。然而,講解基礎...
所謂工欲善其事,必先利其器。 選擇 Python 的理由又是什麼?那我們得先從語言的特性及優缺點來探討。 Python 是什麼?爬蟲類嗎? 圖片來源 Pytho...
了解 Python 的特性之後,來看看 Python 還有什麼厲害之處吧~ 所以 Python,你有多猛? 語法簡單、直觀、可讀性高 請搭配此圖片...
你只要懂爬蟲,爬蟲就會幫你 引用自維基百科: 網路爬蟲(英語:web crawler),也叫網路蜘蛛(spider),是一種用來自動瀏覽全球資訊網的網路機...
本篇章主要是先從技術層面來解釋 URI 與 URL 及比較少使用到卻與生活息息相關的 URN,讓讀者先對這些名詞有概念上的了解後,再介紹其語法。 URL / U...
雖然 URN 跟後面的爬蟲沒什麼關係,既然前篇文章都提到了,就稍微介紹一下它的語法好了。 URI 之 URN 語法 URN 的語法圖: 圖片來源 開頭絕...
URI 之 URL 語法 URL 語法圖: 圖片來源 根據圖片,我們可以知道所謂的 URL ,是由 scheme、userinfo、host、port、pa...
本篇章開始將會牽扯到 TCP / IP 模型的觀念,但會先從名詞解釋開始,對名詞有一定的認知基礎後,再介紹模型,這樣就能更容易融會貫通。不過也不會講得太複雜,主...
本篇將簡單介紹 TCP 與 UDP,藉由介紹兩者的差異,來解釋為何 TCP 為什麼會比較耗時間,然而如何有效利用時間也是爬蟲程式規劃的重點之一。之後也會在實戰篇...
本篇章將介紹 HTTP 與 HTTPS,我們首先來簡單了解一下 HTTP 與 HTTPS 是什麼,再來介紹它的資料結構。 HTTP 圖片來源 引用自維基百科...