第二十九天-網頁爬蟲

2019 iT 邦幫忙鐵人賽

DAY 29

自我挑戰組

30天深入探索Python系列第 29 篇

2019鐵人賽

hm5829

團隊夢遊症患者

2018-10-29 09:27:48

3754 瀏覽

分享至

網頁爬蟲就是透過寫程式與網站溝通，以取得自己需要的程式，我們平常都是透過瀏覽器和網站做溝通，一般是從網址輸出後，伺服器收到並回傳原始碼經由網站轉為我們能夠閱讀的模式。瀏覽器會把網站回傳的資訊呈現給使用者，你可能會覺得沒必要多此一舉，但如果你常常需要取得網站最新消息，或針對不同網站做資訊比對，或是要從網站複製貼上大量資料，網頁爬蟲可能就可以更好的達成你的需求。

爬蟲就是爬蟲，他雖然小卻能看到我們平時所看不到的，我們可以在網頁中按 **F12 ** 就能看到類似爬蟲的視角。現在開始介紹怎麼使用 python 寫出網路爬蟲的程式。

先用系統管理員打開命令提示字元 (cmd)

接著輸入 pip 查看你的 python 安裝了哪些套件

這裡需要安裝 requests、BeautifulSoup4 套件

要怎麼知道你下載安裝套件有沒有成功

輸入完成沒跳出錯誤訊息就是成功了