今天要分享的是PTT Beauty版爬蟲-用Cookie偽裝使用者並下載圖片!
首先查詢"PTT 表特版 Sana"(私心喜歡><!!),點擊連結時會先跳出是否滿18歲的視窗,點擊進入網頁後即可看到照片,之後如果再次重新點擊連結時會發現已無是否滿18歲的阻擋視窗,因為已被紀錄在瀏覽器的Cookie中,如把紀錄刪除則會重新跳出阻擋視窗。
#找網站的標題,程式碼與執行結果如下
接下來是下載圖片的部分,分為三個步驟:
1.建立圖片資料夾
2.找到網頁中的所有圖片
3.如果是圖片的話下載
所有的程式碼如下:
執行結果如下(在pythonCrawler中會新增所有出現在此網頁的照片):
以上是我今天的分享,謝謝大家!
參考網址:https://www.youtube.com/watch?v=1PHp1prsxIM&list=LL&index=5