Python 做一個簡單的小爬蟲(三)

2018 iT 邦幫忙鐵人賽

DAY 28

自我挑戰組

30天Python學習分享路程系列第 28 篇

2018鐵人賽

CHI-CHENG HSIAO

2018-01-16 18:59:23

7357 瀏覽

分享至

成功囉!
利用urllib模組的urlretrieve做下載
帶入第一個參數為URL
第二個參數為檔案名稱

# coding=utf-8

from selenium import webdriver
import urllib
from bs4 import BeautifulSoup

driver = webdriver.Firefox()
driver.get("https://www.ptt.cc/bbs/Beauty/M.1515902682.A.579.html")
#print(driver.page_source)
soup = BeautifulSoup(driver.page_source, 'html.parser')
#print(soup)
image = soup.find_all("a")
fileName="picture"
count = 0
for element in image:
    #print(element.get('href')[len(element.get('href'))-3:len(element.get('href'))])
    if element.get('href')[len(element.get('href'))-3:len(element.get('href'))] == "jpg":
        urllib.urlretrieve(element.get('href'), "picture"+str(count)+".jpg")
        count = count +1
        print(element.get('href'))

#print(image)
driver.close()

程式沒問題就會再專案目錄看到我們的圖片了