iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 28
0
自我挑戰組

30天Python學習分享路程系列 第 28

Python 做一個簡單的小爬蟲(三)

成功囉!
利用urllib模組的urlretrieve做下載
帶入第一個參數為URL
第二個參數為檔案名稱

# coding=utf-8

from selenium import webdriver
import urllib
from bs4 import BeautifulSoup

driver = webdriver.Firefox()
driver.get("https://www.ptt.cc/bbs/Beauty/M.1515902682.A.579.html")
#print(driver.page_source)
soup = BeautifulSoup(driver.page_source, 'html.parser')
#print(soup)
image = soup.find_all("a")
fileName="picture"
count = 0
for element in image:
    #print(element.get('href')[len(element.get('href'))-3:len(element.get('href'))])
    if element.get('href')[len(element.get('href'))-3:len(element.get('href'))] == "jpg":
        urllib.urlretrieve(element.get('href'), "picture"+str(count)+".jpg")
        count = count +1
        print(element.get('href'))

#print(image)
driver.close()

程式沒問題就會再專案目錄看到我們的圖片了

https://ithelp.ithome.com.tw/upload/images/20180116/20107812kbBkGGCmYK.png

差點撐不過 ,我要硬起來 撐住!!!


上一篇
Python 做一個簡單的小爬蟲(二)
下一篇
Python 分享三年前大學爬蟲專題心得
系列文
30天Python學習分享路程30

尚未有邦友留言

立即登入留言