iT邦幫忙

2018 iT 邦幫忙鐵人賽
DAY 27
0
自我挑戰組

30天Python學習分享路程系列 第 27

Python 做一個簡單的小爬蟲(二)

把所有圖片的連結過濾抓出來
可以這樣做

# coding=utf-8

from selenium import webdriver
import urllib2
from bs4 import BeautifulSoup

driver = webdriver.Firefox()
driver.get("https://www.ptt.cc/bbs/Beauty/M.1515902682.A.579.html")
#print(driver.page_source)
soup = BeautifulSoup(driver.page_source, 'html.parser')
#print(soup)
image = soup.find_all("a")
for element in image:
    #print(element.get('href')[len(element.get('href'))-3:len(element.get('href'))])
    if element.get('href')[len(element.get('href'))-3:len(element.get('href'))] == "jpg":
        print(element.get('href'))

#print(image)
driver.close()

我的作法是判斷出字串後面的結尾是圖片就把她過濾出來

如下圖:

https://ithelp.ithome.com.tw/upload/images/20180116/20107812ilsusleo3i.png


上一篇
Python 做一個簡單的小爬蟲(一)
下一篇
Python 做一個簡單的小爬蟲(三)
系列文
30天Python學習分享路程30

尚未有邦友留言

立即登入留言