繼上次教了大家遇到想爬下一頁跟遇到前置按鈕(ex:是否已滿18)的情況處理後,今天會進階到教大家如果遇到圖片想要爬下來該如何處理,並且以目前大學生比較常使用的聊天論壇-Dcard來為實作案例。
import requests
pic = requests.get('https://imgur.dcard.tw/N2k5kV2m.jpg') #變數名稱為pic
img2 = pic.content #變數名稱命名為img2
pic_out = open('img1.png','wb') #img1.png為預存檔的圖片名稱
pic_out.write(img2) #將get圖片存入img1.png
pic_out.close() #關閉檔案(很重要)
import requests
pic=requests.get('https://imgur.dcard.tw/N2k5kV2m.jpg') #圖片網址
img2 = pic.content #圖片裡的內容
pic_out = open('img1.png','wb') #img1.png為預存檔的圖片名稱
pic_out.write(img2) #將get圖片存入img1.png
pic_out.close() #關閉檔案(很重要)
import requests
from bs4 import BeautifulSoup
r = requests.get("https://www.ptt.cc/bbs/MobileComm/index.html") #將網頁資料GET下來
soup = BeautifulSoup(r.text,"html.parser") #將網頁資料以html.parser
sel = soup.select("div.title a") #取HTML標中的 <div class="title"></div> 中的<a>標籤存入sel
for s in sel:
print(s["href"], s.text)
變數名稱 = open("檔案名稱",FLAG)
開檔變數名稱.read() #讀取
開檔變數名稱.write("寫入內容") #寫入
開檔變數名稱.close()
f = open('file.txt', 'w')
f.write(str(s["href"]) + s.text+"\n")
f.close()
import requests
from bs4 import BeautifulSoup
f = open('file.txt', 'w')
r = requests.get("https://www.ptt.cc/bbs/MobileComm/index.html") #將網頁資料GET下來
soup = BeautifulSoup(r.text,"html.parser") #將網頁資料以html.parser
sel = soup.select("div.title a") #取HTML標中的 <div class="title"></div> 中的<a>標籤存入sel
for s in sel:
print(s["href"], s.text)
f.write(str(s["href"]) + s.text+"\n")
f.close()
f = open('file.txt', 'r')
r = f.read()
print(r)
f.close()