閒聊
今天我們要繼續來爬蟲了!
這次要來挑戰爬取Instagram!
預期
不用輸入帳號密碼即可登錄。
實作
首先我們先用Selenium寫一個程式開啟Instagram網頁。
from selenium import webdriver
driver = webdriver.Chrome()
driver.get('https://www.instagram.com/')
會發現開啟網頁後,仍需要登錄後才能進入。
接下來我們可以先進到自己的Instagram登錄後,開啟cookies進行修改的擴充套件,將cookies匯出。
然後我們將剛剛匯出的cookies貼到JSON檔上,可以只留下name
和value
。
再來將這個JSON檔用程式讀取,並且寫一個for-loop讓他跑就可以了!
這樣就可以成功進入了!
注意:這裡結尾需要加上refresh
。
from selenium import webdriver
from time import sleep
import json
if _name_ == '_mina_' :
with open('cookies_jar.json') as f :
cookies = json.load(f)
dirver = webdriver.Chrome()
dirver.get('https://www.instagram.com/')
for cookie in cookies :
driver.add_cookie(cookie)
dirver.refresh
結語
今天順利的照著想要的進度走了!明天我們來模擬使用者對貼文案讚。
明天!
【Day 24】將所有貼文都點讚吧!(實戰Selenium 1/2)
參考資料
Instagramhttps://www.instagram.com/