iT邦幫忙

2024 iThome 鐵人賽

DAY 20
1
自我挑戰組

從零開始學Python系列 第 20

[Day20] Python 爬蟲-1

  • 分享至 

  • xImage
  •  

本篇的python爬蟲會使用selenium套件去執行。

  1. 安裝selenium
    在terminal中輸入以下code
pip install selenium
  1. 使用google chrome的web driver為例,打開 Google
  • 需要先下載google chrome web driver:google web driver
  • 確保當前運行的 Python 文件名不是 selenium.py,否則會與 Selenium 的模組名稱衝突
  • 如果無法執行,系統偏好設定(System Preferences)的安全性與隱私(Security & Privacy)
    點擊隱私(Privacy)選項,找到開發者工具(Developer Tools)並將終端機(Terminal)打勾
from selenium import webdriver
from selenium.webdriver.chrome.service import Service

chrome_driver_path = "path/chromedriver"  
service = Service(chrome_driver_path)
driver = webdriver.Chrome(service=service)
driver.get("https://www.google.com")
  1. 關閉網頁
driver.quit()
  1. 每個網頁都是html檔:
    檢視原始碼的快捷鍵在Mac 是:⌘ + Option + U

  2. 在google搜尋欄位自動打入關鍵字

  • 所需的import
from selenium import webdriver
from selenium.webdriver.chrome.service import Service
import time
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
  • code
chrome_driver_path = ".../chromedriver"  
service = Service(chrome_driver_path)
driver = webdriver.Chrome(service=service)
driver.get("https://google.com")
search = driver.find_element(By.NAME, "q")
search.send_keys("iphone 16")

print(driver.title)

time.sleep(10)
driver.quit()

https://ithelp.ithome.com.tw/upload/images/20240910/20168811o9dYH75WFZ.png

  1. 按下enter搜尋
search.send_keys(Keys.RETURN)

https://ithelp.ithome.com.tw/upload/images/20240910/201688119Wwdbrhp3L.png


上一篇
[Day19] Python OpenCV -4
下一篇
[Day21] Python 爬蟲-2
系列文
從零開始學Python30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言