iT邦幫忙

0

Python Selenium | CLASS_NAME正確卻抓不到文章名稱(發問)

  • 分享至 

  • xImage

大家好,
最近在練習上網頁抓新聞蒐集數據
於是我嘗試抓 Android Authority https://www.androidauthority.com/ 的文章

from selenium import webdriver #webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.options import Options 

oooptions = Options()
oooptions.chrome_executable_path=r"C:\Users\USER\Desktop\Python\chromedriver.exe"
oodriver = webdriver.Chrome(options=oooptions)

ooAAoo = "https://www.androidauthority.com/" 
oodriver.get(ooAAoo)
oopost = oodriver.find_elements(By.CLASS_NAME, "-_-Wi")

x=0
for ooloop in oopost:
    x=x+1
    print(x,".", ooloop.text)

oodriver.close()

但無法抓到所有的文章
只會出現 More news 下的文章名稱

 <h3 class="-_-h -_-Wf">More news</h3> 

https://ithelp.ithome.com.tw/upload/images/20230109/20156832U6aueGL5W9.jpg
但其他地方像 News/ Feaatures 底下的文章名稱也是 -_-Wi

卻都沒有出現,想請教一下是哪個地方出錯了呢?

感謝!

圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

0
la1ala0rz
iT邦新手 5 級 ‧ 2023-01-10 10:19:56

基本上沒錯, 但是該網頁的內容要捲動才會載入, 請讓你的爬蟲把頁面往下拉

我要發表回答

立即登入回答