大家好
我想詢問爬蟲問題再麻煩各位高手解答
import requests
from bs4 import BeautifulSoup
mlb_url='https://www.baseball-reference.com/boxes/NYN/NYN202007250.shtml'
headers = {"Agent-User": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/88.0.4324.104 Safari/537.36"}
res=requests.get(mlb_url,headers=headers)
res.encoding = 'utf8'
html_doc=res.text
#print(html_doc)
soup=BeautifulSoup(res.text,'lxml')
#print(soup.prettify())
#print(soup.select("tfoot > tr > td"))
print(soup.select("#div_AtlantaBravesbatting.table_container is_setup "))
我用了很多方式可是他print出來都是[]空的
可是我明明是照網站的html位置找的可是就是回傳空值
想請問各位還有甚麼方法能把表格爬下來嗎?
再麻煩各位解惑
畫面上的table 適用 js 產生的 所以你才抓不到八
ctrl + shift + P disable javascript
會發現table 不見了
不過資料都在all_AtlantaBravesbatting的註解裡面
for item in soup.select("#all_AtlantaBravesbatting")[0].contents:
if 'div_AtlantaBravesbatting' in item:
print(item)
就能取到資料了