大家好~我目前還是個網路爬蟲新手
爬取的網站:[https://www.skh.org.tw/skh/advice.html]
問題:
有在原始碼中看到要爬取的內容和標籤,但當我使用print(soup)來確認時卻無此內容顯示
想詢問各位是哪邊出了問題
附上我的code:
自行嘗試過的解決辦法
1.轉換各種標籤爬取 如soup.select("p.editor_line_text span")、select("div.gas-editor span")、select("li")等,不知是否標籤找錯。
2.非動態網頁
3.用js render
先感謝大家願意幫我解答!!誠摯的感謝各位!!
如果你不想要利用像 puppeteer 之類的套件來操控瀏覽器
就得去打 AJAX 了,你標注的地方是動態載入的