該如何爬蟲這個網站?

網路爬蟲

spring36861 2024-09-05 15:56:11 ‧ 2666 瀏覽

想使用爬蟲，但遇到一個網站，完全看不到裡面相應的內容

請問一下該如何處理?麻煩高手提供一下方向，謝謝

froce iT邦大師 1 級 ‧ 2024-09-05 16:08:37 檢舉

https://rmems.osha.gov.tw/HME/api/viewQrEquip/B/649bdf554290d165d96b526c

重點是如何得到 649bdf554290d165d96b526c 這串碼的列表。

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

meebox

iT邦新手 3 級 ‧ 2024-09-06 09:32:50

最佳解答

這個是網頁下載回來之後瀏覽器才執行其中的 JavsScript 去取得真正的資料, 可以透過按 F12 開啟網頁開發者工具觀察, 像是這樣：

切換到 Network 頁次, 按重新載入, 等所有傳輸完畢, 標示為 XHR 的就是網頁中的 JavaScript 程式碼執行的下載工作, 按一下這一筆工作, 就會看到詳細的結果：

就可以看到實際上這些資料的下載網址, 以及下載回來的資料內容。所以你只要透過一樣的網址就可以取得 JSON 格式的資料, 程式就可以直接處理了。

純真的人 iT邦大師 1 級 ‧ 2024-09-06 10:42:11 檢舉

想說我的【Network】畫面為何是空白~
原來還要再按下 Ctrl+R 才會把資料抓出來

japhenchen

iT邦超人 1 級 ‧ 2024-09-05 16:06:55

按F12爬XHR，會看到只有一筆GET回來的JSON，就可以解析，不用爬網頁

davidchen0117

iT邦新手 3 級 ‧ 2024-09-09 14:47:46

內容很清楚的!

不明

【＊＊此則訊息已被站方移除＊＊】

s0919112

iT邦新手 5 級 ‧ 2024-09-12 06:22:23

全部抓回來就好了.....給個大方向....不然我就用機關槍掃回來你自己再篩選

立即登入回答

IT邦幫忙