分享至
大家好,我利用 file_get_contetns 這個 function 想要 抓取某個頁面回來以後 parser 他的結構抓取其中一個 table 來使用,但該頁面的 table 是在該頁利用 js 生成的 所以頁面抓回來時該 table 並未形成,有辦法抓取執行完的結果嗎,或者是有其他方式可以達到我的目的
已邀請的邦友 {{ invite_list.length }}/5
你的目的應該是表格中的資料吧? 想辦法取得它資料來源,比較重要,而不是想辦法產生它的頁面,再去抓頁面資料。
如果真的想要讓 javascript 產生出 html code,這必須要有 rendering engine。請參考: http://code.google.com/p/py-webkit-html-manipulator/
該頁面就是提供訊息的來源 做法是像某些網站縣市下拉選單的方式 把資料都 push 給 js,再用 js create table 沒有任何 ajax 行為
既然資料都在 js 中,那就抓 js 來分析它吧。 通常一個 Regular Expression 就能抓到所要的資料了。
IT邦幫忙