python爬蟲抓不到span的資料 - iT 邦幫忙::一起幫忙解決難題，拯救 IT 人的一天

1

python爬蟲抓不到span的資料

python3 網路爬蟲 span

不明 2018-05-22 16:44:11 ‧ 7717 瀏覽

分享至

我的code很簡單只是要先看看爬出來的資訊在做篩選
code:
import requests
from bs4 import BeautifulSoup
res = requests.get('http://www.e-bus.taipei.gov.tw/newmap/Tw/Map?rid=10821&sec=0')
soup = BeautifulSoup(res.text,'html.parser')
print(res.text)

文字解說:第一張是我要抓的公車進站時間

第二張是說明我print(res.text) 就是沒有出現到站時間

登入發表討論

熱門推薦

{{ item.subject }}

{{ item.channelVendor }} | {{ item.webinarstarted }} |

{{ formatDate(item.duration) }}

直播中

2 個回答

0

froce

iT邦大師 1 級 ‧ 2018-05-23 08:02:00

幫你看了一下，那個是用ajax去取，然後再由前端呈現的，所以你直接用request取不到。

ajax網址：
http://www.e-bus.taipei.gov.tw/newmap/Js/RouteInfo?rid=10821&sec=0&_=1527033355647

回應 3
分享
檢舉

不明檢舉

謝謝您的回覆

不明檢舉

不好意思from selenium import webdriver用這個行嗎

froce iT邦大師 1 級 ‧ 2018-05-23 16:33:45 檢舉

selenium一定可以，不過會很慢，除非必要不要用。
重點是ajax的資料解析完後，你再怎麼呈現而已。直接用ajax取出的JSON去處理就好。

登入發表回應

2

Maliao

iT邦新手 5 級 ‧ 2018-05-23 08:35:47

這個網頁的實時公車資訊是使用js傳回來的，這樣requests是取不到的，但是可以先使用瀏覽器的開發者工具，選擇"Network"了解數據是由哪邊過來的。

直接請求json網址加上時間戳，就可以取到公車的資訊。

探索一下兩邊網頁的對應，就能取到目前的停靠站了。

回應 4
分享
檢舉

看更多先前的回應...收起先前的回應...

不明檢舉

謝謝您的回覆

不明檢舉

不好意思
我的看起來怎麼跟你的不一樣

不明檢舉

我找到了~
只是沒有跑出跟你第二張一樣的畫面

Maliao iT邦新手 5 級 ‧ 2018-05-24 07:51:39 檢舉

你可能找錯了，你在看下，紅5的ajax url是這個

http://www.e-bus.taipei.gov.tw/newmap/Js/RouteInfo?rid=10821&sec=0&_=1527119143185

登入發表回應

我要發表回答

立即登入回答

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙