iT邦幫忙

0

Python網頁爬蟲登入後網址是隨機的SID

  • 分享至 

  • xImage

Hello 各位大神午安

因為最近公司需要去抓一個電話錄音系統的錄音
但是我一進去網站碰到一個問題是當我每次登入時網址如下

http://192.168.0.10:1000/Status.html?SID=15121651

他後面的SID=XXXXXXXX 即使同一個帳號重新登入後都會產生不同的SID
那我在抓網頁資料的時候 我應該如何解決他每次不同的SID

r=requests.get("http://92.168.0.10:1000/Status.html?SID=15121651")
print(r.text)

那我想我這樣寫如果每次跑他SID一定不同
我是想說將SID變成一個變數然後"http://92.168.0.10:1000/Status.html?"+"變數"

請問這樣如何改? 或者是否有人有更好的設計方法

先感謝大家的協助~/images/emoticon/emoticon13.gif

看更多先前的討論...收起先前的討論...
ccutmis iT邦高手 2 級 ‧ 2021-04-15 12:27:28 檢舉
legal or illegal?
是公司主管請我抓的 設備都是自己公司的沒問題~單純要記錄電話交易語音
ccutmis iT邦高手 2 級 ‧ 2021-04-15 12:43:54 檢舉
既然都在自家公司裡 為何不直接從伺服器跟資料庫去抓資料撈數據就好...

如果還是堅持要用爬的話 這種情況可以試試 Python selenium + chrome 的方式
google search 'Python selenium + chrome'
或這裡:
https://ithelp.ithome.com.tw/questions/10202329
那個設備叫TCR-3000 錄音設備 廠商說沒聽過它有資料庫 他說其他公司厲害的工程師都是自己寫程式去抓的 ~
ccutmis iT邦高手 2 級 ‧ 2021-04-15 15:43:23 檢舉
http://www.multisuns.com/tcr-3000_ov_c.html

具 APP 及網頁,雙操作介面
...略....
強大的集中管理功能,可將分散於各點的TCR-3000經由PC集中備份錄音資料,或是將 TCR-3000 分組管理透過統一介面監看、監聽、搜尋、放音、設定等。

你可以拿這個網址去問廠商 這網頁裡面說的東西是什麼
有問了那個功能是他另外買一套可以集中備份所有音源檔案到一台伺服器上
然後你可以從它的應用程式搜尋幾月幾號幾點幾分誰打給誰~我們有買用來備份音檔
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

2 個回答

0
海綿寶寶
iT邦大神 1 級 ‧ 2021-04-15 12:39:11

1.登入
2.登入成功由 server 回應中取得 SID 值(例:15121651)
3.爬 http ://92.168.0.10:1000/Status.html?SID=15121651

這位連facebook 都登入了
貴公司的網站應該不比 facebook 複雜吧

你說對了 那我可能要從登入畫面後才去抓網址 我換你的方向試試看/images/emoticon/emoticon41.gif

0
小魚
iT邦大師 1 級 ‧ 2021-04-15 12:41:04

看起來應該是每次會產生新的SID,
你的爬蟲可能需要支援執行Js之類的吧...

挖其實JS我還沒碰到 可能要再研究 感謝

我要發表回答

立即登入回答