請問爬蟲要隔多久request一次才安全?
我想應該每個網頁的限制不一樣,所以應該要問怎麼知道這限制是多少?
當個有禮貌的爬蟲:
網路爬蟲可以同時進行大量的連線,如果在短時間內大量連接某個網站(網域),會讓伺服器成受不了而當機,而且過多的流量也會讓網站主吃不消
如果你的問題是...多久request一次才安全?
那如上所說,測到被 ban就對了
但其實更重要的是:你要爬什麼啊?
你爬的資料,你連線的方式,會影響到server的流量,而流量...就是錢啊
如果有更多的資訊的話,會更容易猜測出安全的 request 間格
以上淺見