驗證碼或reCaptcha是許多網站採用的一種常見的反抓取技術。 他們會要求您先解決驗證碼,然後再登錄帳戶或訪問數據。
儘管Octoparse無法自動處理Captcha,但是有解決此問題的方法。
1)手動輸入本地提取的驗證碼
2)保存cookie以避免遇到驗證碼
1)手動輸入本地提取的驗證碼。
1.生成任務時,單擊文本框以在內置瀏覽器中手動輸入驗證碼。
2.在單擊登錄按鈕之前或在解決驗證碼之後的步驟中,設置足夠的等待時間。
3.在本地運行任務時,可以在提取窗口中手動輸入驗證碼或求解其他類型的驗證碼。
2)保存cookie以避免遇到驗證碼
每次運行任務時手動輸入驗證碼是非常不便的,不能應用於雲提取。如果網站支持使用cookie,我們可以保存cookie以保持登錄狀態。
從本教程中了解有關如何保存登錄Cookie的詳細信息:[單擊此處]
提示!
目前無法解決在抓取過程中遇到的Catpcha。我們建議您使用等待時間功能減慢提取速度。 [點擊這裡 ]