iT邦幫忙

0

Octoparse網頁抓取:處理CAPTCHA / reCAPTHCA

驗證碼或reCaptcha是許多網站採用的一種常見的反抓取技術。 他們會要求您先解決驗證碼,然後再登錄帳戶或訪問數據。

儘管Octoparse無法自動處理Captcha,但是有解決此問題的方法。

1)手動輸入本地提取的驗證碼
2)保存cookie以避免遇到驗證碼

1)手動輸入本地提取的驗證碼。

1.生成任務時,單擊文本框以在內置瀏覽器中手動輸入驗證碼。

單擊文本框
 

2.在單擊登錄按鈕之前或在解決驗證碼之後的步驟中,設置足夠的等待時間。

等待時間
 

3.在本地運行任務時,可以在提取窗口中手動輸入驗證碼或求解其他類型的驗證碼。

本地運行任務

 
 

 

 

2)保存cookie以避免遇到驗證碼

每次運行任務時手動輸入驗證碼是非常不便的,不能應用於雲提取。如果網站支持使用cookie,我們可以保存cookie以保持登錄狀態。

從本教程中了解有關如何保存登錄Cookie的詳細信息:[單擊此處]

 

提示!

目前無法解決在抓取過程中遇到的Catpcha。我們建議您使用等待時間功能減慢提取速度。 [點擊這裡 ]


圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 則留言

我要留言

立即登入留言