各位版上大大好,
小弟我最近在研究網路爬蟲的技術,
期望可以幫我完成一些很瑣碎的工作,如網路簽到...XD
此外,一方面也可以爬取一些動態網頁的資料;
在學習過程中發現在Google Login那端會被Google阻擋,
找了一些網路文章發現有著各種方法可以破解,
可是不知道是不是因為文章比較久,所以都無法成功,
希望版上各位大神可以給我點建議,或者給我相關文章去閱讀學習也可以=))
Resource
Code
from selenium import webdriver
from selenium.webdriver.common.desired_capabilities import DesiredCapabilities
username, password = "abc", "123"
profile_path = "D:/Mozilla/Firefox/Profiles/zqzp1712.default-release"
profile = webdriver.FirefoxProfile(profile_path)
profile.set_preference("dom.webdriver.enabled", False)
profile.set_preference('useAutomationExtension', False)
profile.update_preferences()
desired = DesiredCapabilities.FIREFOX
driver = webdriver.Firefox(executable_path = "geckodriver.exe",
firefox_profile = profile,
desired_capabilities = desired)
login_url = 'https://accounts.google.com/o/oauth2/v2/auth/oauthchooseaccount?redirect_uri=https%3A%2F%2Fdevelopers.google.com%2Foauthplayground&prompt=consent&response_type=code&client_id=407408718192.apps.googleusercontent.com&scope=email&access_type=offline&flowName=GeneralOAuthFlow'
driver.get(login_url)
time.sleep(1)
acct = driver.find_element(By.XPATH,"//input[@id='identifierId']")
acct.send_keys(username + Keys.RETURN)
time.sleep(1)
pwd = driver.find_element(By.XPATH, "//input[@name='password']")
pwd.send_keys(password + Keys.RETURN)
time.sleep(1)
Resource連結建議用markdown語法唷
然後三個都一樣的部落格文章ㄟ
裡面說用第三方登入可以繞過
更新:
markdown用法是指連結啦:
[文章標題](網址)
這樣子
其他的可能要再研究 加油唷