iT邦幫忙

1

python輸出網址時顯示錯誤(已解決)

  • 分享至 

  • xImage

各位大神好,最近在跑python爬蟲時遇到了小問題...
我目前想要做的是利用google新聞抓取關鍵字的文章
先附上完整程式碼!

from urllib.request import Request, urlopen
from bs4 import BeautifulSoup
import requests
import re

root="http://www,google.com/"
link="https://www.google.com/search?q=%22%E7%AC%AC%E4%B8%80%E9%8A%80%E8%A1%8C%22+%22%E4%BA%BA%E5%B7%A5%E6%99%BA%E6%85%A7%22&rlz=1C1ONGR_zh-TWTW1005TW1005&tbm=nws&sxsrf=ALiCzsaa2NjFEfMPoCbW-iEcf93a2YMwrg:1664123062079&ei=toAwY_m5BMOUr7wPt-CQ0Ac&start=0&sa=N&ved=2ahUKEwj57Oi_rbD6AhVDyosBHTcwBHo4HhDy0wN6BAgBED8&biw=1536&bih=722&dpr=1.25"

next=soup.find('a',attrs={'aria-label':'下一頁'})
print(next['href'])
next=next['href']
link=root+next
print(link)

主要的問題是在最後要跳轉下一頁時 發現顯示錯誤
在debug時先試著將網址輸出看是否有誤
能夠發現在輸出蘭顯示的是沒有錯的
https://ithelp.ithome.com.tw/upload/images/20220926/20153160BNWcwJKgfO.jpg
但是把網址點下去的時候卻無法跳轉...

後來才發現點下去後的網址改變了
https://ithelp.ithome.com.tw/upload/images/20220926/20153160b1f8qMLH7T.jpg
https://ithelp.ithome.com.tw/upload/images/20220926/201531606kbZMfTQWq.jpg
原本的.跳轉後變成%2C
有大神可以解釋一下為什麼會變成這樣嗎?
或是應該要怎麼改才能正確顯示呢?
感謝大家的幫忙!!!!!!

copemoe iT邦研究生 1 級 ‧ 2022-09-26 11:17:05 檢舉
root="http://www,google.com/" ? 這個逗點 去掉看看
原來是這裡的問題! 非常感謝你~
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

2 個回答

3
bsexp301479
iT邦新手 3 級 ‧ 2022-09-26 11:17:11
最佳解答

程式碼中

root="http://www,google.com/"

這個寫錯了
倒數第二行中有

link=root+next

造成網址輸入錯誤

原來如此!!是我眼睛有問題... 謝謝大大的幫忙!!

3
黃彥儒
iT邦高手 1 級 ‧ 2022-09-26 11:17:48

你打 http://www,google.com/ 幹嘛用逗號 (,)?/images/emoticon/emoticon52.gif

真的很抱歉...是我沒有看到這個問題QQ 非常感謝你!

我要發表回答

立即登入回答