iT邦幫忙

0

R 語言請益,新聞網站爬蟲

  • 分享至 

  • xImage

各位先進好,有兩個問題想要請各位幫忙解惑。想破頭實在不知道該怎麼辦。

  1. 如圖1 所示,url 是自由時報以「18歲公民權」為關鍵字的搜尋結果,先爬取連結後,再使用迴圈依次爬取內文。紅線標註處為文的 css,試了好幾次爬下來內文都只有第一段,沒有全文。

註 : 使用的網頁工具為 : selectorgodadget 和 cssviewer

  1. 如圖2, 3 所示,url 是風傳媒以 「「18歲公民權」為關鍵字的搜尋結果。每個標題的連結已經逐一爬下來了,但似乎無法被辨識,而且網站上能爬下來的連接似乎原本就長那個樣子。

還請各位幫忙解惑 QQ

![https://imgur.com/a/Rdy4ozl]

shiaobin iT邦新手 4 級 ‧ 2023-05-25 10:08:46 檢舉
貼圖語法弄錯了,正確是這樣,每張圖的連結要分開放:
![圖1](https://i.imgur.com/hHJwtpA.png)
![圖2](https://i.imgur.com/d6YvJyv.png)
![圖3](https://i.imgur.com/aJ66yyh.png)
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

1 個回答

0
海綿寶寶
iT邦大神 1 級 ‧ 2023-05-25 07:36:35

第2點

links <- link %>% html_attr("href")

改成

links <- paste("https://www.storm.mg", link %>% html_attr("href"))

試試看

另外
此網站有提供
1.貼程式碼
2.上傳圖片
的功能
歡迎多多利用

近年來看到不少 python蟲 血都快吐光了
沒想到連 R 都被拿來寫爬蟲
/images/emoticon/emoticon68.gif

obarisk iT邦研究生 1 級 ‧ 2023-05-25 09:13:05 檢舉

R 比 Python 好用的多。

我要發表回答

立即登入回答