如何使用Python3中的jupyter抓取tripadvisor的評論資料

python3 [jupyter notebook]

space53279 2019-07-23 14:28:56 ‧ 1705 瀏覽

分享至

想請問一下，要如何從tripadvisor的網站中抓取長榮航空評論文字和分數
並且抓取每一頁的資料
最後儲存成一個檔案
以利之後的分析

小妹在這裡懇求各位的幫忙，拜託大家了

看更多先前的討論...收起先前的討論...

dragonH iT邦超人 5 級 ‧ 2019-07-23 14:31:08 檢舉

爬蟲

space53279 iT邦新手 5 級 ‧ 2019-07-23 14:32:50 檢舉

對，可是我編寫的程式怪怪的，所以想問一下，程式碼如何編寫

dragonH iT邦超人 5 級 ‧ 2019-07-23 14:34:04 檢舉

要問程式

就把code貼出來囉

記得 code 別貼圖

ant1017 iT邦新手 2 級 ‧ 2019-07-23 14:34:44 檢舉

如何奇怪，方便將你覺得怪的地方PO出來，讓大家幫你解惑..

space53279 iT邦新手 5 級 ‧ 2019-07-23 14:39:35 檢舉

def run(self):
# 1.Find URL
for i in range(0, self.max_num):
url = ("https://www.tripadvisor.com.tw/Airline_Review-d8729076-Reviews-or10-EVA-Air".format(i*30))
# 2.Send Request, Get Response
html = self.parse_url("https://www.tripadvisor.com.tw/Airline_Review-d8729076-Reviews-or10-EVA-Air")
# 3.Get item
if html:
item = self.parse_html(html)
# 4.save information
self.save_item(item)

space53279 iT邦新手 5 級 ‧ 2019-07-23 14:40:10 檢舉

我試著用網路上教授的爬，可是爬出來來

space53279 iT邦新手 5 級 ‧ 2019-07-23 14:42:17 檢舉

因為剛學python，所以還不太懂如何運用指令

froce iT邦大師 1 級 ‧ 2019-07-23 14:50:53 檢舉

放在你本文裡面的code block好嗎？

可以召喚一下小財神，改一下新手教程，把code block當成新手教程的一環嗎？XD

dragonH iT邦超人 5 級 ‧ 2019-07-23 14:51:42 檢舉

你這不是完整的 code 吧

而且你確定的 url 是長這樣嗎

還是你貼你參考的教學好了

froce iT邦大師 1 級 ‧ 2019-07-23 14:51:51 檢舉

然後稍微看了一下你的code，你是用什麼套件在跑爬蟲？

space53279 iT邦新手 5 級 ‧ 2019-07-23 15:05:40 檢舉

python3，從anaconda下載的

https://www.itread01.com/content/1542925386.html
這個是我下載的網址

froce iT邦大師 1 級 ‧ 2019-07-23 15:18:14 檢舉

你找的教學只教你一點點，去找別篇...

dragonH iT邦超人 5 級 ‧ 2019-07-23 15:19:26 檢舉

雖然底下有完整 code

但是他用的 selector 已經跟實際的不一樣了

space53279 iT邦新手 5 級 ‧ 2019-07-23 16:57:15 檢舉

恩恩
唉

japhenchen iT邦超人 1 級 ‧ 2019-07-24 08:16:29 檢舉

是抓這個頁面還有跟隨的頁面嗎？
https://www.tripadvisor.com.tw/Airline_Review-d8729076-Reviews-EVA-Air

回應額度太少........用完就成啞吧...

space53279 iT邦新手 5 級 ‧ 2019-07-25 08:30:37 檢舉

是的，沒錯，但總共有276頁，如何爬取所有資料，並儲存為一個檔案

登入發表討論

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友回答

立即登入回答

參賽組數

902 組

團體組數

37 組

累計文章數

19831 篇

完賽人數

528 人

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙

如何使用Python3中的jupyter抓取tripadvisor的評論資料

尚未有邦友回答

標記使用者