iT邦幫忙

0

如何使用Python3中的jupyter抓取tripadvisor的評論資料

想請問一下,要如何從tripadvisor的網站中抓取長榮航空評論文字和分數
並且抓取每一頁的資料
最後儲存成一個檔案
以利之後的分析

小妹在這裡懇求各位的幫忙,拜託大家了

看更多先前的討論...收起先前的討論...
dragonH iT邦高手 1 級 ‧ 2019-07-23 14:31:08 檢舉
爬蟲
對,可是我編寫的程式怪怪的,所以想問一下,程式碼如何編寫
dragonH iT邦高手 1 級 ‧ 2019-07-23 14:34:04 檢舉
要問程式

就把code貼出來囉

記得 code 別貼圖
ant1017 iT邦新手 4 級 ‧ 2019-07-23 14:34:44 檢舉
如何奇怪,方便將你覺得怪的地方PO出來,讓大家幫你解惑..
def run(self):
# 1.Find URL
for i in range(0, self.max_num):
url = ("https://www.tripadvisor.com.tw/Airline_Review-d8729076-Reviews-or10-EVA-Air".format(i*30))
# 2.Send Request, Get Response
html = self.parse_url("https://www.tripadvisor.com.tw/Airline_Review-d8729076-Reviews-or10-EVA-Air")
# 3.Get item
if html:
item = self.parse_html(html)
# 4.save information
self.save_item(item)
我試著用網路上教授的爬,可是爬出來來
因為剛學python,所以還不太懂如何運用指令
froce iT邦大師 6 級 ‧ 2019-07-23 14:50:53 檢舉
放在你本文裡面的code block好嗎?

可以召喚一下小財神,改一下新手教程,把code block當成新手教程的一環嗎?XD
dragonH iT邦高手 1 級 ‧ 2019-07-23 14:51:42 檢舉
你這不是完整的 code 吧

而且你確定的 url 是長這樣嗎

還是你貼你參考的教學好了
froce iT邦大師 6 級 ‧ 2019-07-23 14:51:51 檢舉
然後稍微看了一下你的code,你是用什麼套件在跑爬蟲?
python3,從anaconda下載的

https://www.itread01.com/content/1542925386.html
這個是我下載的網址
froce iT邦大師 6 級 ‧ 2019-07-23 15:18:14 檢舉
你找的教學只教你一點點,去找別篇...
dragonH iT邦高手 1 級 ‧ 2019-07-23 15:19:26 檢舉
雖然底下有完整 code

但是他用的 selector 已經跟實際的不一樣了
恩恩
是抓這個頁面還有跟隨的頁面嗎?
https://www.tripadvisor.com.tw/Airline_Review-d8729076-Reviews-EVA-Air



回應額度太少........用完就成啞吧...
是的,沒錯,但總共有276頁,如何爬取所有資料,並儲存為一個檔案

尚未有邦友回答

立即登入回答