iT邦幫忙

第 11 屆 iThome 鐵人賽

DAY 4
0
自我挑戰組

自我學習python系列 第 29

Requests抓取html

  • 分享至 

  • twitterImage
  •  

今天要來看如何用requests抓取html
跟之前一樣要使用requests要先安裝
pip install requests

今天我們想抓這個網頁的html
https://ithelp.ithome.com.tw/upload/images/20191013/20121024xWRVxwg0zT.png

https://ithelp.ithome.com.tw/upload/images/20191013/20121024Ywg5HdzV6N.png

這裡的<response [200]> 其中的200代表的是有成功從網頁中獲得資料
連線成功的意思
而現在我們只有讀取到而已,還沒有把資料保存下來所以我們要保存
用一個變數去儲存他,這裡我們用res

requests.get('https://www.ptt.cc/bbs/movie/index.html')

而我們需要他的txt檔去查看html存下來的紀錄

res.text

https://ithelp.ithome.com.tw/upload/images/20191013/20121024fcwQKaAZ27.png
而如何知道抓下來的跟網頁的是否一樣
https://ithelp.ithome.com.tw/upload/images/20191013/201210249lr9zz8waQ.png
我們記住剛剛抓下來的這行
取查看剛剛ptt的網頁原始碼
https://ithelp.ithome.com.tw/upload/images/20191013/20121024evneIS4kly.png
就能發現成功抓到囉!


上一篇
檔案寫入
下一篇
30天最後的心得
系列文
自我學習python30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言