iT邦幫忙

2021 iThome 鐵人賽

DAY 5
0
自我挑戰組

初次接觸爬蟲的學習系列 第 5

細節的重要性

  • 分享至 

  • xImage
  •  

上一篇我實作了第一個爬蟲,之後我又有練習了類似的方式爬其他的網站,結果出現了一些小問題。當時我程式碼是改成這樣的,就是多加了圖像連結。
https://ithelp.ithome.com.tw/upload/images/20210910/20141074ZwhPxc1uiV.png
結果出來的效果不盡理想,就多了些我沒有要的東西
https://ithelp.ithome.com.tw/upload/images/20210910/20141074tHJV52LVjf.png
所以我再次去研究網站的控制台,發現其實分得非常細,而我設定的太粗略,以至於程式將我所設定內包含的都讀出來。下面我講一下我所需要的資料分別在哪裡。

  1. 電影的海報圖
    可以看到是在release_foto中的img
    https://ithelp.ithome.com.tw/upload/images/20210910/20141074B4DkOJ6eho.png
  2. 標題及連結
    而這個則在release_info中的release_movie_name
    https://ithelp.ithome.com.tw/upload/images/20210910/20141074Mv1dkmHmDV.png
  3. 簡介
    最後是一樣在release_info中的release_text
    https://ithelp.ithome.com.tw/upload/images/20210910/20141074KfodxsCNSX.png
    然後就將這些資訊元素詳細的寫入程式碼中,這樣就可以讓程式更清楚知道我需要的資訊。
    https://ithelp.ithome.com.tw/upload/images/20210910/201410745UGVipL78S.png
    以下是做出來的成果,這樣看上去就像一個個電影欄位
    https://ithelp.ithome.com.tw/upload/images/20210910/20141074oc8RCanmSF.png

上一篇
第一次的爬蟲(2)
下一篇
用爬蟲下載圖片
系列文
初次接觸爬蟲的學習30
圖片
  直播研討會
圖片
{{ item.channelVendor }} {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言