iT邦幫忙

2021 iThome 鐵人賽

DAY 15
0
自我挑戰組

初次接觸爬蟲的學習系列 第 15

今日份的爬蟲

這次找了個漫畫網站來爬關於一部漫畫的資訊。本來想要將資訊一個個羅列出來比較整齊,結果遇到了點困難無法按照規所想呈現結果。
下面先來看看程式碼吧~
https://ithelp.ithome.com.tw/upload/images/20210920/20141074BF1Ke8GXRo.png
https://ithelp.ithome.com.tw/upload/images/20210920/20141074rAQEVat8aM.png
大部分程式碼都熟悉了,只不過困難部分果然是爬取詳細內容,這次也是講到陣列中’詳情’的部分。本來是想要什麼作者阿、出版日期阿…各個單獨顯示,但是要我詳細寫他身處於那裡時在寫不出來,就是不知道寫法吧,看是看得懂,血是寫不出來。以下是我所要資料的位置。
https://ithelp.ithome.com.tw/upload/images/20210920/20141074sS5WCmhJ7C.png
https://ithelp.ithome.com.tw/upload/images/20210920/20141074xZLUq4x1jX.png
實在是太多相似的tag,使的我只好直接粗糙的將全部詳情列出來,就是以下執行出來的結果
https://ithelp.ithome.com.tw/upload/images/20210920/20141074AroW0C2tP7.png
最後,因為我發現他的漫畫網址是以數字編號的,所以就試著更改根目錄的數字,結果就出現另一部漫畫的資料。所以說如果我知道所有漫畫的編碼,我就可以隨時查找我所需的資料。
https://ithelp.ithome.com.tw/upload/images/20210920/201410746uUijGqSFm.png
https://ithelp.ithome.com.tw/upload/images/20210920/20141074e1ThJHJqPb.png


上一篇
xlsx檔與json檔轉換
下一篇
論解決問題的爽度XD
系列文
初次接觸爬蟲的學習30

尚未有邦友留言

立即登入留言