iT邦幫忙

鐵人檔案

2021 iThome 鐵人賽
回列表
自我挑戰組

初次接觸爬蟲的學習 系列

第一次在網路上分享自己的學習,主要是以我學習過程的實作進行分享。

鐵人鍊成 | 共 30 篇文章 | 5 人訂閱 訂閱系列文 RSS系列文
DAY 1

使用工具測試

這次我是要使用node.js來學習爬蟲。為什麼會用node.js呢?一開始我看許多人是用python,之後就看到我沒看過的node.js,且剛好那時有人跟我科普...

2021-09-06 ‧ 由 pinyi 分享
DAY 2

Node套件運用測試

因為我看到說node可以利用套件來使撰寫程式較簡單方便些,所以我這邊就想用express套件來做個簡單的下載與應用,也算是我入門node的練習吧。 一開始建一個...

2021-09-07 ‧ 由 pinyi 分享
DAY 3

第一次的爬蟲

老實說我就是一菜鳥小白,學習程式設計也不過一年多吧,而且也不是特別拿手,就是希望能透由這次的自主學習多得到些樂趣,能夠繼續堅定我走程式設計這條路的心。這是我第一...

2021-09-08 ‧ 由 pinyi 分享
DAY 4

第一次的爬蟲(2)

那我就延續上一篇的實作吧!已經將會用到的套件裝上,並且在網站的控制室找到所需的資訊位置,接下來就是撰寫程式啦!下面我先用express套件來簡單架設伺服器,以便...

2021-09-09 ‧ 由 pinyi 分享
DAY 5

細節的重要性

上一篇我實作了第一個爬蟲,之後我又有練習了類似的方式爬其他的網站,結果出現了一些小問題。當時我程式碼是改成這樣的,就是多加了圖像連結。結果出來的效果不盡理想,就...

2021-09-10 ‧ 由 pinyi 分享
DAY 6

用爬蟲下載圖片

這次我要將電影的海報下載下來,那我們就開始吧。依賴包主要是這兩個以及所要取得資料的網頁路由接下來利用cheerio套件取得資訊找到圖片連結後將其印出來,然後利用...

2021-09-11 ‧ 由 pinyi 分享
DAY 7

玩玩Node.js定時器

這篇我是練習node.js關於定時的一些實作,其實都是些簡單的練習。第一個部分是setTimeout(),就只是單純經過幾秒做事這樣。就結果其實看不出來到底有沒...

2021-09-12 ‧ 由 pinyi 分享
DAY 8

定時器爬蟲練習

這次我用上篇練習的基本定時器進行爬蟲,但是過程中遇到了困難,總感覺連資料都沒辦法好好抓取,所以只好先用之前的程式碼來進行練習。我是用之前本周電影的網頁來進行定時...

2021-09-13 ‧ 由 pinyi 分享
DAY 9

不知道有沒有人可以幫我解答一下T_T

基於上一篇我認為要再多練習各網站的爬蟲,所以我再次挑戰上篇失敗的爬蟲,但是還是爬不出東西,不知道是我對於程式碼的運用、還是對於html的理解不夠通透。總之我本來...

2021-09-14 ‧ 由 pinyi 分享
DAY 10

想要爬個資料也困難重重

這邊先說一下,關於上一篇的程式碼好像有些問題,我這次找了其他資料練習,先用了另一組程式抓取,確認抓取成功後,我再用跟上次相同的程式碼更正細節後再次抓取,結果卻是...

2021-09-15 ‧ 由 pinyi 分享