第九屆 優選

software-dev
爬蟲始終來自於墮性
Howard

系列文章

DAY 21

iThelp oAuth 登入

定義目標 在這個系列的「IT 鐵人排程發文」這篇文章底下,pilipala 提到想知道如何用 request 來做登入的動作,那我們今天就來實作 iThelp...

DAY 22

台鐵(半)自動訂票

定義目標 台鐵網站一直都很古老,訂票網站更是落後,看了一下似乎有 app 做出一鍵訂票的功能,但好像後續又被台鐵擋住(?)。那麼作為爬蟲,理應是人工能做的流程爬...

DAY 23

改造台鐵訂票全自動

定義目標 昨天我們實作了台鐵半自動台鐵訂票,雖然已經大幅減少我們人工流程的時間,但肯定不是完美,我們今天就來將驗證碼的部分也自動化。 先 demo 一下今天結果...

DAY 24

使用模擬器做台鐵訂票爬蟲

定義目標 在一連串爬蟲的研究之後會體悟一點,玩爬蟲是不是都必須具備高深的 javascript 和網路概念的人才能玩?答案是否的,不過你具備這些能力的話,會更事...

DAY 25

NBA 即時比分

定義目標 曾經一兩次有接觸過博弈類型的需求,都是要製作即時比分和消息販賣(不過都沒有接下就是),他們需要各種比賽的比分顯示,包含籃球、足球、網球、高球、羽球等等...

DAY 26

NBA 新聞爬取

定義目標 昨天我們做抓了 NBA 的 scoreboard,那麼今天我們持續昨天的主題。博弈廠商除了要分數之外,他們還希望抓取新聞呈現在頁面中,讓使用者能夠取得...

DAY 27

好爬蟲,不玩嗎?

為什麼要玩爬蟲 科技始終來自於惰性,因為想要偷懶,希望能把麻煩事一次解決,所以自動化一直是我很感興趣的題目。也因為自己是名 Web 工程師,所以對於網路的自動化...

DAY 28

工欲善其事,必先利其器(上)

玩爬蟲我們必須借重很多工具來觀察和測試,有適合的工具才能夠幫助我們快速釐清線索,有了線索之後,我們也必須先快速測試,解決 key part,再把整給流程釐清之後...

DAY 29

爬蟲原則和技巧

在實作之前,我們必須了解一些關於玩爬蟲會用到的網頁基本原則和爬蟲技巧: 1. 任何 request 都是無狀態機制 (Stateless) 在大部分的狀況下,每...

DAY 30

牛刀小試 - IT 鐵人瀏覽數

好的,經過幾天的基礎建設,想必大家也都躍躍欲試了,我們今天正式進入實作部分。在每次實作,我們都會分為幾個步驟: 1. 起源,定義目標 在最一開始,我們一定要知道...