數字不會說謊,它只是需要我們去翻開。
在連續三十天的鐵人賽挑戰後,我們其實已經慢慢養成一個習慣:看到問題,就會自然地想「能不能用 n8n 解決?」。
雖然有些情境,用 Google App Script 或其他工具也能做到,但既然這段時間已經熟悉了 n8n,順手做一個工作流反而更快。
今天要來試驗的,是 IThome 鐵人賽的完賽狀況。
參加鐵人賽有點像跑馬拉松:比起競爭,更多是自我挑戰。不過,偶爾也會好奇大家的參賽狀況,到底如何?
幸運的是,官方其實有公開頁面:
👉 https://ithelp.ithome.com.tw/2025ironman/signup/list
在 Day16 ~ Day21,我們玩過「簡單的爬蟲」,去爬一個書籍範例網站。當時的網站算「好爬」,就像是給新手練習用的。但真實情況呢?這次我們要挑戰的,就是 如何從鐵人賽的真實網站,抓下參賽數據,並整理成清楚的戰況表。
今天的模板在此下載(連結)
觀察後發現,這個頁面一共有 91 個分頁。
網址的規律是這樣的:
https://ithelp.ithome.com.tw/2025ironman/signup/list?page=n
因此我們需要一個 迴圈(loop),把這 91 頁的資訊都抓下來。
每個頁面都有這些資訊可以被擷取:
設計流程大致上是:
成果公開在這裡 👉
在真實網站操作,難免會遇到一些「卡住」的地方:
我們目前只做到:
👉 你可以進一步延伸:
這樣,你不只是在收集數據,而是能轉換成真正有趣的 社群觀察報告。
我建立了一個行銷技術交流群,專注討論 SEO、行銷自動化等主題,歡迎有興趣的朋友一起加入交流。
掃QR Code 或點擊圖片加入
另外也有一個TG 群,屬於更廣的遠距工作者,也歡迎持續關注。
Telegram 群組: https://t.me/tg_021up