iT邦幫忙

2025 iThome 鐵人賽

DAY 29
0
Software Development

從零開始學 Python系列 第 29

Day 29 – 專案規劃:迷你爬蟲工具

  • 分享至 

  • xImage
  •  

經過 28 天的學習,從 Python 的基礎語法開始,練習了變數、條件判斷、迴圈、函式,到中後段進入物件導向、模組匯入、檔案處理,再學了網頁爬蟲(requests + BeautifulSoup)以及 GUI 工具(tkinter)。今天是倒數第二天!我決定暫時不寫程式,而是進行期末專案的規劃。主題是 「迷你爬蟲工具」

專案定位

結合前幾天學到的模組,讓使用者可以透過視覺化介面(GUI)來執行基本的網頁爬蟲功能。

  • 一個桌面應用程式
  • 使用者只需要輸入網址,就能一鍵抓取資料
  • 適合學習爬蟲 + GUI 的入門者

需求規格

  1. 使用者在 GUI 輸入網址
  2. 提供至少兩種功能:
  • 抓取網頁標題
  • 抓取所有超連結
  1. 結果在視窗中顯示
  2. 可選:提供儲存功能,把結果寫入文字檔

系統架構

  • 爬蟲層(requests):負責發送 HTTP 請求、加上 headers 避免被伺服器擋掉
  • 解析層(BeautifulSoup):把 HTML 轉換成樹狀結構、使用 .title、.find_all() 等方法提取資料
  • 介面層(tkinter):建立 GUI 視窗,包含輸入框、按鈕、文字框,按鈕點擊後呼叫對應功能

專案設計流程

  1. 使用者輸入網址
  2. 按下「抓標題」按鈕 → 程式回傳網頁標題
  3. 按下「抓連結」按鈕 → 程式回傳該頁所有超連結
  4. 顯示結果在 GUI 文字框中
  5. (可選)按下「儲存結果」按鈕,把文字寫進檔案

Day 30 預計完成的項目

明天就是這次鐵人賽的最後一天,我會把今天規劃的內容全部實作出來,包含:

  • 完整程式碼
  • 功能展示
  • 收尾心得:30 天的學習體驗

上一篇
Day 28 – 綜合練習:爬蟲 + GUI 小工具
下一篇
Day 30 – 專案實作:迷你爬蟲工具
系列文
從零開始學 Python30
圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言