到目前為止,我們已經學了字串、迴圈、函式、檔案操作、模組套件、爬蟲… 今天我們要把這些能力串起來,做一個「爬蟲自動化整理系統」。
import requests
from bs4 import BeautifulSoup
import os
from datetime import datetime
# 1. 抓取資料
url = "https://www.ithome.com.tw/"
res = requests.get(url)
soup = BeautifulSoup(res.text, "html.parser")
titles = [t.text.strip() for t in soup.find_all("h2")[:10]]
# 2. 建立資料夾
folder = "news_data"
if not os.path.exists(folder):
os.mkdir(folder)
# 3. 以日期命名檔案
today = datetime.now().strftime("%Y%m%d")
file_path = os.path.join(folder, f"{today}.txt")
# 4. 寫入檔案
with open(file_path, "w", encoding="utf-8") as f:
for i, title in enumerate(titles, 1):
f.write(f"{i}. {title}\n")
print("今日新聞標題已儲存到", file_path)
請嘗試:
這個挑戰能讓你實際體驗「資料獲取 → 整理 → 存檔」的流程。
---by Ricky