Day 16：爬蟲 + AI 整合做智慧藥品資料庫

2025 iThome 鐵人賽

DAY 16

生成式 AI

AI 藥師助手：打造人人都看得懂的藥品查詢系統系列第 16 篇

17th鐵人賽

tomato5678

2025-09-28 03:03:05

114 瀏覽

分享至

前言

到目前為止，我已經完成了幾個關鍵功能：

用爬蟲抓取官方藥品資料（Day 9）。
用 AI 把專業資訊轉成白話解釋（Day 10、Day 11）。
建立 SQLite 資料庫儲存藥品資料（Day 14）。
用 Streamlit 做查詢介面（Day 15）。

但這些功能目前是分散的：爬蟲一個程式、AI 一個 API 呼叫、資料庫一個獨立檔案。今天的挑戰就是把它們整合起來，未來只要輸入藥品名稱，就能：

自動查詢官方資料（如果沒資料就用爬蟲補）。
自動生成白話說明（透過 AI API）。
把結果存進 SQLite，方便之後快速查詢。

這樣一來，整個系統會更完整，未來也能加上搜尋、多語言、FAQ 自動生成等功能。

實作步驟

今天的程式分成三大部分：
1.爬蟲模組：輸入藥品名稱，回傳官方資料（成分、副作用、注意事項）。

2.AI 模組：把專業資訊丟進 API，回傳白話解釋。

3.資料庫模組：檢查是否已有資料，若沒有就新增。
核心程式流程就像這樣（簡化版示例）：

def get_medicine_info(name):
    # 1. 先查資料庫
    data = query_db(name)
    if data:
        return data
    
    # 2. 沒有就爬蟲抓取
    official_data = crawl_official(name)
    
    # 3. 丟給 AI 做白話翻譯
    ai_explain = call_ai_api(official_data)
    
    # 4. 存進資料庫
    save_to_db(name, official_data, ai_explain)
    
    return {
        "official": official_data,
        "ai": ai_explain
    }