到目前為止,我們已經會呼叫 AI API、設計 Prompt,甚至讓 AI 自動摘要。但如果我們要做一個完整的專案,光靠 AI 內建的知識還不夠。因為 AI 的知識可能過時,也可能會亂回答。
解決辦法,就是給 AI 一個可靠的知識庫。今天,我要帶大家研究如何找到公開的藥品資料來源。
AI 本身不知道每一個藥品的最新資訊
官方資料才是最可信的
有了資料庫,未來可以做 RAG(檢索增強生成),讓 AI 先查資料再回答
我找到幾個常見的公開來源:
1.衛福部食品藥物管理署(TFDA)
2.健保署藥品代碼資料
3.國際藥品資料
先不急著把所有資料都下載,先自己做一個小資料集:
[
{
"藥品名稱": "普拿疼",
"成分": "Acetaminophen",
"功效": "退燒、止痛",
"副作用": "肝功能異常(過量時風險高)"
},
{
"藥品名稱": "阿司匹靈",
"成分": "Aspirin",
"功效": "止痛、消炎、抗血小板凝集",
"副作用": "腸胃不適、出血風險"
}
]
這樣的結構簡單明瞭,之後無論是存進資料庫,還是讓 AI 查詢,都能直接用。
今天的進度:
1.找到幾個可用的 公開藥品資料來源
2.思考未來的資料結構(名稱 / 成分 / 功效 / 副作用)
3.建立一個小型測試資料集
明天我會用爬蟲抓藥品資料,存成 CSV!