把 OWASP LLM Top 10 2025 的十個風險一個一個看完,目的是先了解有哪些風險以及這些風險的防禦方法,後續可以針對這些防範方法進行實作。
共通模版:
- **風險描述**:解釋這個風險是什麼
- **防禦策略**:可以採取哪些策略或防線,來降低此風險發生或影響的可能性
攻擊者透過內容(文字、圖片等資料)修改或是覆蓋掉原本的上下文或是系統指令,導致 LLM 產生非預期輸出(錯誤、惡意)、泄露出敏感資訊、執行未授權的操作
LLM 在處理或生成回應時,可能會意外洩露敏感資訊(個人、公司內部機密演算法)
LLM 的整個供應鏈中產生的漏洞可能會損害訓練資料、模型和部署平台的完整性。進而導致偏頗的輸出、安全性漏洞。與傳統軟體漏洞類似,發生在程式的相依套件中,甚至會延伸到第三方的預訓練模型與資料
在預訓練(pre-training)、微調(fine-tuning)或嵌入(embedding)資料階段遭到惡意操縱,進而引入弱點、後門或偏見
過度信任 LLM 的輸出,若未經過適當驗證或過濾就直接使用,導致錯誤決策
給予 LLM 過多的自主權,導致其執行未經授權的操作或做出不當決策
系統提示的目的是去引導模型輸出以符合應用需求,但它同時可能不小心放入機密或敏感資料。一旦被發現,這些資訊就可能被用來促成其他攻擊
若 Embedding 缺乏妥善的存取控制與資料管理,可能導致敏感資訊外洩、跨租戶情境下的知識洩露與衝突;同時存在嵌入反推、資料投毒等攻擊風險,不僅危及資料完整性與機密性,也可能改變模型的原始行為
LLM 非常容易產生錯誤的資訊,這些輸出表面可信卻可能完全沒有根據,若使用者過度依賴而未驗證,便可能在決策、法律、醫療或軟體開發中引入嚴重風險,造成資安漏洞、聲譽受損甚至法律責任。例如:攻擊者發現 LLM 經常產出特定的「幻覺套件名稱」,攻擊者就可以利用這點上傳惡意套件至開源庫,導致開發者無意中安裝,進而被植入後門或惡意程式碼