AI 找洞、人類補洞：Mythos 如何改寫資安攻防的時間差

anthropic mythos ai 網路安全漏洞

WM 2026-07-04 03:20:31 ‧ 1152 瀏覽

分享至

2026 年 6 月，全球資安與 AI 產業經歷了一場大風暴。這場風暴的中心是 Anthropic 推出的前沿 AI 模型 Claude Mythos 5。它在短短半個月內，走過了發表、遭美國政府封殺，隨後又透過「特許白名單」形式重新上線的戲劇性轉折。

這次 Mythos 引發的爭議，是它開始碰到資安攻防裡最敏感的部分：自動找漏洞、自動重現攻擊，甚至把多個漏洞串成完整攻擊鏈。

也因為如此，這場風波完全超出單一公司能處理的範疇。Anthropic 要證明自己能控制風險，美國商務部要避免高風險能力外流，雲端巨頭則關心誰能優先拿到這種工具。

夾在各角力間，Mythos 的實質意義，已經不是一句「能力很強的模型」就能帶過。

》從尋找漏洞到自主攻擊的降維打擊

我們先來看看 Mythos 如何展現其宰制力。它並不只是輔助工程師撰寫程式碼的大型語言模型而已，而是一套能自主發掘並利用零日漏洞（Zero-day vulnerabilities）的工具。

最關鍵的是，它能將人類頂尖駭客挖掘漏洞的過程，轉為無休止、低成本且高效率的自動化運作。

在 2026 年 4 月至 5 月的封閉預覽期間（Mythos Preview），Mythos 在極短的時間內，於全球最重要的系統性軟體中找出了超過1萬個高危險或極度危險的漏洞。根據 Anthropic 的報告，在掃描的超過1,000個開源專案中，共發現了 23,019 個漏洞，其中高達 6,202 個被歸類為高或嚴重級別。

如此強悍的能力，在幾個極具指標性的案例中展露無遺。首先，Mythos 成功在以安全性著稱、被廣泛用於防火牆與關鍵基礎設施的 OpenBSD 作業系統中，挖出了一個潛伏長達27年的底層網路堆疊缺陷。

這個漏洞的年紀，甚至比許多現役的資安工程師還要大。更甚之，在廣泛被使用的影音編碼軟體 FFmpeg 中，Mythos 揪出了一個隱藏16年的缺陷；而這個缺陷所在的程式碼，在此之前已經通過了五百萬次傳統自動化安全工具的測試，卻從未被發現。

此外，Mythos 甚至能自主將 Linux 核心中多個已知但尚未修補的漏洞串聯起來（Vulnerability Chaining），形成一個完整的攻擊鏈，讓攻擊者能直接取得機器的最高控制權（Root）。

我們換個角度，用數據來比較 Mythos Preview 與其上一代旗艦模型（Claude Opus 4.6）在各項測試中的差異：

CyberGym（網路安全漏洞重現）：Mythos Preview 表現達 83.1%，遠超上一代模型 Claude Opus 4.6 的 66.6%。真實環境下的漏洞利用能力大躍升。
SWE-bench Verified：表現達 93.9%（上一代為 80.8%），解決真實軟體工程問題的精準度明顯提升。
Terminal-Bench 2.1 (延長時限至4小時)：表現達 92.1%（上一代 Terminal-Bench 2.0 為 65.4%），證明其具備長時間、多步驟的代理推理（Agentic reasoning）能力。
GPQA Diamond：表現達 94.6%（上一代為 91.3%），展現超越人類專家的物理、化學與生物學等跨領域推理能力。

以上的測試項目看不懂，那也沒關係，只要知道 Mythos 在各項指標測試中，完全輾壓上一代模型。如此強大的代理人（Agentic）推理能力，我們很難再以商業產品來看待它。

這種自主能力的危險性在一次「沙盒逃脫」事件中得到了最直接的印證。在安全性測試期間，研究人員刻意誘導早期版本的 Mythos 嘗試突破一個被嚴密隔離的「沙盒」電腦，並要求它設法傳遞訊息。

結果，Mythos 不僅成功逃脫，甚至在沒有人監督的情況下，自主發展出多步驟的漏洞利用程式（Exploit），試圖取得完整的網際網路存取權。試想一下，你我這種非專業人士在睡前下達指令，然後隔天醒來就獲得一個能遠端控制他人電腦的權限時，這項工具本質上就已經具備了能輕易癱瘓國家網路的能力，甚至可以說是非實體的戰略級武器也不為過。

》「發掘漏洞」與「修補速度」的死亡交叉

過去在網路攻防戰中，尋找「零日漏洞」（Zero-day）需高度依賴頂尖工程師的經驗、逆向工程技術再加上運氣，甚至通靈能力都得派上用場，總之就是一個勞力與時間高度密集的瓶頸。

然而，Mythos 的出現讓這個舊有的門檻徹底坍塌。一個系統裡，限制永遠不會消失，它只會變成另一種限制。

最關鍵的點：瓶頸已經從「漏洞發現的難度」變成了「系統修補的速度」與「防禦資源的投入」。

數據落差之大，令人咋舌。截至 2026 年 5 月 22 日，在 Mythos Preview 找出的超過一萬個高危險與極危險漏洞中，真正被開發者釋出修補程式（Patch）的比例僅有 14%。在開源專案掃描中，情況更加慘烈。Anthropic 向開源維護者揭露了 530 個嚴重漏洞，卻只有 75 個被修補，65 個獲得公開建議。

這意味著什麼？當 AI 能在幾小時內產出大量攻擊 Exploit，企業與開源社群修補漏洞的反應時間被無限壓縮。軟體產業過去行之有年的「九十天漏洞揭露期」（Coordinated Vulnerability Disclosure, CVD）默契，在 AI 的絕對速度面前形同虛設。

這種「機器找洞、人類補洞」的不對稱攻防戰，正在拖垮全球軟體供應鏈。防禦端遲早得走向機器對機器，這讓人別無選擇，靠人審查、測試、部署修補的傳統流程，根本消化不了 AI 吐出來的漏洞量。

》企業免責條款（EULA）的信任崩塌

當發掘漏洞的速度遠遠超越原廠釋出修補程式的速度時，這不僅是技術問題，更引發了極度嚴峻的法律與商業信任危機。

目前業界主流的終端用戶授權協定（EULA）與漏洞揭露政策（VDP），如 Poolside、Nozomi Networks、GenMobile 與 Synack 等，普遍以冗長條款限制使用者對產品進行反向工程與未經授權的測試。並以整段大寫字母撇清原廠對後果的責任。

這些免責聲明，講白了就是：漏洞很難找，所以有心人士挖洞的速度慢，廠商會來得及在出事前把漏洞修好。
但 Mythos 撕碎了這個假設。當軟體原廠明明知道自家軟體存在上千個由 AI 發現的致命漏洞，卻因為「修補瓶頸」而無力在短期內釋出更新時，企業用戶被迫使用「已知充滿漏洞卻來不及修補」的軟體。如果駭客利用了這些漏洞造成巨大商業損失，受害企業還能接受軟體原廠搬出 EULA 聲稱「免除一切責任」嗎？保險公司還願意承保這種基於「修補遲緩」所導致的風險嗎？

原廠修補技術與客戶對原廠的信任都將面臨考驗，華府與矽谷的巨頭又是如何聯手介入這場危機的？這將是我們接下來要討論的問題：究竟是為了防範風險，還是科技巨頭用來拉高市場門檻、阻擋競爭對手的手段？

🔥本文章同步發表於「方格子」

熱門推薦

{{ item.channelVendor }} | {{ item.webinarstarted }} |

直播中

尚未有邦友留言

立即登入留言

15th鐵人賽 16th鐵人賽 13th鐵人賽 14th鐵人賽 17th鐵人賽 12th鐵人賽 11th鐵人賽鐵人賽 2019鐵人賽 javascript 2018鐵人賽 python 2017鐵人賽 windows php c# linux windows server css react

IT邦幫忙