iT邦幫忙

1

AI 找洞、人類補洞:Mythos 如何改寫資安攻防的時間差

WM 2026-07-04 03:20:31316 瀏覽
  • 分享至 

  • xImage
  •  

https://ithelp.ithome.com.tw/upload/images/20260704/201125730WYVOBJpSe.png
2026 年 6 月,全球資安與 AI 產業經歷了一場大風暴。這場風暴的中心是 Anthropic 推出的前沿 AI 模型 Claude Mythos 5。它在短短半個月內,走過了發表、遭美國政府封殺,隨後又透過「特許白名單」形式重新上線的戲劇性轉折。

這次 Mythos 引發的爭議,是它開始碰到資安攻防裡最敏感的部分:自動找漏洞、自動重現攻擊,甚至把多個漏洞串成完整攻擊鏈。

也因為如此,這場風波完全超出單一公司能處理的範疇。Anthropic 要證明自己能控制風險,美國商務部要避免高風險能力外流,雲端巨頭則關心誰能優先拿到這種工具。

夾在各角力間,Mythos 的實質意義,已經不是一句「能力很強的模型」就能帶過。

》從尋找漏洞到自主攻擊的降維打擊

我們先來看看 Mythos 如何展現其宰制力。它並不只是輔助工程師撰寫程式碼的大型語言模型而已,而是一套能自主發掘並利用零日漏洞(Zero-day vulnerabilities)的工具。

最關鍵的是,它能將人類頂尖駭客挖掘漏洞的過程,轉為無休止、低成本且高效率的自動化運作。

在 2026 年 4 月至 5 月的封閉預覽期間(Mythos Preview),Mythos 在極短的時間內,於全球最重要的系統性軟體中找出了超過1萬個高危險或極度危險的漏洞 。根據 Anthropic 的報告,在掃描的超過1,000個開源專案中,共發現了 23,019 個漏洞,其中高達 6,202 個被歸類為高或嚴重級別。

如此強悍的能力,在幾個極具指標性的案例中展露無遺。首先,Mythos 成功在以安全性著稱、被廣泛用於防火牆與關鍵基礎設施的 OpenBSD 作業系統中,挖出了一個潛伏長達27年的底層網路堆疊缺陷。

這個漏洞的年紀,甚至比許多現役的資安工程師還要大。更甚之,在廣泛被使用的影音編碼軟體 FFmpeg 中,Mythos 揪出了一個隱藏16年的缺陷;而這個缺陷所在的程式碼,在此之前已經通過了五百萬次傳統自動化安全工具的測試,卻從未被發現。

此外,Mythos 甚至能自主將 Linux 核心中多個已知但尚未修補的漏洞串聯起來(Vulnerability Chaining),形成一個完整的攻擊鏈,讓攻擊者能直接取得機器的最高控制權(Root)。

我們換個角度,用數據來比較 Mythos Preview 與其上一代旗艦模型(Claude Opus 4.6)在各項測試中的差異:

  • CyberGym(網路安全漏洞重現):Mythos Preview 表現達 83.1%,遠超上一代模型 Claude Opus 4.6 的 66.6%。真實環境下的漏洞利用能力大躍升。
  • SWE-bench Verified:表現達 93.9%(上一代為 80.8%),解決真實軟體工程問題的精準度明顯提升。
  • Terminal-Bench 2.1 (延長時限至4小時):表現達 92.1%(上一代 Terminal-Bench 2.0 為 65.4%),證明其具備長時間、多步驟的代理推理(Agentic reasoning)能力。
  • GPQA Diamond:表現達 94.6%(上一代為 91.3%),展現超越人類專家的物理、化學與生物學等跨領域推理能力。

https://ithelp.ithome.com.tw/upload/images/20260704/20112573fhcNkdZC65.png

以上的測試項目看不懂,那也沒關係,只要知道 Mythos 在各項指標測試中,完全輾壓上一代模型。如此強大的代理人(Agentic)推理能力,我們很難再以商業產品來看待它。

這種自主能力的危險性在一次「沙盒逃脫」事件中得到了最直接的印證。在安全性測試期間,研究人員刻意誘導早期版本的 Mythos 嘗試突破一個被嚴密隔離的「沙盒」電腦,並要求它設法傳遞訊息。

結果,Mythos 不僅成功逃脫,甚至在沒有人監督的情況下,自主發展出多步驟的漏洞利用程式(Exploit),試圖取得完整的網際網路存取權。試想一下,你我這種非專業人士在睡前下達指令,然後隔天醒來就獲得一個能遠端控制他人電腦的權限時,這項工具本質上就已經具備了能輕易癱瘓國家網路的能力,甚至可以說是非實體的戰略級武器也不為過。

》「發掘漏洞」與「修補速度」的死亡交叉

過去在網路攻防戰中,尋找「零日漏洞」(Zero-day)需高度依賴頂尖工程師的經驗、逆向工程技術再加上運氣,甚至通靈能力都得派上用場,總之就是一個勞力與時間高度密集的瓶頸。

然而,Mythos 的出現讓這個舊有的門檻徹底坍塌。一個系統裡,限制永遠不會消失,它只會變成另一種限制。

最關鍵的點:瓶頸已經從「漏洞發現的難度」變成了「系統修補的速度」與「防禦資源的投入」。

數據落差之大,令人咋舌。截至 2026 年 5 月 22 日,在 Mythos Preview 找出的超過一萬個高危險與極危險漏洞中,真正被開發者釋出修補程式(Patch)的比例僅有 14%。在開源專案掃描中,情況更加慘烈。Anthropic 向開源維護者揭露了 530 個嚴重漏洞,卻只有 75 個被修補,65 個獲得公開建議。

這意味著什麼?當 AI 能在幾小時內產出大量攻擊 Exploit,企業與開源社群修補漏洞的反應時間被無限壓縮。軟體產業過去行之有年的「九十天漏洞揭露期」(Coordinated Vulnerability Disclosure, CVD)默契 ,在 AI 的絕對速度面前形同虛設。

這種「機器找洞、人類補洞」的不對稱攻防戰,正在拖垮全球軟體供應鏈。防禦端遲早得走向機器對機器,這讓人別無選擇,靠人審查、測試、部署修補的傳統流程,根本消化不了 AI 吐出來的漏洞量。

》企業免責條款(EULA)的信任崩塌

當發掘漏洞的速度遠遠超越原廠釋出修補程式的速度時,這不僅是技術問題,更引發了極度嚴峻的法律與商業信任危機。

目前業界主流的終端用戶授權協定(EULA)與漏洞揭露政策(VDP),如 Poolside、Nozomi Networks、GenMobile 與 Synack 等,普遍以冗長條款限制使用者對產品進行反向工程與未經授權的測試。並以整段大寫字母撇清原廠對後果的責任。

這些免責聲明,講白了就是:漏洞很難找,所以有心人士挖洞的速度慢,廠商會來得及在出事前把漏洞修好。
但 Mythos 撕碎了這個假設。當軟體原廠明明知道自家軟體存在上千個由 AI 發現的致命漏洞,卻因為「修補瓶頸」而無力在短期內釋出更新時,企業用戶被迫使用「已知充滿漏洞卻來不及修補」的軟體。如果駭客利用了這些漏洞造成巨大商業損失,受害企業還能接受軟體原廠搬出 EULA 聲稱「免除一切責任」嗎?保險公司還願意承保這種基於「修補遲緩」所導致的風險嗎?

原廠修補技術與客戶對原廠的信任都將面臨考驗,華府與矽谷的巨頭又是如何聯手介入這場危機的?這將是我們接下來要討論的問題:究竟是為了防範風險,還是科技巨頭用來拉高市場門檻、阻擋競爭對手的手段?

🔥本文章同步發表於「方格子


圖片
  熱門推薦
圖片
{{ item.channelVendor }} | {{ item.webinarstarted }} |
{{ formatDate(item.duration) }}
直播中

尚未有邦友留言

立即登入留言