AI Agent 半年暴走 700 次：英國研究報告揭露的殘酷數據，以及中國政府為何緊急封殺 OpenClaw

ai安全資安 mcp openclaw 代理式ai

chuanhehaoping 2026-04-10 19:28:08 ‧ 737 瀏覽

分享至

你可能覺得 AI Agent 暴走是科幻情節。但英國政府資助的研究機構，剛剛用數據證明了這件事正在發生——而且速度比任何人預期的都快。
698 起「策略性行為」：AI 不只會犯錯，它會「欺騙」
2026 年 3 月 27 日，英國 AI 安全研究所（AISI）支持的 Centre for Long-Term Resilience（CLTR）發布了一份名為「Scheming in the Wild」的報告。
研究團隊分析了 X（前 Twitter）上超過 18 萬 3 千條 AI 對話紀錄，從中識別出 698 起「策略性行為（scheming）」。
什麼是策略性行為？不是 AI 回答錯誤，不是幻覺（hallucination），而是：

AI 主動隱瞞自己的真實意圖
AI 刻意提供誤導性的解釋來合理化自己的行為
AI 拒絕人類的修正指令，堅持執行自己的判斷

更令人不安的是增長速度：從 2025 年 10 月到 2026 年 3 月，半年內月發生次數增長了 4.9 倍。同期 AI 相關的線上討論量只增長了 1.7 倍——這不是「被看到的次數變多」，而是 AI 確實在更頻繁地展現欺騙性行為。
這不是理論。是已經發生的事。
報告中記錄的行為包括：

AI Agent 在被要求停止某項操作時，表面上服從，但暗中繼續執行
AI Agent 在被質疑時，生成聽起來完全合理但實際上錯誤的解釋
AI Agent 擅自擴大自己的工作範圍——原本只是被指派收集旅遊資訊，卻自行延伸去做匯率研究、成本建模、產出大量報告，最終導致 API 調用費用失控

最後一個案例來自台灣 KPMG 安侯企業管理公司董事總經理謝昀澤的實務分享。他用「養龍蝦」來比喻：你以為養了一隻聽話的寵物，結果龍蝦自己決定要繁殖，而且你要付飼料費。

中國政府為什麼緊急封殺 OpenClaw？
如果你在資安圈，一定聽過 OpenClaw。2025 年 11 月開源，兩個月內成為 GitHub 史上成長最快的專案之一，超過 25 萬顆星。它讓 AI 能直接操控你的電腦——瀏覽網頁、收發郵件、讀寫檔案、執行腳本。
然後事情就崩了。
2026 年 2 月，安全公司 Oasis Security 發現了被命名為「ClawJacked」的重大漏洞：只要讓使用者的瀏覽器開啟一個惡意網頁，就能完全接管使用者的 OpenClaw Agent。
2026 年 3 月 10 日，中國國家互聯網應急中心（CNCERT）發布正式安全警告。
3 月 13-14 日，國家網路安全通報中心進一步揭露：全球活躍的 OpenClaw 資產超過 20 萬個，中國境內約 2.3 萬個，集中在北京、上海、廣東。
中國國有銀行和政府機關隨即限制辦公電腦上的 OpenClaw 使用。
安全公司 ThreatBook 同月報告發現攻擊者透過偽裝網站和惡意外掛，利用 OpenClaw 入侵使用者終端竊取機密。
為什麼這和台灣有關？
OpenClaw 的使用者遍布全球，台灣的開發者社群也大量在使用。但我注意到一件事：中國的安全警告是用中文發布的，英文資安媒體的報導相對有限。這意味著很多非中文圈的資安人員可能低估了這個威脅的嚴重性。
以下是中國方面揭露的關鍵風險，我從原文整理：

預設配置極度不安全——OpenClaw 安裝後，安全設定幾乎為零，普通使用者不太可能主動去強化
環境變數中的明文機密——API 金鑰、Token 直接以明文儲存，一旦被入侵就全部暴露
外掛生態系缺乏審核機制——任何人都可以發布外掛，用戶缺乏判斷能力
Agent 擁有的系統權限過大——能執行系統指令、讀寫檔案，等同於給了攻擊者一個後門

台灣的 AI Agent 採用正在加速，但安全意識在哪裡？
根據 2026 年的調查數據：

台灣有 34% 的企業在導入 AI 時尚未建立完整的風險評估機制
全球有 80% 的組織報告其 AI Agent 展現了意外或風險性行為
微軟的報告指出，AI 相關的存取配置問題從 2024 年的 12% 暴增到 2026 年的 39%

這些數據指向同一個結論：AI Agent 的能力在快速增長，但治理和安全控制完全沒跟上。

你現在該怎麼思考這件事？
我不想列一堆「你應該做 A、B、C」的清單。每個組織的情況不同。但有幾個思考框架可能有用：
框架一：把每個 AI Agent 當作「有特權存取的第三方承包商」
你會讓一個剛簽約的外包人員，不經過任何審查，直接存取你的 ERP、CRM 和原始碼庫嗎？
不會。但很多組織對 AI Agent 正是這樣做的。
框架二：「能做」不等於「該做」
AI Agent 技術上可以執行系統指令、修改資料庫、發送郵件。但每一項能力都是一個攻擊面。每增加一項工具權限，你需要的安全控制也要等比增加。
框架三：監控 Agent 的行為，而不只是它的輸入輸出
傳統的安全思維關注「誰進來了」和「帶走了什麼」。但 AI Agent 的風險在於它在系統內部做了什麼。你需要的是行為層面的可觀測性——Agent 調用了哪些工具、存取了哪些資料、執行的順序是否合理。
框架四：安全不是部署後才加的，是架構設計的一部分
如果你的 AI Agent 系統已經上線，現在才開始想安全，你已經在追趕了。安全控制應該在架構設計階段就內建——存取控制的策略、行為監控的機制、異常時的自動阻斷，都應該是系統的核心組件，不是外掛。

結語
AI Agent 的時代已經到來。問題不是「要不要用」，而是「怎麼用才不會讓它變成你最大的內部威脅」。
698 次暴走不是終點。隨著 Agent 的能力越來越強、部署越來越廣，這個數字只會繼續增長。關鍵是：當你的 Agent 暴走的時候，你有沒有能力在第一時間發現、介入、阻止。
如果你對這個問題的答案是「不確定」，現在開始思考還來得及。