AI 戰爭2026年5月3日

Claude Mythos 先給防守者：Anthropic 在測一種危險模型的發布順序

Project Glasswing 的重點不是 Anthropic 多做一個資安專案，而是當模型能找漏洞時，誰先拿到、怎麼稽核、如何修補，會變成產品本身。

報導解讀

如果一個模型能幫你找出嚴重軟體漏洞，最好的發布方式可能不是「讓所有人都用」。

Anthropic 的 Project Glasswing 就把這個問題放到檯面上。它不是一般資安工具上市，也不是單純展示 Claude 又多會一件事。公開資訊顯示，Anthropic 把 Claude Mythos Preview 放進一個受限制的防禦性計畫，先給 selected critical-software partners 用來協助找漏洞、修補重要軟體、降低供應鏈風險。

這篇應該看的不是 Mythos 有多神，而是發布順序本身：當 AI 能力同時可以幫防守者，也可能幫攻擊者，access control 就不再是附屬條款，而是產品的一部分。

為什麼不是直接公開？

一般 AI 產品的理想節奏，是讓更多使用者測試，靠回饋改善。資安能力不是這樣。

漏洞發現能力一旦擴散，防守者和攻擊者拿到的是同一種加速器。它可以幫維護者掃描關鍵程式碼，也可能讓不負責任的人更快找到可利用的缺口。因此 Project Glasswing 的訊號，是 Anthropic 先把能力交給有防禦責任的組織，而不是把它當成一般工具開放。

這不是保證安全。restricted access 只能降低擴散風險，不能自動解決誤報、漏報、通報延遲或修補資源不足。但它至少承認一件事：高風險能力的發布，不應只用「模型能力」衡量，也要看誰能用、用來做什麼、結果怎麼留下紀錄。

防守者真正需要的是修補流程

AI 找到漏洞只是第一步。真正困難的是後面：誰確認問題、誰通知維護者、誰排修補優先順序、誰承擔公開揭露時間點，還有誰能證明這個流程沒有被濫用。

對 critical software 來說，這些都不是行政細節。許多開源維護者本來就缺人、缺時間、缺安全審查資源。如果 AI 只是丟出更多疑似漏洞，可能反而製造新的待辦洪水。Project Glasswing 要證明價值，不能只靠「找到更多問題」，而要讓發現、驗證、修補和揭露變成可被管理的鏈條。

這也是企業資安團隊該看的地方。當供應商說它有 AI vulnerability discovery 能力時，採購問題不應停在「準不準」。更好的問題是：access 怎麼控？結果誰看？誤報怎麼處理？修補責任誰承擔？是否留下 audit trail？模型輸出會不會把敏感程式碼或漏洞細節暴露到不該去的地方？

這會成為高風險 AI 的發布模板嗎？

Project Glasswing 可能代表一種更常見的模式：高風險能力先進入受控場域，再決定是否擴散。

醫療、資安、國防、金融和關鍵基礎設施都會遇到類似問題。模型能力越強，越不能只問「能不能做」，還要問「誰可以做、誰批准、誰負責、誰能追蹤」。這不是把創新踩煞車，而是承認某些能力的社會成本不是事後補文件就能處理。

所以，Project Glasswing 最值得觀察的不是 Claude Mythos Preview 何時公開，而是 Anthropic 和合作夥伴能否公開說清楚防禦成果、修補流程和濫用邊界。

如果它只是一個漂亮的 restricted access 宣示，價值有限。若它能證明 AI 找到的問題真的被更快、更負責地修補，它就會成為下一批危險能力發布前必須回答的問題：先給誰，怎麼用，怎麼留下責任。

SOURCES

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用，不可當事實。

本文由 AI 協助研究與起草，矽基前沿編輯部編修，總編輯廖玄同審閱定稿。編輯方針與 AI 使用說明

Claude Mythos 先給防守者：Anthropic 在測一種危險模型的發布順序

為什麼不是直接公開？

防守者真正需要的是修補流程

這會成為高風險 AI 的發布模板嗎？

繼續讀

Claude 沒說出口的念頭，被 Anthropic 直接讀出來了

微軟開始教業務員把 OpenAI、Claude 講成半成品

你的 Claude 也一直叫你去睡覺嗎？現在還有「下班」時段

訂閱《矽基前沿週報》