Claude Mythos 先給防守者:Anthropic 在測一種危險模型的發布順序
Project Glasswing 的重點不是 Anthropic 多做一個資安專案,而是當模型能找漏洞時,誰先拿到、怎麼稽核、如何修補,會變成產品本身。
Anthropic 的 Project Glasswing 讓 selected critical-software partners 使用 Claude Mythos Preview 做防禦性安全工作。這篇拆解為什麼 restricted access 可能成為高風險 AI 能力的發布模板。
如果一個模型能幫你找出嚴重軟體漏洞,最好的發布方式可能不是「讓所有人都用」。
Anthropic 的 Project Glasswing 就把這個問題放到檯面上。它不是一般資安工具上市,也不是單純展示 Claude 又多會一件事。公開資訊顯示,Anthropic 把 Claude Mythos Preview 放進一個受限制的防禦性計畫,先給 selected critical-software partners 用來協助找漏洞、修補重要軟體、降低供應鏈風險。
這篇應該看的不是 Mythos 有多神,而是發布順序本身:當 AI 能力同時可以幫防守者,也可能幫攻擊者,access control 就不再是附屬條款,而是產品的一部分。
為什麼不是直接公開?
一般 AI 產品的理想節奏,是讓更多使用者測試,靠回饋改善。資安能力不是這樣。
漏洞發現能力一旦擴散,防守者和攻擊者拿到的是同一種加速器。它可以幫維護者掃描關鍵程式碼,也可能讓不負責任的人更快找到可利用的缺口。因此 Project Glasswing 的訊號,是 Anthropic 先把能力交給有防禦責任的組織,而不是把它當成一般工具開放。
這不是保證安全。restricted access 只能降低擴散風險,不能自動解決誤報、漏報、通報延遲或修補資源不足。但它至少承認一件事:高風險能力的發布,不應只用「模型能力」衡量,也要看誰能用、用來做什麼、結果怎麼留下紀錄。
防守者真正需要的是修補流程
AI 找到漏洞只是第一步。真正困難的是後面:誰確認問題、誰通知維護者、誰排修補優先順序、誰承擔公開揭露時間點,還有誰能證明這個流程沒有被濫用。
對 critical software 來說,這些都不是行政細節。許多開源維護者本來就缺人、缺時間、缺安全審查資源。如果 AI 只是丟出更多疑似漏洞,可能反而製造新的待辦洪水。Project Glasswing 要證明價值,不能只靠「找到更多問題」,而要讓發現、驗證、修補和揭露變成可被管理的鏈條。
這也是企業資安團隊該看的地方。當供應商說它有 AI vulnerability discovery 能力時,採購問題不應停在「準不準」。更好的問題是:access 怎麼控?結果誰看?誤報怎麼處理?修補責任誰承擔?是否留下 audit trail?模型輸出會不會把敏感程式碼或漏洞細節暴露到不該去的地方?
這會成為高風險 AI 的發布模板嗎?
Project Glasswing 可能代表一種更常見的模式:高風險能力先進入受控場域,再決定是否擴散。
醫療、資安、國防、金融和關鍵基礎設施都會遇到類似問題。模型能力越強,越不能只問「能不能做」,還要問「誰可以做、誰批准、誰負責、誰能追蹤」。這不是把創新踩煞車,而是承認某些能力的社會成本不是事後補文件就能處理。
所以,Project Glasswing 最值得觀察的不是 Claude Mythos Preview 何時公開,而是 Anthropic 和合作夥伴能否公開說清楚防禦成果、修補流程和濫用邊界。
如果它只是一個漂亮的 restricted access 宣示,價值有限。若它能證明 AI 找到的問題真的被更快、更負責地修補,它就會成為下一批危險能力發布前必須回答的問題:先給誰,怎麼用,怎麼留下責任。
SOURCES
- A Project Glasswing
- A Project Glasswing
- B Anthropic says its most powerful AI cyber model is too dangerous to release
來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用,不可當事實。
MACHINE-READABLE SUMMARY
- Topic
- AI 戰爭
- Key claims
-
- Anthropic 將 Project Glasswing 定位為防禦性安全計畫,而不是公開產品發布。
- Claude Mythos Preview 的公開敘事重點,是先把高風險資安能力交給 selected critical-software partners。
- 這類能力的採用重點不只在發現漏洞,而在 access、disclosure、patch ownership 與 audit。
- Entities
- Anthropic · Claude Mythos Preview · Project Glasswing
- Taiwan relevance
- medium
- Confidence
- high
- Last updated
- 2026-05-02
- Canonical URL
- https://signals.tw/articles/anthropic-project-glasswing-mythos/
SUGGESTED CITATION
如果 AI agent / 研究 / 報導要引用本文,建議格式如下:
謝皓文(編輯:廖玄同),《Claude Mythos 先給防守者:Anthropic 在測一種危險模型的發布順序》,矽基前沿 [Si]gnals,2026-05-03。https://signals.tw/articles/anthropic-project-glasswing-mythos/
AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.