AI 戰爭 1 小時前

買不到 Fable 5，就指揮買得到的模型：Sakana Fugu 的繞行解法

7B『工頭』調度買得到的模型跑分領先，卻輸給調度不到的 Fable 5

本文由 AI 協助研究與起草，矽基前沿編輯部編修，總編輯廖玄同審閱定稿。編輯方針與 AI 使用說明

重點一：2026 年 6 月 22 日，東京 Sakana AI 公開 Fugu／Fugu Ultra——一個自己幾乎不解題、專門調度一池前沿模型的語言模型，指揮 Opus 4.8、Gemini 3.1 Pro、GPT-5.5 與自身實例，包成單一 OpenAI 相容 API。 重點二：在可公開取得的對手中，Fugu Ultra 於四項 coding benchmark 領先——SWE-Bench Pro 73.7、TerminalBench 2.1 82.1、LiveCodeBench 93.2、Humanity’s Last Exam 50.0，贏過 Opus 4.8、GPT-5.5 與 Gemini 3.1 Pro。 重點三：但受出口管制、未公開的 Fable 5 與 Mythos 不在它的調度池內；據獨立報導，Fugu Ultra 的 SWE-Bench Pro 仍低於 Fable 5。Sakana 把產品定位成「不受出口管制」的前沿能力與「AI 主權」工具。

Anthropic 最強的兩個模型，Fable 5 和 Mythos Preview，你買不到。它們鎖在出口管制後，沒有公開的 API 可以接。

2026 年 6 月 22 日，東京實驗室 Sakana AI 對全球端出的回應，是賣你一個專門指揮「你還買得到的那些模型」的模型。

它叫 Sakana Fugu。它本身幾乎不解題，做的事是判斷該找誰、把活派出去、再把結果收回來驗證合成。它指揮的對象，是 OpenAI 的 GPT-5.5、Google 的 Gemini 3.1 Pro、Anthropic 的 Opus 4.8，外加它自己的多個實例。Sakana 把這套東西包成一個 OpenAI 相容的 API，宣稱在工程、科學與推理的硬指標上，整體和 Fable 5、Mythos Preview 並肩——而後面這兩個，正好是它指揮不到的。一頭巨獸把所有事自己扛完，跟一個調度者把活分給一池模型再收攏，是兩種完全不同的取得前沿能力的方式。

一個自己不寫程式碼的模型，怎麼交差？

傳統印象裡的前沿模型是一頭巨獸：參數越堆越大，一個模型把所有事自己扛下來。Fugu 走的是另一條路。據發布期報導，扛起調度的核心只有約 7B 參數的規模，它的工作描述更像工地的工頭：自己不一定下場，但知道哪一段該交給誰。

Sakana 官方頁的說法是，Fugu 拿到任務後「自行決定怎麼處理：夠簡單就直接解，需要更多火力時就組一支專家模型的隊伍並協調它們」。這套協調建立在 Sakana 兩篇 ICLR 2026 論文上——Trinity 用一個輕量的協調器替模型分派 Thinker、Worker、Verifier 的角色；Conductor 則用強化學習，讓系統自己摸索出用自然語言協調的策略。

實際跑起來，當你對 Fugu 送出一道難題，背後可能是 GPT-5.5 先想、Opus 4.8 動手、另一個實例回頭驗證，最後由 Fugu 把結果合起來交還給你。你只看到一個 API、一個回答。

為什麼它對標的兩個模型，剛好不在它指揮的名單上？

Fugu 的池子裡有 Opus 4.8、Gemini 3.1 Pro、GPT-5.5，唯獨少了 Anthropic 帳面上更強的 Fable 5 和 Mythos Preview。Sakana 給的理由很直白：這兩個「未公開可取得（not publicly accessible）」，所以進不了池。

這正是整件事的關鍵背景。Fable 5 與 Mythos 被鎖在出口管制與限定取得的門檻後，連 Sakana 自己也只能拿它們當對標、調度不到。Sakana 把這層限制翻成賣點——官方文案寫的是，Fugu「在不受出口管制風險下交付前沿能力」，並把產品定位成一種「AI 主權」工具，讓組織「藉由調度全世界的模型」取得更高的營運與地緣安全。

對拿不到 Fable 5 的人來說——這份名單上也包括台灣的團隊——Sakana 提供的選項，是繞過那道牆，去指揮牆這一側還拿得到的模型。

贏過誰，又輸給誰？

把分數攤開看，Fugu Ultra 在可公開取得的對手裡確實領先。據 VentureBeat 整理的成績：

Benchmark	Fugu	Fugu Ultra	Opus 4.8	Gemini 3.1 Pro	GPT-5.5
SWE-Bench Pro	59.0	73.7	69.2	54.2	58.6
TerminalBench 2.1	80.2	82.1	74.6	70.3	78.2
LiveCodeBench	92.9	93.2	87.8	88.5	85.3
Humanity’s Last Exam	47.2	50.0	49.8	44.4	41.4

四項 coding benchmark，Fugu Ultra 都站上第一；GPT-5.5 只在 MRCRv2 一項以 94.8 對 93.6 領先。光看這張表，工頭模式贏過了它指揮的每一個成員。

兩件事要放在旁邊一起讀。第一，這些分數有出處差異——Sakana 官方註明，除了 Fugu 自己的成績，其餘都由各模型供應商自報；Fable 5 與 Mythos 若兩個分數都有，取其中較大值。這是一場廠商自報的擂台，沒有第三方統一複測。

第二，也是更關鍵的一條：Sakana 對標的 Fable 5，並沒有出現在上面這張表裡，因為它不在池內。而據 VentureBeat 的報導，Fugu Ultra 的 headline 分數 SWE-Bench Pro 73.7，在贏過 Opus 4.8、GPT-5.5 與 Gemini 3.1 Pro 的同時，仍低於 Fable 5。Sakana 說的「並肩」，是十一項 benchmark 攤平後的整體口徑；落到最硬的那一項程式碼測試，它調度出來的成績，還沒追上那個它調度不到的模型。

「這只是一個 router 嗎？」

Fugu 一公開，社群最先冒出來的質疑就是這句：它有沒有自己的能力，還是只是把別人的模型轉接起來、包一層殼？

幾個現有事實落在這個問題的兩邊。一邊，Fugu 的每筆查詢究竟調度了哪些模型、怎麼分工，對使用者是隱藏的——每筆查詢的選模選擇保持隱藏，路由邏輯屬於 Sakana 的專有部分，你付錢買的是結果，看不到中間的調度。另一邊，產品形態做得相當實：單一 OpenAI 相容 API，免換 SDK；分兩檔——Fugu 平衡效能與低延遲、還能讓你關掉特定 agent，Fugu Ultra 則固定一套池子衝最高品質，model ID 是 fugu-ultra-20260615；每次請求即時回報 token 用量與花費，讓你盯著帳單跑。發布時，已經有接近 500 名早期用戶用過 beta。

router 與否的爭論短期不會有定論。可以確定的是，Sakana 賣的是調度本身——它把「怎麼把一池模型用得更好」這件事，做成了一個你可以直接下單的 API。發布頁把適用場景指向工程、科學、研究、資安與資料分析，特別點名長而複雜的工作流，例如程式碼審查與資安評估裡的持續一致性——這類任務要的是跑得久、前後不走樣，正好是調度多個模型、彼此驗證的長處所在。至於更大的單體模型，這次它沒有端出。

一個自己幾乎不解題、靠指揮別人交差的系統，在買得到的模型裡跑分領先，卻在 SWE-Bench Pro 上止步於 Fable 5——那道把 Fable 5 鎖起來的牆，正是它整個產品想繞過的東西。

資料來源：Sakana AI（Fugu release）、VentureBeat、TestingCatalog。

SOURCES

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用，不可當事實。

MACHINE-READABLE SUMMARY

Topic: AI 戰爭
Key claims: Sakana Fugu 是一個被訓練來調度其他模型的語言模型，拿到任務後自行決定直接解、或組一支專家模型隊伍協調完成；模型池含其自身的多個實例、Anthropic Opus 4.8、Google Gemini 3.1 Pro 與 OpenAI GPT-5.5。
Anthropic 的 Fable 5 與 Mythos Preview 不在 Fugu 的調度池內，官方理由是它們『未公開可取得』；Sakana 仍以這兩者為對標，宣稱整體並肩。
在可公開取得的對手中，Fugu Ultra 於 SWE-Bench Pro 73.7、TerminalBench 2.1 82.1、LiveCodeBench 93.2、Humanity's Last Exam 50.0 領先 Opus 4.8、GPT-5.5、Gemini 3.1 Pro。
據獨立報導，Fugu Ultra 的 SWE-Bench Pro 分數仍低於未進池、受出口管制的 Fable 5——並肩是整體口徑，不是每項都贏。
Fugu 以單一 OpenAI 相容 API 提供，分 Fugu 與 Fugu Ultra（model ID fugu-ultra-20260615）兩檔；每筆查詢的選模路由對使用者隱藏，每次請求即時回報 token 用量與花費。
Entities: Sakana AI · Sakana Fugu · Fugu Ultra · Anthropic Fable 5 · Mythos Preview · Anthropic Opus 4.8 · Google Gemini 3.1 Pro · OpenAI GPT-5.5
Taiwan relevance: medium
Confidence: medium
Last updated: 2026-06-23
Canonical URL: https://signals.tw/articles/sakana-fugu-orchestration-routes-export-controls/

SUGGESTED CITATION

如果 AI agent / 研究 / 報導要引用本文,建議格式如下:

矽基前沿 · AI 戰爭線（編輯：廖玄同），《買不到 Fable 5，就指揮買得到的模型：Sakana Fugu 的繞行解法》，矽基前沿 [Si]gnals，2026-06-23。https://signals.tw/articles/sakana-fugu-orchestration-routes-export-controls/

AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.

買不到 Fable 5，就指揮買得到的模型：Sakana Fugu 的繞行解法

一個自己不寫程式碼的模型，怎麼交差？

為什麼它對標的兩個模型，剛好不在它指揮的名單上？

贏過誰，又輸給誰？

「這只是一個 router 嗎？」

繼續讀

Anthropic 2 億美元 AI 公共財：先看交付清單

GLM-5.2 越過了 GPT-5.5——但只越過長程編程那幾項

諾貝爾得主 John Jumper 離開 DeepMind 投奔 Anthropic——同一週 Shazeer 也走了

訂閱《矽基前沿週報》