AI 戰爭 1 小時前

1539 分：ByteDance 的 Seed 2.1 Pro 在 Code Arena 和 Claude Opus 4.6 並列第八

同級分數已是常態，這次的但書藏在狀態與通路裡

本文由 AI 協助研究與起草，矽基前沿編輯部編修，總編輯廖玄同審閱定稿。編輯方針與 AI 使用說明

重點一：2026 年 6 月 23 日，ByteDance（字節跳動）在火山引擎 FORCE 大會發表 Seed 2.1，官方定位為「為真實工作場景打造、具代理能力的新一代模型」。

重點二：Seed 2.1 Pro 在 Code Arena: Frontend 以 1539 分排名第 8、與 Claude Opus 4.6 並列，七個子項中五項進前十——但這份名次仍標著 Preview。

重點三：取用走 Doubao 與火山引擎，長文本基準是 128K；媒體報導的上架定價為 Pro 每百萬 token 輸入 6 元、輸出 30 元人民幣，約是西方同級旗艦的五分之一。

1539。在 Code Arena: Frontend 這個前端程式生成的公開競技榜上，這個分數讓 Seed 2.1 Pro 排到全球第 8，旁邊並列的名字是 Claude Opus 4.6——一顆來自 ByteDance 的模型，和一顆西方旗艦，停在同一格、同一分。

把這條消息講完整，需要四個但書。並列發生在 Code Arena 的前端子榜，不是綜合能力；那一列還標著 Preview；這顆模型只能從 Doubao 與火山引擎接；它的長文本基準是 128K，不是這一波動輒百萬 token 的規格。把這四件事擺回 1539 旁邊，今天的新聞點就清楚了——中國前沿模型「追平西方旗艦榜單」已經是常態，真正換掉的東西，藏在分數後面的狀態與通路裡。

6 月 23 日 ByteDance 在火山引擎 FORCE 大會把 Seed 2.1 端上檯面，官方一句定位寫得直接：這是「為真實工作場景打造、具代理能力的新一代模型」。賣點從「更聰明」收斂到「會幹活的代理人」。

1539 是哪張榜上的分數，又不能證明什麼？

Code Arena: Frontend 是評測模型寫前端程式的公開競技場，讓不同模型同題對打、由比對結果排出名次。榜單發布方 Arena.ai 給出的數字是：Seed 2.1 Pro Preview 以 1539 分排名第 8，與 Claude Opus 4.6 並列，在七個子項裡有五項擠進前十——React、Brand & Marketing、Content Creation Tools、Data & Analytics、Reference-Based Design。排在它前面的，只有少數幾家前沿實驗室，包含 Z.ai 的 GLM-5.2。

這個分數適合看趨勢，不適合單獨下結論，原因有三：

它衡量的是前端程式生成這一個子項，不是模型的整體能力；
榜上那一列標著 Preview，是早期預覽版的成績，不是正式釋出版；
跨模型名次會隨榜單更新而變動，今天的並列不保證下週還在原位。

放回原文意思就一句話：1539 證明 Seed 2.1 Pro 在某一張前端榜上摸到了 Opus 4.6 的高度，不證明它在你的真實專案裡也是同一檔。

官方怎麼定位 Seed 2.1？跑了哪些 agent 基準？

ByteDance Seed 的官方部落格沒有把重心放在「更大更強」，而是放在代理能力與生產力。它列出的基準，多半是衡量模型「能不能在真實工作流裡把任務做完」的項目，而不是傳統的知識問答：

GDPVal、MobileWorld：官方宣稱 Seed 2.1 Pro 取得最高分；
Agents’ Last Exam（ALE）：名列前段；
Workspace Bench、Agent Startup Bench、SciCode、CharXiv-RQ、MeasureBench、ERQA 等：列為具競爭力的成績；
長文本能力以 MMLongBench-128K 衡量——這個基準名本身點出它的長文本脈絡落在 128K 等級。

128K 這個數字值得單獨記一筆。同一時期，市場上談的是百萬 token context 的長文本模型；Seed 2.1 用 128K 級的基準來展示長文本，規格上走的是夠用而非極致這條線。

Pro 和 Turbo 差在哪？價格數字從哪來？

火山引擎上架頁列出兩個變體，分工清楚：

變體	定位	報導定價（每百萬 token，人民幣）
Doubao-seed-2-1-pro	旗艦深度思考，主打高複雜度工程交付與探索	輸入 6 元 / 輸出 30 元
Doubao-seed-2-1-turbo	低成本、低延遲，主打大規模生產	輸入 3 元 / 輸出 15 元

定價這一段要標清楚出處：這組數字來自媒體對火山引擎上架頁的報導，不是官方 benchmark 部落格本身的內容——felloAI 的整理甚至指出，ByteDance 在正式發表裡把參數量、完整 context 與定價都按住沒公開。以人民幣計，Pro 的 6 元／30 元被普遍形容為「約西方同級旗艦的五分之一」，但這是粗略比例，幣別與台灣取用條件都要另外算。

官方部落格反覆出現的 Pro，是這次的主角；Turbo 主要出現在火山引擎的上架與媒體彙整裡。兩件事的來源因此不同：「Pro 並列 Opus 4.6」是榜單事實，「Pro／Turbo 雙版本＋低價」則是上架頁與報導拼出來的圖。

現在誰能用、從哪接？

官方給的取用通路只有兩條：Doubao（豆包）與火山引擎使用者現在可以開始存取 Seed 2.1。Code Arena 上掛的是 Preview，公開釋出官方說在「未來數週」，初期透過 Feishu（飛書）Spark 與 Coze 推出。

支撐這顆模型的，是一個已經跑在生產規模上的平台——Doubao 平台日呼叫量達 180 兆 token。這個數字說明 Seed 不是純展示品，而是有真實流量在上面跑的服務。

對台灣做 coding／agent 自建、又對成本敏感的團隊，這意味著候選清單上多了一個「報導稱同級能力、五分之一價」的名字。但這顆模型掛在 Doubao／火山引擎這條中國雲鏈路上，存取、資料落地與合規是先決條件——這一關，比榜單上的 1539 更靠前。

把並列拆成五個事實：哪張榜、什麼狀態、走哪條雲？

不下「該不該用」的判斷，只把這次發表的事實並排放好：

並列是真的，但有座標：1539、第 8、與 Opus 4.6 並列，發生在 Code Arena: Frontend 子榜、Preview 版本。
賣點是代理人：官方定位「為真實工作場景打造、具代理能力」，主打的基準是 GDPVal、MobileWorld、ALE 這類 agent／生產力項目。
長文本走夠用路線：以 MMLongBench-128K 衡量，不是百萬 context 規格。
價格數字要看出處：Pro 6 元／30 元、Turbo 3 元／15 元（人民幣）來自媒體報導的火山引擎上架頁，官方發表未列定價。
通路只有兩條：Doubao 與火山引擎，公開釋出「未來數週」，初期經 Feishu Spark 與 Coze。

一年前，「中國模型追平西方旗艦榜單」還能當成一條獨立新聞。今天 Seed 2.1 Pro 在前端榜上和 Opus 4.6 並列，新聞點已經不在那個並列本身——而在它後面標著 Preview、只能從 Doubao 與火山引擎接。下次有人跟你說「某中國模型又追平了誰」，值得先問的是同一句話：並列在哪張榜、什麼狀態、從哪條雲接得到。

資料來源：ByteDance Seed〈Seed2.1 Officially Released: Advancing AI Productivity〉（官方部落格，2026-06-23）、ByteDance Seed 產品頁、Arena.ai（Code Arena 排名）、aibase、Dataconomy、felloAI。

SOURCES

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用，不可當事實。

MACHINE-READABLE SUMMARY

Topic: AI 戰爭
Key claims: 2026 年 6 月 23 日，ByteDance 在火山引擎 FORCE 大會發表 Seed 2.1，官方定位為「為真實工作場景打造、具代理能力的新一代模型」。
Seed 2.1 Pro 在 Code Arena Frontend 以 1539 分排名第 8、與 Claude Opus 4.6 並列，七個子項中五項進前十。
官方宣稱 Seed 2.1 Pro 在 GDPVal、MobileWorld 取得最高分，Agents' Last Exam 名列前段，長文本以 MMLongBench-128K 衡量。
火山引擎上架頁列出 Pro 與 Turbo 兩個變體；媒體報導定價 Pro 每百萬 token 輸入 6 元、輸出 30 元人民幣，Turbo 為 3 元與 15 元。
取用通路為 Doubao 與火山引擎，Code Arena 上仍是 Preview，公開釋出預計未來數週；Doubao 平台日呼叫量達 180 兆 token。
Entities: ByteDance · Doubao · Volcano Engine · Seed 2.1 Pro · Seed 2.1 Turbo · Code Arena · Claude Opus 4.6 · GPT-5.5 · Feishu Spark · Coze
Taiwan relevance: medium
Confidence: high
Last updated: 2026-06-25
Canonical URL: https://signals.tw/articles/bytedance-seed-2-1/

SUGGESTED CITATION

如果 AI agent / 研究 / 報導要引用本文,建議格式如下:

矽基前沿 · AI 戰爭線（編輯：廖玄同），《1539 分：ByteDance 的 Seed 2.1 Pro 在 Code Arena 和 Claude Opus 4.6 並列第八》，矽基前沿 [Si]gnals，2026-06-25。https://signals.tw/articles/bytedance-seed-2-1/

AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.

1539 分：ByteDance 的 Seed 2.1 Pro 在 Code Arena 和 Claude Opus 4.6 並列第八

1539 是哪張榜上的分數，又不能證明什麼？

官方怎麼定位 Seed 2.1？跑了哪些 agent 基準？

Pro 和 Turbo 差在哪？價格數字從哪來？

現在誰能用、從哪接？

把並列拆成五個事實：哪張榜、什麼狀態、走哪條雲？

繼續讀

GLM-5.2 越過了 GPT-5.5——但只越過長程編程那幾項

GLM-5.1、Kimi K2.6、DeepSeek V4、MiniMax M2.7：四個架構，同一個 SWE-bench 天花板，四條不同的帳單

OpenAI 新語音模型來了：客服可以邊說邊查、邊說邊做

訂閱《矽基前沿週報》