1539 分:ByteDance 的 Seed 2.1 Pro 在 Code Arena 和 Claude Opus 4.6 並列第八
同級分數已是常態,這次的但書藏在狀態與通路裡
本文由 AI 協助研究與起草,矽基前沿編輯部編修,總編輯廖玄同審閱定稿。 編輯方針與 AI 使用說明
重點一:2026 年 6 月 23 日,ByteDance(字節跳動)在火山引擎 FORCE 大會發表 Seed 2.1,官方定位為「為真實工作場景打造、具代理能力的新一代模型」。
重點二:Seed 2.1 Pro 在 Code Arena: Frontend 以 1539 分排名第 8、與 Claude Opus 4.6 並列,七個子項中五項進前十——但這份名次仍標著 Preview。
重點三:取用走 Doubao 與火山引擎,長文本基準是 128K;媒體報導的上架定價為 Pro 每百萬 token 輸入 6 元、輸出 30 元人民幣,約是西方同級旗艦的五分之一。
1539。在 Code Arena: Frontend 這個前端程式生成的公開競技榜上,這個分數讓 Seed 2.1 Pro 排到全球第 8,旁邊並列的名字是 Claude Opus 4.6——一顆來自 ByteDance 的模型,和一顆西方旗艦,停在同一格、同一分。
把這條消息講完整,需要四個但書。並列發生在 Code Arena 的前端子榜,不是綜合能力;那一列還標著 Preview;這顆模型只能從 Doubao 與火山引擎接;它的長文本基準是 128K,不是這一波動輒百萬 token 的規格。把這四件事擺回 1539 旁邊,今天的新聞點就清楚了——中國前沿模型「追平西方旗艦榜單」已經是常態,真正換掉的東西,藏在分數後面的狀態與通路裡。
6 月 23 日 ByteDance 在火山引擎 FORCE 大會把 Seed 2.1 端上檯面,官方一句定位寫得直接:這是「為真實工作場景打造、具代理能力的新一代模型」。賣點從「更聰明」收斂到「會幹活的代理人」。
1539 是哪張榜上的分數,又不能證明什麼?
Code Arena: Frontend 是評測模型寫前端程式的公開競技場,讓不同模型同題對打、由比對結果排出名次。榜單發布方 Arena.ai 給出的數字是:Seed 2.1 Pro Preview 以 1539 分排名第 8,與 Claude Opus 4.6 並列,在七個子項裡有五項擠進前十——React、Brand & Marketing、Content Creation Tools、Data & Analytics、Reference-Based Design。排在它前面的,只有少數幾家前沿實驗室,包含 Z.ai 的 GLM-5.2。
這個分數適合看趨勢,不適合單獨下結論,原因有三:
- 它衡量的是前端程式生成這一個子項,不是模型的整體能力;
- 榜上那一列標著 Preview,是早期預覽版的成績,不是正式釋出版;
- 跨模型名次會隨榜單更新而變動,今天的並列不保證下週還在原位。
放回原文意思就一句話:1539 證明 Seed 2.1 Pro 在某一張前端榜上摸到了 Opus 4.6 的高度,不證明它在你的真實專案裡也是同一檔。
官方怎麼定位 Seed 2.1?跑了哪些 agent 基準?
ByteDance Seed 的官方部落格沒有把重心放在「更大更強」,而是放在代理能力與生產力。它列出的基準,多半是衡量模型「能不能在真實工作流裡把任務做完」的項目,而不是傳統的知識問答:
- GDPVal、MobileWorld:官方宣稱 Seed 2.1 Pro 取得最高分;
- Agents’ Last Exam(ALE):名列前段;
- Workspace Bench、Agent Startup Bench、SciCode、CharXiv-RQ、MeasureBench、ERQA 等:列為具競爭力的成績;
- 長文本能力以 MMLongBench-128K 衡量——這個基準名本身點出它的長文本脈絡落在 128K 等級。
128K 這個數字值得單獨記一筆。同一時期,市場上談的是百萬 token context 的長文本模型;Seed 2.1 用 128K 級的基準來展示長文本,規格上走的是夠用而非極致這條線。
Pro 和 Turbo 差在哪?價格數字從哪來?
火山引擎上架頁列出兩個變體,分工清楚:
| 變體 | 定位 | 報導定價(每百萬 token,人民幣) |
|---|---|---|
| Doubao-seed-2-1-pro | 旗艦深度思考,主打高複雜度工程交付與探索 | 輸入 6 元 / 輸出 30 元 |
| Doubao-seed-2-1-turbo | 低成本、低延遲,主打大規模生產 | 輸入 3 元 / 輸出 15 元 |
定價這一段要標清楚出處:這組數字來自媒體對火山引擎上架頁的報導,不是官方 benchmark 部落格本身的內容——felloAI 的整理甚至指出,ByteDance 在正式發表裡把參數量、完整 context 與定價都按住沒公開。以人民幣計,Pro 的 6 元/30 元被普遍形容為「約西方同級旗艦的五分之一」,但這是粗略比例,幣別與台灣取用條件都要另外算。
官方部落格反覆出現的 Pro,是這次的主角;Turbo 主要出現在火山引擎的上架與媒體彙整裡。兩件事的來源因此不同:「Pro 並列 Opus 4.6」是榜單事實,「Pro/Turbo 雙版本+低價」則是上架頁與報導拼出來的圖。
現在誰能用、從哪接?
官方給的取用通路只有兩條:Doubao(豆包)與火山引擎使用者現在可以開始存取 Seed 2.1。Code Arena 上掛的是 Preview,公開釋出官方說在「未來數週」,初期透過 Feishu(飛書)Spark 與 Coze 推出。
支撐這顆模型的,是一個已經跑在生產規模上的平台——Doubao 平台日呼叫量達 180 兆 token。這個數字說明 Seed 不是純展示品,而是有真實流量在上面跑的服務。
對台灣做 coding/agent 自建、又對成本敏感的團隊,這意味著候選清單上多了一個「報導稱同級能力、五分之一價」的名字。但這顆模型掛在 Doubao/火山引擎這條中國雲鏈路上,存取、資料落地與合規是先決條件——這一關,比榜單上的 1539 更靠前。
把並列拆成五個事實:哪張榜、什麼狀態、走哪條雲?
不下「該不該用」的判斷,只把這次發表的事實並排放好:
- 並列是真的,但有座標:1539、第 8、與 Opus 4.6 並列,發生在 Code Arena: Frontend 子榜、Preview 版本。
- 賣點是代理人:官方定位「為真實工作場景打造、具代理能力」,主打的基準是 GDPVal、MobileWorld、ALE 這類 agent/生產力項目。
- 長文本走夠用路線:以 MMLongBench-128K 衡量,不是百萬 context 規格。
- 價格數字要看出處:Pro 6 元/30 元、Turbo 3 元/15 元(人民幣)來自媒體報導的火山引擎上架頁,官方發表未列定價。
- 通路只有兩條:Doubao 與火山引擎,公開釋出「未來數週」,初期經 Feishu Spark 與 Coze。
一年前,「中國模型追平西方旗艦榜單」還能當成一條獨立新聞。今天 Seed 2.1 Pro 在前端榜上和 Opus 4.6 並列,新聞點已經不在那個並列本身——而在它後面標著 Preview、只能從 Doubao 與火山引擎接。下次有人跟你說「某中國模型又追平了誰」,值得先問的是同一句話:並列在哪張榜、什麼狀態、從哪條雲接得到。
資料來源:ByteDance Seed〈Seed2.1 Officially Released: Advancing AI Productivity〉(官方部落格,2026-06-23)、ByteDance Seed 產品頁、Arena.ai(Code Arena 排名)、aibase、Dataconomy、felloAI。
SOURCES
- A Seed2.1 Officially Released: Advancing AI Productivity(ByteDance Seed, 2026-06-23)
- A ByteDance Seed 產品頁(Seed 2.x)
- B Arena.ai 官方貼文:Seed 2.1 Pro Preview ranks #8 in Code Arena: Frontend
- B ByteDance DouBao Seed 2.1 系列發布(aibase, 2026-06)
- B ByteDance Launches Doubao 2.1 Pro Language Model(Dataconomy, 2026-06-24)
- B Seed 2.1 Pro Review: Matching Claude Opus 4.6(felloAI, 2026-06)
來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用,不可當事實。
MACHINE-READABLE SUMMARY
- Topic
- AI 戰爭
- Key claims
-
- 2026 年 6 月 23 日,ByteDance 在火山引擎 FORCE 大會發表 Seed 2.1,官方定位為「為真實工作場景打造、具代理能力的新一代模型」。
- Seed 2.1 Pro 在 Code Arena Frontend 以 1539 分排名第 8、與 Claude Opus 4.6 並列,七個子項中五項進前十。
- 官方宣稱 Seed 2.1 Pro 在 GDPVal、MobileWorld 取得最高分,Agents' Last Exam 名列前段,長文本以 MMLongBench-128K 衡量。
- 火山引擎上架頁列出 Pro 與 Turbo 兩個變體;媒體報導定價 Pro 每百萬 token 輸入 6 元、輸出 30 元人民幣,Turbo 為 3 元與 15 元。
- 取用通路為 Doubao 與火山引擎,Code Arena 上仍是 Preview,公開釋出預計未來數週;Doubao 平台日呼叫量達 180 兆 token。
- Entities
- ByteDance · Doubao · Volcano Engine · Seed 2.1 Pro · Seed 2.1 Turbo · Code Arena · Claude Opus 4.6 · GPT-5.5 · Feishu Spark · Coze
- Taiwan relevance
- medium
- Confidence
- high
- Last updated
- 2026-06-25
- Canonical URL
- https://signals.tw/articles/bytedance-seed-2-1/
SUGGESTED CITATION
如果 AI agent / 研究 / 報導要引用本文,建議格式如下:
矽基前沿 · AI 戰爭線(編輯:廖玄同),《1539 分:ByteDance 的 Seed 2.1 Pro 在 Code Arena 和 Claude Opus 4.6 並列第八》,矽基前沿 [Si]gnals,2026-06-25。https://signals.tw/articles/bytedance-seed-2-1/
AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.