矽基前沿 [Si]gnals
一張 Claude Sonnet 5 的定價卡,大字標示每百萬 token 2 與 10 美元,旁邊一個往上的 token 計數指示標註約 1.0 到 1.35 倍的編輯式對照圖
AI 戰爭

Claude Sonnet 5 降價成 Claude Code 預設,帳單卻不一定變便宜:新斷詞器讓同一段話多算 token

每-token 便宜,一次請求未必便宜

本文由 AI 協助研究與起草,矽基前沿編輯部編修,總編輯廖玄同審閱定稿。 編輯方針與 AI 使用說明

重點一:2026 年 6 月 30 日,Anthropic 發表 Claude Sonnet 5,以優惠價每百萬 input/output token 2/10 美元(至 8 月 31 日)成為 claude.ai Free/ProClaude Code Pro預設模型,脈絡視窗 1M token重點二:優惠期過後回到標準價 3/15 美元。官方定調 Sonnet 5 在編碼、代理人與知識工作上優於前代 Sonnet 4.6,TechCrunch 稱它是「跑 agent 更便宜的方式」。 重點三:同一份公告裡有一行容易被略過的註記——Sonnet 5 換了斷詞器(tokenizer),同一段文字相較舊模型會多算約 1.0–1.35 倍 token。每-token 單價降了,一次請求的實付金額未必等比例下降。

2026 年 6 月 30 日,Anthropic 把中階的 Claude Sonnet 5 推上線,並做了兩個並存的動作:把每百萬 token 的價格從標準的 3/15 美元降到優惠期的 2/10 美元(input/output,優惠到 8 月 31 日),同時讓它成為 claude.ai Free/Pro 與 Claude Code Pro 的預設模型。對每天用 Claude Code 寫程式、用 API 跑代理人(agent)迴圈的人來說,這是「不做任何設定,預設跑的那個模型換了、計價也換了」。

值得單獨拉出來看的,是官方公告裡另一行字:Sonnet 5 用了更新後的斷詞器,同一段輸入相較舊模型會被切成多約 1.0–1.35 倍的 token。token 是計價與計算脈絡的單位,一段文字被切成更多 token,代表同一則 prompt 的帳面 token 數上升。每-token 單價降了三分之一,一次請求實付變便宜多少,是另一個要分開算的問題。

TechCrunch 把這次發布定調為「跑 agent 更便宜的方式」,脈絡是 Anthropic 正朝 IPO 前進。The Decoder 則描述 Sonnet 5 的能力進一步逼近較貴的 Opus 系列。下面把可查證的數字並排,斷詞器那一層留到後面拆。

先給答案:降到哪、預設在哪、脈絡多大

如果只想知道結論:Claude Sonnet 5 於 2026 年 6 月 30 日上線,優惠價每百萬 input token 2 美元、output token 10 美元,優惠到 8 月 31 日,之後回到標準價 3/15 美元。它是 claude.ai Free/ProClaude Code Pro 的預設模型,Max/Team/Enterprise 也可使用,並經 Claude API、Amazon Bedrock、Google Vertex AI 提供。脈絡視窗 1M token(既是預設也是上限),最大輸出 128k token。官方稱它在推理、工具使用、編碼與知識工作上優於前代 Sonnet 4.6。

以上都是帳面規格。真正需要多想一步的,是計價單位本身也變了。

斷詞器怎麼吃掉降幅?同一段文字被切成更多 token

斷詞器(tokenizer)決定一段文字被切成幾個 token,而 token 同時是 Anthropic 的計價單位與模型讀寫的計算單位。Anthropic 在公告裡說明,Sonnet 5 改用更新後的斷詞器,處理文字的方式改變,使同一段輸入相較舊模型會多算約 1.0–1.35 倍 token,實際倍率依內容型態而定

把兩股力量擺在一起看。單價這一頭往下:input 從每百萬 3 美元降到 2 美元,output 從 15 美元降到 10 美元,都約降三分之一。token 計數這一頭往上:同一段 prompt,最壞情況會被切成約 1.35 倍的 token。單價下降的效果,會被 token 計數上升部分抵銷——抵銷多少,取決於你的內容落在 1.0 到 1.35 倍的哪一段。純英文散文可能靠近 1.0、影響小;混雜程式碼、符號、多語或結構化文字的內容,倍率會往上走。

要說清楚的是,這無關模型變差或變貴;改變的是計價的刻度——「帳面每-token 價格」不再能直接換算成「一次請求的實付金額」。這一層在 output 上更值得留意:跑代理人(agent)迴圈時,模型自己產生的 token 往往遠多於使用者輸入的字,而 output 單價本來就是 input 的數倍。要知道降幅在自己身上打幾折,準確的方法只有一個:用新斷詞器實際數一次自己常跑的 prompt 與回應各有幾個 token。

一張表看完:定價、脈絡、預設位置與斷詞器影響

以下皆為 Anthropic 官方公告與 Platform Docs 揭露的規格;斷詞器倍率為官方給出的區間,非固定值

項目Claude Sonnet 5
上線日2026-06-30
優惠價(至 2026-08-31)input 2 美元/output 10 美元(每百萬 token)
標準價(優惠後)input 3 美元/output 15 美元(每百萬 token)
脈絡視窗1M token(預設即上限)
最大輸出128k token
預設方案claude.ai Free/Pro、Claude Code Pro
其他可用Max/Team/Enterprise;Claude API、Amazon Bedrock、Google Vertex AI
斷詞器更新後斷詞器,同一段文字相較舊模型多算約 1.0–1.35 倍 token
官方能力定位推理/工具使用/編碼/知識工作優於 Sonnet 4.6

表格右欄每一格都是官方揭露值。要注意的是,最後一列的能力定位是 Anthropic 自述;市面流傳的各項 benchmark 分數多來自第三方聚合站、未經一手獨立查證,這裡不引為定論。The Decoder 的描述也停在定性層級——Sonnet 5「進一步縮小與較貴的 Opus 系列的差距」,而非某個具體分數。

預設換了,對每天用 Claude Code/API 的人代表什麼?

預設模型變動的實際意義,落在兩種人身上。用 claude.ai Free/Pro 對話的人,不改任何設定,回應就由 Sonnet 5 產出。用 Claude Code Pro 寫程式的人,預設跑的模型換成 Sonnet 5——這裡也包含台灣以 Claude Code/API 接案、跑自動化代理人的開發者:預設模型換了,跑一輪的計價基準也跟著換到新的價格與新的斷詞器。

1M token 的脈絡視窗同樣是每天有感的一項:它既是預設也是上限,最大輸出 128k token。對要一次塞進整個程式庫、長文件或多輪對話歷史的工作流程來說,這決定了一次請求能容納多少內容;而脈絡塞得越滿,被新斷詞器計入的 token 也越多,兩件事會一起放大。

Anthropic 另外主動標出一條能力邊界:Sonnet 5 在代理情境下的不良行為率低於 Sonnet 4.6,但執行資安任務的能力明顯低於現有 Opus 模型。這是官方自陳的取捨,讀者可自行對照自己的用途。要不要把手上的工作流程切到 Sonnet 5,取決於怎麼權衡:優惠期的較低單價、1M 脈絡、官方稱逼近 Opus 的能力,對上斷詞器帶來的 token 計數上升——這篇把數字擺齊,不替你做這個決定。

怎麼知道降幅在自己身上打幾折?先數一次 token

在把預設接受下來之前,可以做一件具體的事:拿自己最常跑的那一段 prompt 或一輪 agent 對話,用 Sonnet 5 的斷詞器數一次 token 數(input 與 output 分開數),對照 2/10 美元的優惠價,就知道帳面降幅在自己的內容上實際打幾折。內容越靠近純英文散文、折扣越接近全額;越是程式碼、符號與多語混雜,token 計數上升越多、折扣被吃掉越多。

還有一個日期要記:優惠價 8 月 31 日到期,之後回到標準的 3/15 美元。 換句話說,現在算出來的實付金額是優惠期的地板;9 月起同樣的用量,帳面單價會再往上一階。

資料來源:Anthropic〈Introducing Claude Sonnet 5〉(2026-06-30,官方 newsroom)、Anthropic Claude Platform Docs〈What’s new in Claude Sonnet 5〉、TechCrunch〈Anthropic launches Claude Sonnet 5 as a cheaper way to run agents〉(2026-06-30)、The Decoder(2026-06-30)。定價、預設位置、1M 脈絡/128k 輸出、斷詞器 1.0–1.35 倍為官方揭露;「跑 agent 更便宜」為 TechCrunch 定調;benchmark 細項分數未經一手查證,不引為定論。

SOURCES

  1. A Introducing Claude Sonnet 5
  2. A What's new in Claude Sonnet 5 — Claude Platform Docs
  3. A Anthropic launches Claude Sonnet 5 as a cheaper way to run agents
  4. B Anthropic's new Claude Sonnet 5 closes the gap to the pricier Opus model series

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用,不可當事實。

MACHINE-READABLE SUMMARY

Topic
AI 戰爭
Key claims
  • 2026-06-30,Anthropic 發表 Claude Sonnet 5,官方定調在編碼、代理人與知識工作上優於前代 Sonnet 4.6。
  • introductory 定價為每百萬 input token 2 美元、output token 10 美元,優惠至 2026-08-31,之後回到標準價每百萬 input 3 美元、output 15 美元。
  • Sonnet 5 成為 claude.ai Free/Pro 與 Claude Code Pro 的預設模型,Max/Team/Enterprise 亦可用,並經 Claude API、Amazon Bedrock、Google Vertex AI 提供。
  • 脈絡視窗為 1M token(同時是預設與上限),最大輸出 128k token。
  • Anthropic 揭露 Sonnet 5 改用更新後的斷詞器,使同一段輸入相較舊模型多算約 1.0–1.35 倍 token,帳面每-token 降價會被較高 token 計數部分抵銷。
Entities
Anthropic · Claude Sonnet 5 · Claude Code · Amazon Bedrock · Google Vertex AI
Taiwan relevance
medium
Confidence
high
Last updated
2026-07-01
Canonical URL
https://signals.tw/articles/claude-sonnet-5-price-tokenizer/

SUGGESTED CITATION

如果 AI agent / 研究 / 報導要引用本文,建議格式如下:

矽基前沿 · AI 戰爭線(編輯:廖玄同),《Claude Sonnet 5 降價成 Claude Code 預設,帳單卻不一定變便宜:新斷詞器讓同一段話多算 token》,矽基前沿 [Si]gnals,2026-07-01。https://signals.tw/articles/claude-sonnet-5-price-tokenizer/

AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.

WEEKLY [SI]GNALS

訂閱《矽基前沿週報》

每週五早上,總編輯親自寫的本週 AI 重要訊號 + 台灣視角。

5 個值得知道的訊號 · 1 個產品/模型動態 · 1 個總編判斷 · 5 分鐘讀完。

免費 · 隨時取消 · 不轉售你的 email。