AI 戰爭 1 小時前

Claude Sonnet 5 降價成 Claude Code 預設，帳單卻不一定變便宜：新斷詞器讓同一段話多算 token

每-token 便宜，一次請求未必便宜

本文由 AI 協助研究與起草，矽基前沿編輯部編修，總編輯廖玄同審閱定稿。編輯方針與 AI 使用說明

重點一：2026 年 6 月 30 日，Anthropic 發表 Claude Sonnet 5，以優惠價每百萬 input／output token 2／10 美元（至 8 月 31 日）成為 claude.ai Free／Pro 與 Claude Code Pro 的預設模型，脈絡視窗 1M token。 重點二：優惠期過後回到標準價 3／15 美元。官方定調 Sonnet 5 在編碼、代理人與知識工作上優於前代 Sonnet 4.6，TechCrunch 稱它是「跑 agent 更便宜的方式」。 重點三：同一份公告裡有一行容易被略過的註記——Sonnet 5 換了斷詞器（tokenizer），同一段文字相較舊模型會多算約 1.0–1.35 倍 token。每-token 單價降了，一次請求的實付金額未必等比例下降。

2026 年 6 月 30 日，Anthropic 把中階的 Claude Sonnet 5 推上線，並做了兩個並存的動作：把每百萬 token 的價格從標準的 3／15 美元降到優惠期的 2／10 美元（input／output，優惠到 8 月 31 日），同時讓它成為 claude.ai Free／Pro 與 Claude Code Pro 的預設模型。對每天用 Claude Code 寫程式、用 API 跑代理人（agent）迴圈的人來說，這是「不做任何設定，預設跑的那個模型換了、計價也換了」。

值得單獨拉出來看的，是官方公告裡另一行字：Sonnet 5 用了更新後的斷詞器，同一段輸入相較舊模型會被切成多約 1.0–1.35 倍的 token。token 是計價與計算脈絡的單位，一段文字被切成更多 token，代表同一則 prompt 的帳面 token 數上升。每-token 單價降了三分之一，一次請求實付變便宜多少，是另一個要分開算的問題。

TechCrunch 把這次發布定調為「跑 agent 更便宜的方式」，脈絡是 Anthropic 正朝 IPO 前進。The Decoder 則描述 Sonnet 5 的能力進一步逼近較貴的 Opus 系列。下面把可查證的數字並排，斷詞器那一層留到後面拆。

先給答案：降到哪、預設在哪、脈絡多大

如果只想知道結論：Claude Sonnet 5 於 2026 年 6 月 30 日上線，優惠價每百萬 input token 2 美元、output token 10 美元，優惠到 8 月 31 日，之後回到標準價 3／15 美元。它是 claude.ai Free／Pro 與 Claude Code Pro 的預設模型，Max／Team／Enterprise 也可使用，並經 Claude API、Amazon Bedrock、Google Vertex AI 提供。脈絡視窗 1M token（既是預設也是上限），最大輸出 128k token。官方稱它在推理、工具使用、編碼與知識工作上優於前代 Sonnet 4.6。

以上都是帳面規格。真正需要多想一步的，是計價單位本身也變了。

斷詞器怎麼吃掉降幅？同一段文字被切成更多 token

斷詞器（tokenizer）決定一段文字被切成幾個 token，而 token 同時是 Anthropic 的計價單位與模型讀寫的計算單位。Anthropic 在公告裡說明，Sonnet 5 改用更新後的斷詞器，處理文字的方式改變，使同一段輸入相較舊模型會多算約 1.0–1.35 倍 token，實際倍率依內容型態而定。

把兩股力量擺在一起看。單價這一頭往下：input 從每百萬 3 美元降到 2 美元，output 從 15 美元降到 10 美元，都約降三分之一。token 計數這一頭往上：同一段 prompt，最壞情況會被切成約 1.35 倍的 token。單價下降的效果，會被 token 計數上升部分抵銷——抵銷多少，取決於你的內容落在 1.0 到 1.35 倍的哪一段。純英文散文可能靠近 1.0、影響小；混雜程式碼、符號、多語或結構化文字的內容，倍率會往上走。

要說清楚的是，這無關模型變差或變貴；改變的是計價的刻度——「帳面每-token 價格」不再能直接換算成「一次請求的實付金額」。這一層在 output 上更值得留意：跑代理人（agent）迴圈時，模型自己產生的 token 往往遠多於使用者輸入的字，而 output 單價本來就是 input 的數倍。要知道降幅在自己身上打幾折，準確的方法只有一個：用新斷詞器實際數一次自己常跑的 prompt 與回應各有幾個 token。

一張表看完：定價、脈絡、預設位置與斷詞器影響

以下皆為 Anthropic 官方公告與 Platform Docs 揭露的規格；斷詞器倍率為官方給出的區間，非固定值。

項目	Claude Sonnet 5
上線日	2026-06-30
優惠價（至 2026-08-31）	input 2 美元／output 10 美元（每百萬 token）
標準價（優惠後）	input 3 美元／output 15 美元（每百萬 token）
脈絡視窗	1M token（預設即上限）
最大輸出	128k token
預設方案	claude.ai Free／Pro、Claude Code Pro
其他可用	Max／Team／Enterprise；Claude API、Amazon Bedrock、Google Vertex AI
斷詞器	更新後斷詞器，同一段文字相較舊模型多算約 1.0–1.35 倍 token
官方能力定位	推理／工具使用／編碼／知識工作優於 Sonnet 4.6

表格右欄每一格都是官方揭露值。要注意的是，最後一列的能力定位是 Anthropic 自述；市面流傳的各項 benchmark 分數多來自第三方聚合站、未經一手獨立查證，這裡不引為定論。The Decoder 的描述也停在定性層級——Sonnet 5「進一步縮小與較貴的 Opus 系列的差距」，而非某個具體分數。

預設換了，對每天用 Claude Code／API 的人代表什麼？

預設模型變動的實際意義，落在兩種人身上。用 claude.ai Free／Pro 對話的人，不改任何設定，回應就由 Sonnet 5 產出。用 Claude Code Pro 寫程式的人，預設跑的模型換成 Sonnet 5——這裡也包含台灣以 Claude Code／API 接案、跑自動化代理人的開發者：預設模型換了，跑一輪的計價基準也跟著換到新的價格與新的斷詞器。

1M token 的脈絡視窗同樣是每天有感的一項：它既是預設也是上限，最大輸出 128k token。對要一次塞進整個程式庫、長文件或多輪對話歷史的工作流程來說，這決定了一次請求能容納多少內容；而脈絡塞得越滿，被新斷詞器計入的 token 也越多，兩件事會一起放大。

Anthropic 另外主動標出一條能力邊界：Sonnet 5 在代理情境下的不良行為率低於 Sonnet 4.6，但執行資安任務的能力明顯低於現有 Opus 模型。這是官方自陳的取捨，讀者可自行對照自己的用途。要不要把手上的工作流程切到 Sonnet 5，取決於怎麼權衡：優惠期的較低單價、1M 脈絡、官方稱逼近 Opus 的能力，對上斷詞器帶來的 token 計數上升——這篇把數字擺齊，不替你做這個決定。

怎麼知道降幅在自己身上打幾折？先數一次 token

在把預設接受下來之前，可以做一件具體的事：拿自己最常跑的那一段 prompt 或一輪 agent 對話，用 Sonnet 5 的斷詞器數一次 token 數（input 與 output 分開數），對照 2／10 美元的優惠價，就知道帳面降幅在自己的內容上實際打幾折。內容越靠近純英文散文、折扣越接近全額；越是程式碼、符號與多語混雜，token 計數上升越多、折扣被吃掉越多。

還有一個日期要記：優惠價 8 月 31 日到期，之後回到標準的 3／15 美元。 換句話說，現在算出來的實付金額是優惠期的地板；9 月起同樣的用量，帳面單價會再往上一階。

資料來源：Anthropic〈Introducing Claude Sonnet 5〉（2026-06-30，官方 newsroom）、Anthropic Claude Platform Docs〈What’s new in Claude Sonnet 5〉、TechCrunch〈Anthropic launches Claude Sonnet 5 as a cheaper way to run agents〉（2026-06-30）、The Decoder（2026-06-30）。定價、預設位置、1M 脈絡／128k 輸出、斷詞器 1.0–1.35 倍為官方揭露；「跑 agent 更便宜」為 TechCrunch 定調；benchmark 細項分數未經一手查證，不引為定論。

SOURCES

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用，不可當事實。

MACHINE-READABLE SUMMARY

Topic: AI 戰爭
Key claims: 2026-06-30，Anthropic 發表 Claude Sonnet 5，官方定調在編碼、代理人與知識工作上優於前代 Sonnet 4.6。
introductory 定價為每百萬 input token 2 美元、output token 10 美元，優惠至 2026-08-31，之後回到標準價每百萬 input 3 美元、output 15 美元。
Sonnet 5 成為 claude.ai Free／Pro 與 Claude Code Pro 的預設模型，Max／Team／Enterprise 亦可用，並經 Claude API、Amazon Bedrock、Google Vertex AI 提供。
脈絡視窗為 1M token（同時是預設與上限），最大輸出 128k token。
Anthropic 揭露 Sonnet 5 改用更新後的斷詞器，使同一段輸入相較舊模型多算約 1.0–1.35 倍 token，帳面每-token 降價會被較高 token 計數部分抵銷。
Entities: Anthropic · Claude Sonnet 5 · Claude Code · Amazon Bedrock · Google Vertex AI
Taiwan relevance: medium
Confidence: high
Last updated: 2026-07-01
Canonical URL: https://signals.tw/articles/claude-sonnet-5-price-tokenizer/

SUGGESTED CITATION

如果 AI agent / 研究 / 報導要引用本文,建議格式如下:

矽基前沿 · AI 戰爭線（編輯：廖玄同），《Claude Sonnet 5 降價成 Claude Code 預設，帳單卻不一定變便宜：新斷詞器讓同一段話多算 token》，矽基前沿 [Si]gnals，2026-07-01。https://signals.tw/articles/claude-sonnet-5-price-tokenizer/

AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.

Claude Sonnet 5 降價成 Claude Code 預設，帳單卻不一定變便宜：新斷詞器讓同一段話多算 token

先給答案：降到哪、預設在哪、脈絡多大

斷詞器怎麼吃掉降幅？同一段文字被切成更多 token

一張表看完：定價、脈絡、預設位置與斷詞器影響

預設換了，對每天用 Claude Code／API 的人代表什麼？

怎麼知道降幅在自己身上打幾折？先數一次 token

繼續讀

Cursor、Claude Code、Windsurf、Copilot 怎麼選?2026 AI coding 工具比較

Fine-tune、RAG、還是 Prompt？AI 模型適配三條路徑的選擇框架

訂閱《矽基前沿週報》