矽基前沿 [Si]gnals
一個 AI 用量計費儀表的指針衝進紅色警戒區,突破一條標著月度預算上限的水平線
AI 戰爭

AI 帳單燒爆預算:企業替 token 支出裝上限

Uber 四個月燒光整年預算,Palantir 罵這是「wealth tax」

本文由 AI 協助研究與起草,矽基前沿編輯部編修,總編輯廖玄同審閱定稿。 編輯方針與 AI 使用說明

Uber 的財務團隊原本以為 2026 年的 AI 預算能撐一整年。結果四個月就見底了。

問題出在 Claude Code。這套 AI 寫程式代理人在 Uber 約 5,000 名工程師之間擴散得比財務模型預期快得多,個別工程師一個月的帳單,從 500 美元一路飆到 2,000 美元。到了四月,整年的錢已經花完。

貴不貴其實是次要的。真正壞掉的,是計費方式和預算方式對不上——你用「電表」在計費的東西,卻套進了一張「月租制」的預算表。這個錯位不是 Uber 一家的事,它同一週把 Palantir 執行長逼上 CNBC 開砲,也把模型商連夜推到後台補功能。

四個月燒光一整年:帳單是怎麼爆的

關鍵在計費單位。Claude Code 不是按席次(per-seat)收費,而是按每次模型呼叫消耗的 token 計量。同一名工程師、同一個工作天,只用來跑程式碼自動補完,和拿它在整個 monorepo 上編排一群平行代理人,帳單可以差到一個數量級。

年度預算是建立在「每個授權席次多少錢」這種可預測數字上的。當每張發票的大小改由當天的工作流決定,這張預算表就接不住了。

Uber 還親手替火上加了油:它一度用內部排行榜,按 Claude Code 的使用量替工程師排名。於是「多燒 token」直接變成一種文化誘因,帳單燒得更快(據 Fortune 報導)。

事後 Uber 把 AI 寫程式工具的支出上限,設在每個工具每人每月 1,500 美元。據報導,Walmart、Amazon、Cisco 隨後也上了類似的管控。

Palantir 的 Karp 開砲:「我在為沒有價值的 token 付錢」

七月初,Palantir 執行長 Alex Karp 上 CNBC,把這套按 token 計費直接叫成一種「wealth tax」(財富稅)。

他的說法很衝:「我在為沒有價值的 token 付錢。這些人正在偷走我這門生意的 weights 和 alpha。」他還說,幾乎「每一家企業」都對前沿模型實驗室不滿——「這些人都氣炸了。」他鎖定業界流行的 tokenmaxxing 心態反打:以為丟更多 token 就能換到更多成果,但大量消耗常常灌出一堆低品質輸出,產值卻沒同步上去。

這裡要標清楚:Karp 是利益相關方。Palantir 正在賣一套不靠 hosted token 計費的替代方案,所以他有動機把對手的商業模式講得越糟越好。他的火力值得聽,他的結論不必照單全收。

模型商連夜回應:Anthropic 把支出上限做進後台

企業真的在痛,模型商也知道。就在 Karp 開砲的同一週,Anthropic 於 7 月 3 日替 Claude Enterprise 放出一批成本管理功能——這是官方公告,不是傳聞。

新的後台做了幾件事:管理員可以設 model 權限,指定各角色能用哪些模型、新對話預設從哪個模型起跑,涵蓋 chat、Cowork 和 Claude Code,讓例行工作不會預設就跳到最貴的那顆。組織層級的支出到 75% 和 90% 會發提醒給管理員,使用者自己也會在 75%、95% 收到 in-app 通知,可以直接向管理員請求提高額度,不用中斷手上的任務。用量分析則能依 group、依 user 拆出成本,把產出(artifacts、編輯的檔案、用到的 skills)直接列在花費旁邊。

換句話說,模型商正式承認:帳單治理是個真問題,得做成產品功能,而不是丟給客戶自己想辦法。

另一條路:Palantir + Nvidia 把整套搬進你機房

Karp 不只是抱怨,Palantir 也端出了自己的答案。據 TechTimes 報導,Palantir 與 Nvidia 在 6 月 29 日發表了一套 Sovereign AI OS 參考架構:把 Nvidia 的 Blackwell Ultra GPU 和 Palantir 的 Foundry、Ontology、Apollo 疊成一整套可以 air-gapped(完全隔離外網)運作的部署——資料不出客戶邊界、沒有對外的 hosted API 呼叫。

這條路的賣點正好對著 token 計費的兩個痛點:成本不再隨用量無上限漂移,資料與 IP 也不流到第三方。代價是你得自己扛下整套基礎設施。它的實際成本與效果還沒有獨立驗證,這裡只描述定位,不預測成效。

導入前先設好的預算護欄

如果你的團隊正要(或剛剛)把 Claude Code、GitHub Copilot、Cursor 這類按用量計費的工具開給大家用,別等帳單爆了才處理。幾個可以現在就設的護欄:

  1. 先設支出上限與提醒:在組織層級設好月度上限,並把 75%/90% 的提醒打開,讓額度快滿時有人看得到,而不是月底才發現。
  2. 設好 model 預設:routine 工作預設用便宜的模型,把最貴的旗艦留給真的需要的任務。
  3. 把 token 當工作流變數,不是人頭數:估預算別用「幾個人 × 固定金額」,同一個人不同工作流的消耗差很多。
  4. 別把用量做成排行榜:Uber 的教訓——你獎勵什麼就會得到什麼,把「燒得多」當績效只會讓帳單更快見底。
  5. 分清哪些值得 air-gapped:多數場景走 hosted 就好;只有真正碰核心資料、IP 的工作流,才值得評估自建那條路的代價。

帳單治理不是月底對帳時的事後補救,它是導入 AI 的前置決策。這一輪企業、Palantir、Anthropic 各自的動作說的是同一件事:按 token 計費不會消失,但「怎麼不讓它撞爆你的預算」,得在開閘之前就想清楚。


資料來源:Anthropic(Claude Enterprise 官方公告)、Forbes、Fortune、diginomica、SemiAnalysis、TechTimes。

LEARN

想系統性學會,不只看這一則?

Claude Code 教學:用終端 AI Agent 完成真正的工作

讓 Claude Code 在你的專案裡完成一個真實任務,而且控得住權限、驗得了 diff、管得住成本。

從第 0 課開始 →

SOURCES

  1. A New analytics and cost controls are available for Claude Enterprise
  2. B Palantir Billionaire Alex Karp Calls AI Industry 'Effing Insane' In Heated Interview (Forbes)
  3. B Tokenomics — the worldview according to Palantir CEO Alex Karp (diginomica)
  4. B Uber Burns Its 2026 AI Budget In Four Months On Claude Code (Forbes)
  5. B Uber burned through its entire 2026 AI budget in four months (Fortune)
  6. B TokenBudgeting — Our Conversations with Enterprises on Token Spend (SemiAnalysis)
  7. C Palantir, Nvidia Launch Air-Gapped AI Stack as Token Billing Cracks Enterprise Budgets (TechTimes)

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用,不可當事實。

MACHINE-READABLE SUMMARY

Topic
AI 戰爭
Key claims
  • Uber 在 2026 年約四個月內燒光整年 AI 預算,主因 Claude Code 在約 5,000 名工程師間擴散得比財務模型預期快,個別帳單每月落在 500 到 2,000 美元。
  • 帳單失控的根因是計費與預算模型錯位——Claude Code 按 token 消耗計費、非按席次,同一名工程師同一天跑 autocomplete 與編排平行代理人,帳單可以天差地遠。
  • Palantir 執行長 Alex Karp 於 2026 年 7 月在 CNBC 把按 token 計費形容為「wealth tax」,並稱企業在為沒有價值的 token 付錢。
  • Anthropic 於 2026 年 7 月 3 日為 Claude Enterprise 加上 model 權限、組織層級支出上限提醒與用量成本分析,把帳單治理做進後台。
Entities
Alex Karp · Palantir · Anthropic · Claude Code · Claude Enterprise · Nvidia · Uber · tokenmaxxing
Taiwan relevance
medium
Confidence
high
Last updated
2026-07-04
Canonical URL
https://signals.tw/articles/tokenmaxxing-enterprise-ai-cost/

SUGGESTED CITATION

如果 AI agent / 研究 / 報導要引用本文,建議格式如下:

矽基前沿 · AI 戰爭線(編輯:廖玄同),《AI 帳單燒爆預算:企業替 token 支出裝上限》,矽基前沿 [Si]gnals,2026-07-04。https://signals.tw/articles/tokenmaxxing-enterprise-ai-cost/

AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.

WEEKLY [SI]GNALS

訂閱《矽基前沿週報》

每週五早上,總編輯親自寫的本週 AI 重要訊號 + 台灣視角。

5 個值得知道的訊號 · 1 個產品/模型動態 · 1 個總編判斷 · 5 分鐘讀完。

免費 · 隨時取消 · 不轉售你的 email。