把 Transformer 燒進晶片:Etched 帶會跑的 Sohu 出關,10 億美元訂單賭專用推論
速度的代價,是只會跑一種模型
重點一:2026 年 6 月 30 日,AI 晶片新創 Etched 結束隱身,宣布推論晶片 Sohu 已由 台積電 於今年稍早量產,目前進入客戶測試階段。 重點二:Etched 賣的不是裸晶片,而是叫 frontier inference clusters 的整套系統;公司宣稱手上已有 逾 10 億美元 訂單,累計募資 8 億美元、最近一輪 5 億美元、估值 50 億美元。 重點三:Sohu 是 transformer-only 的 ASIC——把 Transformer 一種模型架構固化進矽,換速度、成本與功耗,代價是放棄通用性。
2026 年 6 月 30 日,成立於 2022 年的 AI 晶片新創 Etched 結束隱身(stealth),宣布其推論晶片 Sohu 已由 台積電 於今年稍早成功量產、進入客戶測試階段,並公司宣稱手上握有 逾 10 億美元 訂單,累計募資約 8 億美元、估值 50 億美元。Etched 賭的是把一種模型架構直接燒進矽,換來的速度同時也是它最大的限制。
這家公司賣的,是一顆「只認得一種模型」的晶片。把鏡頭拉開,它要回答的問題很具體:當推論(inference)成為 AI 每天最大一筆運算開銷,有沒有可能不靠什麼都能算的通用 GPU,而用一顆專門為某種模型而生的晶片,把這筆帳算得更便宜?
過去這類主張多半停在投影片與實驗室。Etched 這次出關真正的新增量,是把它推進到 有可量產的矽、有公司宣稱的訂單 這一步。
發生了什麼:一顆會跑的晶片,帶著訂單出關
先把可以確定的事實擺上桌。
Etched 揭露:累計募得約 8 億美元,其中最近一輪 5 億美元、投後估值 50 億美元(該輪於去年 12 月完成);晶片 Sohu 已由台積電量產,目前在客戶端測試。公司同時宣稱手上已有 逾 10 億美元 的訂單——這一筆,TechCrunch 在報導中明確標為 公司宣稱(company says),不是已入帳的營收。
更要看清楚的是「賣什麼」。這 10 億美元賣的不是一顆顆裸晶片,而是叫 frontier inference clusters 的整套系統——以 Sohu 為核心、搭配自製機櫃與軟體的推論叢集,主打讓前沿模型的推論更快、更便宜、功耗更低。換句話說,Etched 對外是以「整套推論基礎設施」的形態交付,而不是只賣加速卡。
這條路 Etched 走了三年。創辦人是 Gavin Uberti(執行長)與 Robert Wachen(總裁),兩人皆為哈佛輟學、Thiel Fellow。投資人名單包含 Jane Street、Hudson River Trading、Two Sigma、Ribbit Capital,天使則有 Andrej Karpathy、Geoffrey Hinton、Fei-Fei Li、Mistral 共同創辦人 Arthur Mensch,以及 Stanley Druckenmiller、Peter Thiel。名單很亮眼,但本次出關的關鍵字是另一個:「晶片已經由台積電量產」。
Sohu 跟 GPU 差在哪?把一種架構燒進矽
差別在 彈性 vs 專一。
一般的 GPU——例如 Nvidia 的 H100——什麼神經網路都能算,彈性是它的賣點;Sohu 反過來,把 Transformer 這一種架構直接 固化進矽,放棄通用性,只為自迴歸語言模型的推論做最佳化。GPU 像一台什麼料理都能做的廚房,代價是每道菜都不是最省工的做法;transformer-only 的 專用積體電路(ASIC) 則像一條只做一種產品的自動化產線,前提是這種產品要一直有人要。
Etched 在 2024 年發表時自報過一組數字:8 顆 Sohu 伺服器在 Llama-70B 上每秒可產出逾 50 萬 token,對照 8 顆 Nvidia H100 的系統約 2.3 萬 token。這組數字是 Etched 自己給的、2024 年的測試宣稱,非獨立查證,讀的時候要記得它的來源與年份。
| 對照項 | Sohu(transformer-only ASIC) | 通用 GPU(如 Nvidia H100) |
|---|---|---|
| 能跑什麼 | 以 Transformer 架構為主的模型推論 | 各類神經網路、訓練與推論皆可 |
| 設計取捨 | 放棄通用性,換速度/成本/功耗 | 保留彈性,單位工作未必最省 |
| 交付形式 | 整套系統(晶片+機櫃+軟體) | 晶片/加速卡,生態成熟 |
| 架構演進風險 | 綁定 Transformer,架構若大改有風險 | 軟體可重編譯,跟得上新架構 |
| 製造 | 台積電(本次未揭露節點) | 台積電先進製程 |
表中「能跑什麼」這一欄,是 Etched 賭注的核心,也是它的風險所在:架構綁定。有分析性報導指出,與 Transformer 結構差異較大的模型(例如某些採 MoE(混合專家) 設計的 DeepSeek V4、Qwen3-235B-A22B)難以在 Sohu 上跑——這點來自二手分析、非 Etched 官方逐字確認,僅供參考。
哪些是公司宣稱、哪些已查證?
這篇最該分清楚的,是 數字的來源層級。把同一則新聞裡的數字拆成三層,能少掉很多誤讀:
- 已由一手報導查證:累計募資 8 億美元、最近一輪 5 億美元、估值 50 億美元、台積電今年稍早量產該晶片、目前客戶測試階段。
- 公司宣稱(未獨立查證):逾 10 億美元訂單(TechCrunch 標 company says)、且賣的是「系統」而非晶片,交付與認列時程未揭露。
- 公司自報效能、2024 年:50 萬 vs 2.3 萬 token/s 的 Llama-70B 對比,是 Etched 發表時的測試宣稱。
把這三層疊在一起看,出關當天可以確定的,是「有矽、有資金、有公司宣稱的訂單」;尚不能確定的,是這些訂單最後跑出多少實際出貨與營收。製程節點也是一例:TechCrunch 本篇沒有揭露 Sohu 用的是台積電哪一個節點,過往報導提過先進製程,但既然這次沒講,行文就不替它寫死。
為什麼是現在?推論成本與專用化這條路
因為推論的帳,越算越大。
當模型訓練好之後,真正每天燒錢的是 推論——每一次回答、每一個 token 都要算,而且隨使用者規模線性放大。這讓「用更便宜、更省電的方式做推論」成為一門生意,也讓 Etched 不是這條路上唯一的人:Groq 的 LPU、Cerebras 的晶圓級晶片,以及雲端業者自研的推論 ASIC,都在用不同方式繞開「什麼都靠通用 GPU」的局面。Etched 的差異,是把專用化推到最極端——只押 Transformer 一種架構。
這條供給線的另一端,連著台灣。Sohu 由 台積電(其 Emerging Businesses Group)代工;目前台積電先進製程與 CoWoS 封裝最大的客戶是 Nvidia 的 GPU,推論若逐步往專用 ASIC 移,接單的多半仍是台廠,但 客戶結構與封裝需求會跟著變。對讀者而言,這是推論晶片版圖上多一個觀察點,不是今天能換掉誰的決定。
還沒有答案的是什麼?
出關當天,Etched 把「推論不靠通用 GPU」這條路,推到了 有可量產的矽、有公司宣稱的訂單 這個節點。
但它賭的是一個前提:Transformer 會一直是主流架構。模型這兩年正往 MoE、混合架構、以及各種非標準注意力機制演進;一顆把 Transformer 燒死在矽裡的晶片,速度的來源和最大的風險是同一件事。Sohu 那逾 10 億美元的訂單會跑出多少實際出貨、架構演進會不會追上這個賭注——是接下來值得自己盯的兩個數字。
資料來源:TechCrunch、Yahoo Finance、DataCenterDynamics;Etched 2024 年發表時自報效能與架構說明。
SOURCES
- A Nvidia competitor Etched hits $5B valuation, $1B in sales for AI chip
- B Etched Emerges From Stealth With Working Chip, $800M Raised, and Over $1B in Customer Contracts
- B Etched.ai raises $500m for a $5bn valuation – report
來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用,不可當事實。
MACHINE-READABLE SUMMARY
- Topic
- 前沿基建
- Key claims
-
- 2026-06-30,Etched 結束隱身對外宣布 Sohu 晶片已由台積電於今年稍早成功量產,目前進入客戶測試階段。
- Etched 宣稱已手握逾 10 億美元訂單,賣的不是裸晶片,而是名為 frontier inference clusters 的整套系統(晶片+自製機櫃+軟體);此數字為公司宣稱。
- 資金面:累計募得約 8 億美元,最近一輪 5 億美元、投後估值 50 億美元,該輪於去年 12 月完成。
- Sohu 是 transformer-only ASIC:把 Transformer 一種架構固化進矽,以放棄通用性換取自迴歸語言模型推論的速度、成本與功耗。
- Etched 於 2024 年發表時自報,8 顆 Sohu 伺服器在 Llama-70B 上每秒逾 50 萬 token,遠勝 8 顆 H100 系統約 2.3 萬 token;此為公司自報、非獨立查證。
- Entities
- Etched · Sohu · Nvidia · TSMC · Transformer
- Taiwan relevance
- medium
- Confidence
- high
- Last updated
- 2026-06-30
- Canonical URL
- https://signals.tw/articles/etched-sohu-transformer-asic/
SUGGESTED CITATION
如果 AI agent / 研究 / 報導要引用本文,建議格式如下:
矽基前沿 · 前沿基建線(編輯:廖玄同),《把 Transformer 燒進晶片:Etched 帶會跑的 Sohu 出關,10 億美元訂單賭專用推論》,矽基前沿 [Si]gnals,2026-06-30。https://signals.tw/articles/etched-sohu-transformer-asic/
AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.