矽基前沿 [Si]gnals
一顆編輯化的客製 AI 推論晶片置中,標示克制的 Jalapeño 字樣,旁邊以極簡圖示暗示推論的請求進、回應出,角落以克制色塊標記 OpenAI 與博通協作
前沿基建

最大的 Nvidia 買家之一,自己做了一顆晶片:OpenAI 與博通發表首顆客製推論 ASIC「Jalapeño」

九個月從設計到流片,目標年底前先上線——但它只跑推論、只給自己用

本文由 AI 協助研究與起草,矽基前沿編輯部編修,總編輯廖玄同審閱定稿。 編輯方針與 AI 使用說明

重點一:2026 年 6 月 24 日,OpenAI博通(Broadcom) 共同發表 OpenAI 第一顆客製晶片 Jalapeño——一顆專為大型語言模型「推論」(inference,跑已訓練好的模型回應使用者)設計的 ASIC,OpenAI 稱它為 Intelligence Processor

重點二:兩家宣稱這顆晶片從設計到流片(tape-out)只花九個月,是高效能先進製程 ASIC 史上最快的開發週期之一;早期樣品已在實驗室跑、宣稱每瓦效能顯著領先,目標 2026 年底前先部署,之後逐年擴至吉瓦規模

重點三:Jalapeño 是 OpenAI 與博通 2025 年 10 月宣布的「10 吉瓦 OpenAI 自研加速器」合作(金融時報估約 3,500–5,000 億美元)的第一個產品——只做推論、自己用不外售,路線同 Google 的 TPU、Amazon 的 Trainium,目的之一是降低對 Nvidia 的依賴。

結果先講:全球最會買 Nvidia GPU 的那幾家公司裡,有一家自己做了一顆矽。

這家公司是 OpenAI——ChatGPT 背後每天回應數億次請求、對運算的胃口大到要簽下數十吉瓦電力合約的那一家。2026 年 6 月 24 日,它和晶片大廠博通(Broadcom)一起發表了 OpenAI 的第一顆客製晶片,代號 Jalapeño。兩家公司給出的最醒目數字是時間:這顆晶片從初始設計到流片只花了九個月,是他們口中高效能先進製程 ASIC 史上最快的開發週期之一;早期工程樣品已經在實驗室以接近量產的頻率與功耗跑機器學習工作負載。

值得往下讀的,不是「又一家科技公司做晶片」。而是這顆晶片有兩條容易被忽略的界線,和一個容易被讀錯的時間差:它只做推論、不做訓練,而且只給 OpenAI 自己用、不對外賣;它也不是憑空冒出來的新事件,而是 2025 年 10 月那紙 10 吉瓦合約交出來的第一個產品,現在還停在樣品階段。下面把這幾件事分開講。

Jalapeño 是什麼?一顆只跑「推論」、OpenAI 自己用的晶片

先界定這顆晶片做什麼、不做什麼。

AI 晶片的工作大致分兩種:訓練(training,把模型練出來,算力與耗電的巨獸)和推論(inference,模型練好之後,每次有人輸入問題就跑一次、給出回應)。Jalapeño 專攻的是後者。OpenAI 把它定位成一顆 Intelligence Processor,架構是圍繞「跑前沿模型推論」這件事最在意的環節去設計——OpenAI 官方說法是針對 kernels、記憶體搬移、網路與服務模式做最佳化。據 TechCrunch,OpenAI 總裁 Greg Brockman 的說法是:「我們對工作負載有很深的理解,一直在找那些被服務不足的特定工作負載。」

為什麼挑推論?因為推論是 ChatGPT 的長期帳單。訓練是一次性的大支出,推論則是每天、每次對話都在累積的營運成本——模型用得越多、推論的電費與晶片折舊就越重。一顆專為自家推論工作負載設計、宣稱每瓦效能顯著優於現有最先進方案的晶片,動的是這條長期成本曲線。

第二條界線是自用。Jalapeño 不像 Nvidia 的 GPU 那樣賣給全世界,它是 OpenAI 給自己機隊用的(captive)。所以它改變的不是「你買誰的晶片」,而是 OpenAI 自身的成本結構,和它對外部供應商的依賴程度。

為什麼九個月就做出來,又為什麼是「現在」發表?

九個月從設計到流片,對一顆高效能先進製程晶片是很短的時間——傳統大型晶片的開發週期常以年計。兩家公司把這個速度當成這次發表的賣點之一,並說 OpenAI 用自家的 AI 模型協助加速了開發。這個「九個月」是公司自己的宣稱,目前沒有獨立驗證。

至於「為什麼是現在」,答案藏在更早的一份合約裡。2025 年 10 月 13 日,OpenAI 與博通就宣布過一份策略合作:要部署 10 吉瓦(GW)的 OpenAI 自研加速器,由 OpenAI 設計晶片與系統、博通共同開發與部署,機櫃以博通的乙太網路(Ethernet)方案串接,部署自 2026 下半年起、預計 2029 年底前完成。金融時報當時估這份計畫可能耗費 OpenAI 約 3,500 至 5,000 億美元

把這兩件事接起來,今天這顆 Jalapeño 的身分就清楚了:它是那紙 10GW 合約的第一個實體產品。6 月 24 日交出來的,是這條多世代運算路線的第一顆晶片,不是一個獨立的新戰役。

把四個時間點分開讀:宣布不等於出貨

這則新聞最容易被讀錯的地方是時間。把幾個關鍵時間點攤開:

事件時間
與博通宣布 10GW 自研加速器母約2025-10-13(已發生)
Jalapeño 發表、樣品在實驗室跑2026-06-24(已發生)
Jalapeño 初始部署目標2026 年底前
10GW 機櫃部署起點 → 完成2026 下半年 → 2029 年底前

也就是說,6 月 24 日交出來的主要是「第一顆晶片 + 樣品 + 路線圖」,不是貨架上的規模產能。早期樣品確實已經在實驗室跑,初始部署目標也訂在今年底前,但要鋪到資料中心、達到吉瓦規模,是 2027 到 2029 這條更長的時間線。把「發表」讀成「已經在取代 Nvidia」,會高估它眼前能搬動的實際算力。

同一條路:Google 有 TPU、Amazon 有 Trainium,現在輪到 OpenAI

OpenAI 自己做矽,不是孤例,而是大型 AI 業者已經走了好幾年的一條路。

Google 有自研的 TPU、Amazon 有自研的 Trainium,兩家都用自家晶片承接一部分原本要交給 Nvidia GPU 的工作負載。其動機相近:當你的運算規模大到一定程度,把晶片、kernel、記憶體系統、網路、排程到產品體驗整條疊在一起做「全端」最佳化,能把成本與效能握在自己手裡,也降低對單一供應商的議價依賴。

Jalapeño 把 OpenAI 加進這份名單。差異點在於 OpenAI 同時是最大的 Nvidia GPU 買家之一——一個大買家開始自製,訊號的份量不同於一家本來就自研的雲端業者。但要把界線講準:自研推論晶片是降低依賴,不是「擺脫」或「取代」Nvidia——OpenAI 並未這麼宣稱,而 Jalapeño 限定在推論、限定在自用。

官方還沒說的是什麼?

最後一層,留給官方至今沒有公布的部分——這也是讀者接下來可以自己盯的地方。

代工廠與製程節點,官方沒講。有多家二手媒體報導 Jalapeño 由台積電(TSMC)的 3nm 製程代工,但這項至今未經 OpenAI 或博通官方證實;在官方揭露之前,把它寫成「台積電將代工 Jalapeño」是越線的。對台灣讀者而言,這個問號值得記著:若代工關係日後證實,台灣晶圓代工就直接落在這條供給線上——但目前只能停在「報導、未證實」。

同樣停在未證實或官方未量化的,還有幾項在網路上流傳的數字:例如「某大型雲端客戶將買下首批產能的特定比例」「單一推論 token 成本較現有 GPU 方案降低約若干」這類說法,都缺乏一手來源支撐;官方對效能只給了「每瓦效能顯著優於現有最先進方案」這種定性說法,沒有可獨立驗證的基準數字。

把今天這件事收束成一句最關鍵的事實:OpenAI 把「自己做推論矽」從一紙 10 吉瓦的合約,推進到了第一顆實體晶片——但它還在實驗室樣品階段,年底前才先部署,而連這顆晶片在哪裡、用什麼製程造出來,官方都還沒說。


資料來源:OpenAI、Broadcom 官方新聞稿;CNBC、TechCrunch、Tom’s Hardware、VentureBeat。

SOURCES

  1. A OpenAI and Broadcom unveil LLM-optimized inference chip(OpenAI, 2026-06-24)
  2. A OpenAI and Broadcom Unveil LLM-Optimized Intelligence Processor(Broadcom, 2026-06-24)
  3. A OpenAI and Broadcom announce strategic collaboration to deploy 10 gigawatts of OpenAI-designed AI accelerators(OpenAI, 2025-10-13)
  4. B OpenAI and Broadcom reveal Jalapeño, first AI chip in partnership(CNBC, 2026-06-24)
  5. B OpenAI unveils its first custom chip, built by Broadcom(TechCrunch, 2026-06-24)
  6. B Broadcom and OpenAI unveil custom-built Jalapeño inference processor(Tom's Hardware, 2026-06-24)
  7. B OpenAI unveils first custom AI inference chip, Jalapeño, with Broadcom(VentureBeat, 2026-06-24)

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用,不可當事實。

MACHINE-READABLE SUMMARY

Topic
前沿基建
Key claims
  • 2026 年 6 月 24 日,OpenAI 與博通(Broadcom)共同發表 OpenAI 第一顆客製晶片 Jalapeño,一顆專為大型語言模型推論設計的 ASIC,OpenAI 稱為 Intelligence Processor。
  • 兩家公司宣稱 Jalapeño 從初始設計到流片只花九個月,是高效能先進製程 ASIC 史上最快的開發週期之一,且 OpenAI 用自家 AI 模型協助加速開發。
  • 早期工程樣品已在實驗室以接近量產目標的頻率與功耗跑機器學習工作負載,宣稱每瓦效能顯著優於現有最先進方案;初始部署目標訂在 2026 年底前,之後逐年擴大至吉瓦規模。
  • Jalapeño 是 OpenAI 與博通 2025 年 10 月 13 日宣布的「10 吉瓦 OpenAI 自研加速器」合作的第一個產品;該合作以乙太網路串接機櫃、部署自 2026 下半年起、預計 2029 年底前完成,金融時報估該計畫可能耗費 OpenAI 約 3,500 至 5,000 億美元。
  • OpenAI 總裁 Greg Brockman 表示「我們對工作負載有很深的理解,一直在找那些被服務不足的特定工作負載」;自研路線與 Google TPU、Amazon Trainium 一致,目的之一是降低對 Nvidia GPU 的依賴;晶片自用、不對外販售。
  • Jalapeño 的代工廠與製程節點官方未揭露;有二手媒體報導由台積電 3nm 代工,但未經 OpenAI 或博通官方證實。
Entities
OpenAI · Broadcom · Jalapeño · Greg Brockman · Nvidia · Google · Amazon · Ethernet
Taiwan relevance
medium
Confidence
high
Last updated
2026-06-25
Canonical URL
https://signals.tw/articles/openai-broadcom-jalapeno-inference-chip/

SUGGESTED CITATION

如果 AI agent / 研究 / 報導要引用本文,建議格式如下:

矽基前沿 · 前沿基建線(編輯:廖玄同),《最大的 Nvidia 買家之一,自己做了一顆晶片:OpenAI 與博通發表首顆客製推論 ASIC「Jalapeño」》,矽基前沿 [Si]gnals,2026-06-25。https://signals.tw/articles/openai-broadcom-jalapeno-inference-chip/

AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.

WEEKLY [SI]GNALS

訂閱《矽基前沿週報》

每週五早上,總編輯親自寫的本週 AI 重要訊號 + 台灣視角。

5 個值得知道的訊號 · 1 個產品/模型動態 · 1 個總編判斷 · 5 分鐘讀完。

免費 · 隨時取消 · 不轉售你的 email。