矽基前沿 [Si]gnals
AI 模型時間線示意 (placeholder)
大百科

AI 模型時間線:從 GPT-3 到 2026 年的關鍵節點

過去 6 年 AI 巨變,3 個月就要重學一次——這是 baseline timeline

從 2020 年 GPT-3 公開到 2026 年的 AI 模型時間線。把過去 6 年的關鍵 release、技術轉折、產業事件按時間整理,讓讀者建立 AI 演進的 baseline。Quarterly 更新。

署名 周詠晴 編輯 廖玄同 AI 協作: 初稿輔助

過去 6 年的 AI 變化有多快?

2020 年 GPT-3 第一次讓「LLM 能寫文章」這件事變成 viral。 2022 年 ChatGPT 把它推進日常。 2024 年 o1 讓 LLM 開始「先想再答」。

每隔 12-18 個月就有質變。要追上這個速度,得有一個共同 baseline。

這是矽基前沿維護的 AI 模型時間線。從 2020 年 GPT-3 起算,標記每年的關鍵 release、技術轉折、產業事件。Quarterly review,維持 evergreen。

2017-2019:Pre-LLM 紀元

2017 — Google 發表 Transformer 架構(Attention Is All You Need 論文),這是後來所有 LLM 的基礎。

2018 — OpenAI GPT-1(117M params)、Google BERT。研究圈先動。

2019 — GPT-2(1.5B params)。能寫看起來像人的文章,OpenAI 一開始不公開「怕被濫用」。

2020:LLM 元年

2020-06GPT-3 公開(175B params)。第一次有人感受到「scale 帶來質變」。Few-shot learning 出現。商業 API 開放。

這年技術圈還沒大眾化,但 builder 圈已經知道發生了什麼。

2021-2022:走向消費者

2021 — Codex(GitHub Copilot 背後)、DALL-E 2 圖像模型、InstructGPT(後來變 ChatGPT 的 base)、Anthropic 從 OpenAI 分家。

2022-11-30ChatGPT 公開。5 天破百萬用戶,5 個月破億。AI 進入主流意識。

2022 也是 Stable Diffusion 開源的年份,圖像生成走向開放生態。

2023:模型大爆發

  • 2023-03GPT-4 公開(估計 ~1.7T params,MoE 架構)。Multimodal(看圖)首次出現。
  • 2023-03Claude 1 釋出。Anthropic 正式商業化。
  • 2023-07Llama 2 開源(Meta)。第一個能商業使用的高品質開源模型。
  • 2023-12Gemini 1.0 公開(Google,前身 Bard)。

技術轉折:RLHF(基於人類回饋的 RL) 變成 alignment 標配。Constitutional AI(Anthropic)成另一條路。

2024:multimodal、reasoning、agent 三件事一起發生

  • 2024-02Claude 3 family(Opus / Sonnet / Haiku),image understanding 強化。
  • 2024-02Gemini 1.5 Pro,context window 突破 1M token,首次「丟整本書」變可能。
  • 2024-04Llama 3(Meta),開源模型逼近商業旗艦。
  • 2024-05GPT-4o,realtime voice 出現。
  • 2024-09OpenAI o1:reasoning model 第一次公開,test-time compute 變主流。
  • 2024-11Anthropic 公開 MCP(Model Context Protocol)。Agent infra 開始標準化。
  • 2024-12DeepSeek V3 公開,中國團隊用相對小成本做出對標 GPT-4 的模型。

2025:open source 趕上、agent 商品化

  • 2025-01DeepSeek R1 開源,reasoning model 首次完全開源。震撼業界。
  • 2025-02Claude 3.7 / Sonnet thinking 釋出,Anthropic 加入 reasoning model 戰局。
  • 2025-Q2Gemini 2.0 / 2.5 family,thinking 模式 + 長 context 整合。
  • 2025-Q3GPT-5 公開。
  • 2025 全年 — Claude Code 在工程師圈口碑超越 Cursor;MCP 從 Anthropic 主導變多家共識(OpenAI、Google、Microsoft 跟進)。
  • 2025Apple Intelligence 進度落後仍未追上,Apple 開始尋求 partner 合作。

2026:目前狀態

  • 多模態變預設:GPT-5 / Claude Opus 4 / Gemini 2.5 都是 native multimodal,不再是 text-only。
  • Reasoning model 普及:每家旗艦都有 thinking 模式,test-time compute 成為下一個競賽軸線。
  • Agent infra 成熟:MCP 是事實標準,IDE agent / 客服 agent / research agent 進入 production。
  • 繁中模型加速:TAIDE 2026 釋出 Gemma-3-TAIDE-12B、聯發科 Breeze 2(8B/3B + BreezyVoice),繁中 + 多模態本地化。
  • 訓練成本繼續下降:同樣能力的訓練成本 18 個月降 90% 已是常態。
  • 開源逼近頂尖:Llama 4、Qwen、DeepSeek 在多數真實 use case 上接近(70-90%)頂級閉源模型。

三個質變節點怎麼看

回頭看,過去 6 年的真正 inflection point 只有三個:

節點關鍵 release為什麼是質變
2020-06GPT-3Scale 帶來 emergent abilities,LLM 商業化開始
2022-11ChatGPTAI 進入大眾意識,消費者市場誕生
2024-09o1Test-time compute 成為新戰場,「先想再答」改寫成本曲線

下一個 inflection point 還沒清楚 — 候選包括:agent 完全 productionize、true autonomy、physical embodiment(機器人)、AGI level capability(若你相信這個概念)。

對台灣讀者的意義

第一,記住量級而非數字。 模型 benchmark 過幾個月就過時,記「能力量級」(比 GPT-3 強多少倍?能做什麼以前做不到的事?)比記精確分數重要。

第二,訓練成本下降是 builder 的好消息。 18 個月成本降 90% 意味著今年難以做到的事,明年可能做得到。產品設計要 plan for cost decline。

第三,繁中模型出現是策略機會。 TAIDE / Breeze 等繁中專屬模型雖然比不上頂級閉源,但在繁中專業 use case + 在地知識上有 differentiated advantage。

Updates

(每季 quarterly review 後更新到此處。)

  • 2026-04-25:初版發布,涵蓋至 2026 Q2。

收尾

時間線本身會過時,但整理 timeline 的習慣不會。

矽基前沿會 quarterly 更新這篇,把新出現的 release / 轉折補進去。把這頁加進書籤,一年後回來看 timeline 的拉長。

SOURCES

  1. A OpenAI — Models documentation
  2. A Anthropic — Claude model family
  3. A Google — Gemini timeline

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用,不可當事實。

MACHINE-READABLE SUMMARY

Topic
大百科
Key claims
  • 2020-2026 是 AI 模型從「研究突破」變成「商業基礎建設」的 6 年。三個質變節點:GPT-3(2020)、ChatGPT(2022)、reasoning model(2024)。
  • 2024 是另一個分水嶺:multimodal 變預設、reasoning model 出現、open source 趕上、agent 成為產品形態。
  • 2025-2026 重點:test-time compute、agent infra(MCP)、繁中與多語言模型開源加速、訓練成本繼續下降。
  • 2026 年的 LLM 競爭已從「誰模型強」轉到「distribution / 入口 / agent ecosystem」(見 AI 巨頭戰爭文)。
Entities
GPT-3 · GPT-4 · GPT-5 · ChatGPT · Claude · Gemini · Llama · DeepSeek · o1 · MCP
Taiwan relevance
medium
Confidence
medium
Last updated
2026-04-25
Canonical URL
https://signals.tw/articles/2026-ai-model-timeline/

SUGGESTED CITATION

如果 AI agent / 研究 / 報導要引用本文,建議格式如下:

周詠晴(編輯:廖玄同),《AI 模型時間線:從 GPT-3 到 2026 年的關鍵節點》,矽基前沿 [Si]gnals,2026-04-25。https://signals.tw/articles/2026-ai-model-timeline/

AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.

WEEKLY [SI]GNALS

訂閱《矽基前沿週報》

每週五早上,總編輯親自寫的本週 AI 重要訊號 + 台灣視角。

5 個值得知道的訊號 · 1 個產品/模型動態 · 1 個總編判斷 · 5 分鐘讀完。

免費 · 隨時取消 · 不轉售你的 email。