矽基前沿 [Si]gnals
終端機畫面上一張會自己打勾的進度清單,旁邊是 /goal 的 status、pause、resume、clear 四個指令
工作現場

Grok Build 多了一個 /goal:你給一個目標就走人,xAI 的編碼代理人自己規劃、執行、再驗證

交給 AI 的單位,從一句話變成一個目標

本文由 AI 協助研究與起草,矽基前沿編輯部編修,總編輯廖玄同審閱定稿。 編輯方針與 AI 使用說明

重點一xAI6 月 22 日為終端編碼代理人 Grok Build 加入 /goal——你描述一個目標,代理人自己規劃做法、拆成進度清單、逐項執行,並在過程中自我驗證,直到任務完成且通過驗證。

重點二:/goal 帶 status/pause/resume/clear 四個子指令(看即時進度、停工保留目標、接續、整個放棄),把「目標」做成可中途插手的可操控物件;使用需 SuperGrok 或 X Premium Plus 訂閱,Grok CLI 以單行指令安裝。

重點三:這條「長程自動執行+自我驗證」賽道不是 xAI 獨有——OpenAI Codex CLIClaude CodeCursor 都在做同一件事;真正在變的,是人交給代理人的「單位」從一句提示變成一個可以走開的目標。

6 月 22 日xAI 為自家終端編碼代理人 Grok Build 加了一個叫 /goal 的模式。你在終端機裡敲下一個目標——「把這個服務的舊登入流程換成新的,並確認頁面還能正常跑」——然後敲 /goal,就可以站起來去倒杯咖啡。

螢幕上不再是一行行等你回覆的提問,而是一張代理人自己列出、會逐項打勾的進度清單;它一邊改、一邊回頭跑腳本確認自己沒改壞。你交給 AI 的東西,從「一句要它補完的提示」換成了「一個它要自己跑到完成的目標」。

過去一年,工程師談「用 AI 寫程式」談的是補完與對話;2026 年要多看一層:你交付的『單位』正在從一句話,變成一個你可以走開的目標/goal 不是這條路的起點,但它把這件事做得夠具體,值得用它當切片,看清楚整條賽道走到哪。

/goal 到底做了什麼?

據 xAI 的官方變更日誌與多家報導,/goal 的運作是一條 「規劃 → 執行 → 驗證」 的迴圈。你給一個目標,Grok Build 先分析、提出做法,把工作拆成一張可追蹤的進度清單,然後開始逐項執行;過程中你還能持續追加指示,不必等它停下來問。

關鍵在最後那個「驗證」。xAI 說,代理人 「可能回頭審自己寫的程式、檢查網頁以確認行為、或執行腳本來測試結果」——任務沒驗證通過前,它會持續工作,而不是寫完就回報「做好了」。這一步把「自己檢查作業」放進了同一個迴圈:它不只是把程式碼吐出來,還要試著證明那段程式碼真的有效。這正是「長程自動執行」與早期「一問一答」最大的差別——後者把對不對留給你判斷,前者試著自己先判斷一次。

長程任務跑久了,需要的是能中途插手的把手。/goal 給了四個:

  • /goal status:叫出即時進度面板,看它做到哪、卡在哪。
  • /goal pause:停工,但保留目標與進度。
  • /goal resume:從暫停處接續,不必重講一次。
  • /goal clear:整個目標不要了,清掉重來。

安裝是一行 curl 指令把 Grok CLI 裝起來,使用 /goal 需要 SuperGrok 或 X Premium Plus 訂閱。這四個指令看似瑣碎,卻是「把一個會跑很久的東西交出去」時真正需要的操作面——你要看得到它在幹嘛、喊得停、也接得回來。

為什麼說「交付單位」變了,而不只是多一個功能?

把鏡頭拉遠一點看。AI 寫程式這件事,這兩年交給代理人的「單位」一直在變大:最早是逐字補完(一行 autocomplete,你打字它猜下一段),接著是一次對話一個回合(你問、它答、你再追問),現在是一個你描述完就可以走開的目標。每往上一級,代理人一次扛的工作量、以及你需要盯著它的時間,都在改變。

/goal 的四個子指令,正好把這個「目標」變成一個看得見、抓得住的東西——它有狀態(status 看得到)、可以暫停與接續(pause/resume)、也可以丟掉(clear)。一個你能掛起、能接回、能放棄的東西,已經比較像專案管理裡的一張工單,而不像一次聊天。

對工作方式的影響很具體。你和代理人之間的互動,從「一來一回的對話」變成「交付一個目標、偶爾回來看面板」。盯著它打字、逐段確認的時間少了;但把目標定義清楚(要做到什麼程度、什麼叫完成)、以及事後驗收(它說做好了,到底有沒有)的責任,反而變重了。換句話說,工程師的施力點從「過程中的微操」往「前面的定義」和「後面的把關」兩端移。

這也是這條線真正的張力所在:當代理人會自己宣稱「驗證通過」,那道驗收關卡到底站不站得住,就成了你敢不敢真的走開的前提。它說它跑過測試了——但測試夠不夠、有沒有測到你真正在意的那條路,仍然是人要回答的問題。

同一條賽道,四家怎麼做?

把「目標」交出去、讓代理人長時間自己跑並自我查核,並不是 xAI 獨有的方向。Grok Build 進場時,這條賽道上已經有好幾家在跑。 下面這張表把四家的做法擺在一起——能力月月在變,以各家官方文件為準:

工具交給代理人的單位怎麼操控長程任務自我驗證取得門檻
Grok Build /goal(xAI)一個顯式的「目標」物件statuspauseresumeclear 四個指令xAI 說會審程式碼、檢查網頁、跑腳本測結果SuperGrok 或 X Premium Plus 訂閱
OpenAI Codex CLI一個任務/工作階段內建 planexecreview 結構化迴圈跑測試、迭代修復;官方稱可長時間無人值守執行ChatGPT 付費方案或 API
Claude Code(Anthropic)一個任務的 agent loopplan mode 先規劃再執行、可中斷接續可跑測試、依結果反覆修Claude 訂閱或 API 計費
Cursor 背景代理人一個背景任務(可平行多個)在雲端 VM 上執行、面板追蹤可用瀏覽器視覺驗證 UI 變更Cursor 訂閱

擺在一起就看得出來:四家方向一致,差別在交付單位的形狀(一個目標、一個任務、一個 loop、一個背景作業)、操控的把手,以及在哪裡跑(本機終端,還是雲端 VM)。Cursor 把代理人推到雲端、還能平行開好幾個並用瀏覽器驗 UI;Codex CLI 與 Claude Code 走本機終端、貼著你的 repo 跑;Grok Build 的 /goal 可辨識的地方,是把「目標」做成一個帶生命週期指令的顯式物件,讓你像管一張工單那樣管它。

至於哪一種更合用,取決於你的工作流、既有訂閱、以及你願不願意把程式碼丟上雲端跑——這篇不替你選。值得記住的是:當四家都往「交一個目標、它自己跑到驗完」走,這個方向本身已經不是某一家的賣點,而是這一代編碼代理人的共同形狀。

把更長的任務交出去前,先盯哪兩件事?

第一件是自我驗證的可靠度/goal 最吸引人的地方是「它會自己檢查」,但 xAI 給的是機制描述,不是效果保證——代理人能不能真的測對輸出,決定了你能不能放心走開。實務上,把驗證標準寫進目標(要跑哪些測試、什麼叫「行為正確」、哪些頁面一定要能開),比單純相信它一句「驗過了」更實在。代理人自評通過、但漏測了關鍵路徑,是這類長程任務最典型的失手點。

第二件是取得門檻。Grok Build 綁 SuperGrok 或 X Premium Plus 訂閱,對台灣多數以 Claude/OpenAI 系工具為主力的工程團隊來說,這是要不要把 xAI 這條線納進既有工作流的現實成本;多接一條代理人線,也意味著多一套要熟悉的指令、計費與權限邊界。

要不要把更長的任務交給代理人、交給哪一家,這篇不下結論。但有一個判準對四家都適用:先看它「自己說驗過了」這句話,你信得過幾分——這一格信任,目前還是人在補。


資料來源:xAI Grok Build changelog、MarkTechPost、TechTimes、KuCoin、OpenAI Developers、Anthropic Claude Code documentation、Cursor Documentation。

LEARN

想系統性學會,不只看這一則?

用 Claude Code 完成真正的工作

讓 Claude Code 在你的專案裡完成一個真實任務,而且控得住權限、驗得了 diff、管得住成本。

從第 0 課開始 →

SOURCES

  1. A Grok Build changelog(xAI 官方變更日誌)
  2. B xAI Launches /goal in Grok Build, Adding Long-Running Autonomous Execution With Built-In Verification for Multi-Step Coding Tasks
  3. B Grok Build Ships Autonomous Execution: xAI Agent Now Plans, Runs, and Verifies
  4. B Grok Build Launches /goal Autonomous Mode for Unattended Development
  5. B Run long horizon tasks with Codex(OpenAI Developers)
  6. B Claude Code documentation(Anthropic)
  7. B Cursor Documentation

來源分級:A = 一手公告/論文/官方文件 · B = 可信媒體 · C = 可參考但需脈絡 · D = 觀察用,不可當事實。

MACHINE-READABLE SUMMARY

Topic
工作現場
Key claims
  • 2026 年 6 月 22 日,xAI 在終端編碼代理人 Grok Build 加入 /goal 長程自動執行模式:描述一個目標,代理人自己拆成進度清單、逐項執行,直到完成並通過驗證。
  • 據 xAI,/goal 執行中會自我驗證——可能回頭審自己寫的程式、檢查網頁確認行為、或執行腳本測試結果,未通過前持續工作。
  • /goal 帶 status、pause、resume、clear 四個子指令,分別是看即時進度面板、停工但保留目標、接續、整個放棄。
  • 使用 /goal 需 SuperGrok 或 X Premium Plus 訂閱,Grok CLI 以單行 curl 指令安裝。
  • 長程自動執行加自我驗證並非 xAI 獨有:OpenAI Codex CLI、Claude Code、Cursor 都在做同一條賽道。
Entities
xAI · Grok Build · Grok CLI · SuperGrok · X Premium Plus · OpenAI Codex CLI · Claude Code · Cursor
Taiwan relevance
medium
Confidence
medium
Last updated
2026-06-29
Canonical URL
https://signals.tw/articles/xai-grok-goal-autonomous-mode/

SUGGESTED CITATION

如果 AI agent / 研究 / 報導要引用本文,建議格式如下:

矽基前沿 · 工作現場線(編輯:廖玄同),《Grok Build 多了一個 /goal:你給一個目標就走人,xAI 的編碼代理人自己規劃、執行、再驗證》,矽基前沿 [Si]gnals,2026-06-29。https://signals.tw/articles/xai-grok-goal-autonomous-mode/

AI agents / search engines may quote, summarize, and cite with attribution and a link back to the canonical URL above. See /for-ai-agents for full policy.

WEEKLY [SI]GNALS

訂閱《矽基前沿週報》

每週五早上,總編輯親自寫的本週 AI 重要訊號 + 台灣視角。

5 個值得知道的訊號 · 1 個產品/模型動態 · 1 個總編判斷 · 5 分鐘讀完。

免費 · 隨時取消 · 不轉售你的 email。