OpenAI Codex 更新:更強上下文、Goal mode 與鎖機遠端工作把 coding agent 推向長任務

OpenAI 於 2026 年 5 月 21 日更新 Codex,加入 Appshots、Goal mode、瀏覽器標註、locked computer use 和多項瀏覽器能力,讓 coding agent 更適合長時間工作流程。

OpenAI 在 2026 年 5 月 21 日發布 Codex 更新,重點不是單一模型能力,而是讓 coding agent 更懂得讀取工作現場、維持長任務,以及在更安全的邊界內遠端執行。這類更新對開發工作流有實際意義,因為 AI coding 已經由「幫手寫一段 code」走向「跟住目標持續處理一組任務」。

今次最值得留意的是 Appshots。Codex macOS app 可以用快捷鍵把某個應用視窗附加到 thread,連同截圖和可讀文字一併提供。這解決了一個常見問題:開發者很多時要先花很長 prompt 解釋自己正在看甚麼畫面、哪個錯誤、哪個設計細節。Appshots 把這些上下文轉成更接近工作現場的輸入。

Goal mode 亦正式一般可用,覆蓋 Codex app、IDE extension 和 CLI。它讓用戶定義目標和驗收標準,然後讓 Codex 持續向結果推進。這個設計方向很重要,因為真實開發任務往往不是單步命令,而是包含探索、修改、測試、修正、再驗證的循環。Goal mode 把「要完成甚麼」放到中心,而不是只處理下一條指令。

瀏覽器相關能力同樣強化。OpenAI 提到 in-app browser annotations 可以提供更精準的前端樣式 feedback;browser use improvements 包括 advanced annotation mode、更快抽取圖片資產、read-only JavaScript context、分頁分組可用性改善、減少 Chrome extension 分頁雜訊,以及可靠性提升。這些更新特別貼近前端和內容工作,因為很多問題需要看畫面、抽資產、查 DOM 或理解瀏覽器狀態。

另一個訊號是 locked computer use。合資格的 Mac Computer Use 用戶,可以讓 Codex 在 Mac 鎖定後繼續遠端安全工作,受既有 Computer Use 區域限制約束。這代表 coding agent 的工作模式正在接近長時間背景任務:人不一定全程坐在電腦前,但仍需要權限、授權時效和安全控制。

對團隊來說,這些功能合起來的意義,是 coding agent 正由 prompt 工具轉向任務協作者。它需要知道你看到甚麼、目標是甚麼、完成標準是甚麼、瀏覽器狀態如何、哪些操作可以在遠端繼續。上下文和驗收標準變得比單次回覆更重要。

這亦改變了團隊導入 AI coding 的做法。以前很多人會問哪個模型寫 code 最準;現在更應該問任務如何拆分、驗收如何寫清楚、哪些畫面上下文要提供、何時需要人工批准、哪些測試要成為完成門檻。模型能力提升之外,工作流程設計本身正在成為生產力差距。

今次 OpenAI 更新的核心訊號很清楚:AI coding agent 的競爭已經進入「長任務、真上下文、可驗收、可遠端」階段。對需要處理網站、後台、自動化和內容發佈的團隊來說,這類能力會逐步把 AI 由輔助輸入,推向真正可管理的開發工作流。

MODULE.002 //

更多 Insights

分享網站、AI automation、數碼營銷、AI news 和 VMTS 公司新聞。