NVIDIA 這篇 Vera CPU 技術文，重點不是再一次宣傳 AI chip，而是把 AI Factory 的瓶頸講得更具體。當 AI agent 開始跑工具、執行 sandbox、查資料、寫 code、評估結果，CPU 就不再只是 GPU 旁邊的配角。它要負責大量短而密集、分支很多、又需要低延遲的工作。

文章提出一個清晰轉向：傳統 cloud CPU 常以 cores per dollar 去衡量，但 AI Factory 更需要 tokens per dollar、output per watt 和任務完成時間。這代表基礎設施設計要由「塞更多核心」轉向「每個 agentic step 都不能卡住」。對長鏈式工作流程來說，單核性能、記憶體頻寬和 predictable latency 會直接影響完成速度。

Vera CPU 的規格亦反映這個方向。NVIDIA 指出 Vera 結合 88 個 Olympus cores、最高 1.2 TB/s LPDDR5X memory bandwidth，以及 Scalable Coherency Fabric。這些設計不是為了一個大型 batch job，而是為了同時支撐 tool calls、Python 或 JavaScript sandbox execution、資料處理、retrieval 和 orchestration。

比較值得留意的是，NVIDIA 把 agentic sandbox performance 放到核心指標。原文提到 Vera 在滿載下，於多種 agentic workload 上比 x86-based architecture 有超過 1.8 倍 sandbox performance。這不只是 benchmark 數字，而是說明未來 agent infrastructure 的成本，會落在大量細碎執行環境、記憶體搬運和任務排程上。

對市場來說，Vera 的訊號很直接：AI agent 不是只需要更強模型，還需要專門為代理式執行設計的 infrastructure。當 agent 由回答問題走向執行任務，CPU、memory、fabric、network 和 security layer 都會變成產品能力的一部分。

NVIDIA Vera CPU：AI Factory 開始為代理式工作負載重設 CPU 標準

更多 Insights

CrowdStrike + NVIDIA：AI Factory security 要做到資料路徑同代理行為層

Google Managed Agents 登場：Gemini API 直接提供沙盒代理同狀態接續

NVIDIA JetPack 7.2：agentic AI 開始落到 edge device 同 physical AI