
NVIDIA 這篇 Vera CPU 技術文,重點不是再一次宣傳 AI chip,而是把 AI Factory 的瓶頸講得更具體。當 AI agent 開始跑工具、執行 sandbox、查資料、寫 code、評估結果,CPU 就不再只是 GPU 旁邊的配角。它要負責大量短而密集、分支很多、又需要低延遲的工作。
文章提出一個清晰轉向:傳統 cloud CPU 常以 cores per dollar 去衡量,但 AI Factory 更需要 tokens per dollar、output per watt 和任務完成時間。這代表基礎設施設計要由「塞更多核心」轉向「每個 agentic step 都不能卡住」。對長鏈式工作流程來說,單核性能、記憶體頻寬和 predictable latency 會直接影響完成速度。
Vera CPU 的規格亦反映這個方向。NVIDIA 指出 Vera 結合 88 個 Olympus cores、最高 1.2 TB/s LPDDR5X memory bandwidth,以及 Scalable Coherency Fabric。這些設計不是為了一個大型 batch job,而是為了同時支撐 tool calls、Python 或 JavaScript sandbox execution、資料處理、retrieval 和 orchestration。
比較值得留意的是,NVIDIA 把 agentic sandbox performance 放到核心指標。原文提到 Vera 在滿載下,於多種 agentic workload 上比 x86-based architecture 有超過 1.8 倍 sandbox performance。這不只是 benchmark 數字,而是說明未來 agent infrastructure 的成本,會落在大量細碎執行環境、記憶體搬運和任務排程上。
對市場來說,Vera 的訊號很直接:AI agent 不是只需要更強模型,還需要專門為代理式執行設計的 infrastructure。當 agent 由回答問題走向執行任務,CPU、memory、fabric、network 和 security layer 都會變成產品能力的一部分。



