NVIDIA 在 2026 年 5 月 18 日表示，首批 Vera CPU 系统已由 NVIDIA 团队交付到 Anthropic、OpenAI、SpaceXAI 和 Oracle Cloud Infrastructure。这条新闻值得留意，因为它把 agentic AI 的基建问题由 GPU 延伸到 CPU、内存和 orchestrated workload。

过去谈 AI 基建，大部分焦点都在 GPU。NVIDIA 今次的说法是 agentic AI 并不只靠 GPU：每一个 agent sandbox、tool call、orchestration layer、long-context retrieval 和资料分析，都会消耗大量 CPU 工作。当模型由「回答」走向「行动」，后端系统要承受的并行任务会变得更复杂。

Vera 被定位为 NVIDIA 第一款 custom CPU，专为 agentic AI 设计。NVIDIA 表示 Vera 拥有 88 个自家设计的 Olympus cores、1.2TB/s memory bandwidth，以及在 full load 下 50% 更快的 per-core performance。OCI 亦表示计划自 2026 年起部署数十万颗 Vera CPU，以支持大规模企业 AI。

这个方向有一个很实际的含义：AI agent 的成本和可靠性不只由模型决定。当 agent 要写 Python、跑测试、查资料、管理 long-context state、执行沙盒、调用多个工具和同步多个任务，CPU 和系统架构会直接影响延迟、吞吐量和成本。

对企业来说，这提示 AI agent 导入不能只问「用哪个模型」。生产级 agent 需要可管理的执行环境、资料流、沙盒、观察性和资源隔离。硬件层正在因为 agentic workload 改变，软件架构亦需要同步改变，否则 agent 数量一多就容易遇到成本和可靠性问题。

对中小企而言，未必需要直接采购这种基建，但仍值得理解背后趋势。未来 AI workflow 报价、速度和稳定性，很大程度会受「agent 背后如何执行」影响。选择云端平台、agent 供应商或自建系统时，执行层设计会愈来愈重要。

NVIDIA Vera 的讯号是，agentic AI 已不再只是模型产品，而是一整套 compute architecture。当 OpenAI、Anthropic 和 OCI 这类玩家开始测试专用 CPU，市场其实已经承认：能否高效承载 agent 工作流，会成为下一阶段 AI 基建竞争的核心。

NVIDIA Vera CPU 交付 OpenAI、Anthropic 与 OCI：Agentic AI 开始需要新的 CPU 层

更多 Insights

GitHub Copilot Memory 加入删除、repo 关闭和 CLI 控制：AI 记忆开始变成管理对象

GitHub Copilot Memory 加入个人偏好：代码开发代理开始记住工作风格

Dell 与 NVIDIA 推 Deskside Agentic AI：企业代理由云端走向桌边与数据中心