
NVIDIA 在 2026 年 5 月 18 日表示,首批 Vera CPU 系统已由 NVIDIA 团队交付到 Anthropic、OpenAI、SpaceXAI 和 Oracle Cloud Infrastructure。这条新闻值得留意,因为它把 agentic AI 的基建问题由 GPU 延伸到 CPU、内存和 orchestrated workload。
过去谈 AI 基建,大部分焦点都在 GPU。NVIDIA 今次的说法是 agentic AI 并不只靠 GPU:每一个 agent sandbox、tool call、orchestration layer、long-context retrieval 和资料分析,都会消耗大量 CPU 工作。当模型由「回答」走向「行动」,后端系统要承受的并行任务会变得更复杂。
Vera 被定位为 NVIDIA 第一款 custom CPU,专为 agentic AI 设计。NVIDIA 表示 Vera 拥有 88 个自家设计的 Olympus cores、1.2TB/s memory bandwidth,以及在 full load 下 50% 更快的 per-core performance。OCI 亦表示计划自 2026 年起部署数十万颗 Vera CPU,以支持大规模企业 AI。
这个方向有一个很实际的含义:AI agent 的成本和可靠性不只由模型决定。当 agent 要写 Python、跑测试、查资料、管理 long-context state、执行沙盒、调用多个工具和同步多个任务,CPU 和系统架构会直接影响延迟、吞吐量和成本。
对企业来说,这提示 AI agent 导入不能只问「用哪个模型」。生产级 agent 需要可管理的执行环境、资料流、沙盒、观察性和资源隔离。硬件层正在因为 agentic workload 改变,软件架构亦需要同步改变,否则 agent 数量一多就容易遇到成本和可靠性问题。
对中小企而言,未必需要直接采购这种基建,但仍值得理解背后趋势。未来 AI workflow 报价、速度和稳定性,很大程度会受「agent 背后如何执行」影响。选择云端平台、agent 供应商或自建系统时,执行层设计会愈来愈重要。
NVIDIA Vera 的讯号是,agentic AI 已不再只是模型产品,而是一整套 compute architecture。当 OpenAI、Anthropic 和 OCI 这类玩家开始测试专用 CPU,市场其实已经承认:能否高效承载 agent 工作流,会成为下一阶段 AI 基建竞争的核心。



