HPE 与 NVIDIA 把 agentic AI factory 推向生产环境:重点是治理、安全和成本控制

HPE 于 2026 年 6 月 16 日公布 HPE AI Factory with NVIDIA 新能力,焦点由模型示范转向企业 agent 的安全部署、观察、资料管线和 token 效率。

HPE 在 2026 年 6 月 16 日于 HPE Discover Las Vegas 公布一批与 NVIDIA 共同推动的 AI factory 更新。这条新闻的重点不是再多一组 GPU 规格,而是企业 agentic AI 开始被放进更完整的生产环境框架:治理、安全、观察、资料准备、成本控制和 sovereign deployment。

HPE 的说法很直接:当 AI 变得更自主,企业需要新的架构去安全地运行、负责任地治理,以及以可控成本扩展。HPE Private Cloud AI 会加入 agentic AI 部署所需的控制能力,包括 NVIDIA Agent Toolkit、Nemotron open models、NemoClaw,以及 OpenShell secure runtime,让企业可以监察 agent 行为、执行政策和降低部署风险。

这代表企业 AI 的讨论正在离开「模型能力够不够」的单点问题。真正要落地时,agent 需要被登记、批准、限制工具权限,并且能够回溯异常行为。HPE 亦提到 Zerto Software 会支持识别 rogue agent actions,并用 continuous data protection 恢复到干净状态。这类能力对受监管行业尤其重要,因为 agent 的失误不只是答案错,还可能触发错误操作。

另一个值得留意的方向是资料管线。HPE 表示 Private Cloud AI 可把非结构化资料快速变成 AI-ready pipelines,并通过 HPE Alletra Storage MP X10000 的 metadata 和 governance policy 改善推理效率。文章提到在特定 benchmark 中,KV cache-aware inference optimization 可把 time to first token 改善约 20 倍,另有内部测试显示 token throughput 可提升最多 20%。

HPE Data Fabric Software 亦会把 Model Context Protocol 支持延伸到 Apache Airflow,并引入 enterprise AI inventory。这个细节很重要,因为 agent 要真正处理企业流程,不能只靠 prompt;它需要知道资料在哪里、谁可以用、上下文怎样进入工作流,以及不同系统之间如何留下治理痕迹。

NVIDIA Confidential Computing 则把安全边界推到大型 AI factory 和 sovereign AI factory。HPE 表示会在 on-premises 或主权部署中保护模型和私有资料的执行过程,通过 attestation 和 encryption 建立 chain of trust。当企业把内部资料、模型和 agent 放进同一条生产链,这种 runtime-level protection 会愈来愈关键。

整体来看,这次更新反映 agentic AI 的竞争正在进入基础设施阶段。企业不只需要一个可以回答问题的 agent,而是需要一套能处理资料、权限、审批、成本、观察和恢复的操作平台。这会是 2026 年企业 AI 能否由 pilot 走向 production 的分界线。

MODULE.002 //

更多 Insights

分享网站、AI automation、数码营销、AI news 和 VMTS 公司新闻。