Grok Imagine 1.5 Preview:xAI 将 image-to-video 模型放入 API workflow

xAI 于 2026 年 6 月 3 日推出 grok-imagine-video-1.5-preview,让开发者用单张起始图片、自然语言 motion prompt 和 API 生成最高 720p 视频片段。

xAI 这次 Grok Imagine 1.5 Preview 的重点,不只是又一个 text-to-video 或 image-to-video demo,而是把视频生成放进 API workflow。`grok-imagine-video-1.5-preview` 于 2026 年 6 月 3 日开始以 preview 形式通过 xAI API 提供,开发者可以把单张 still image 变成 fluid, cinematic video。

产品定位很清楚:用户提供 starting frame,再用自然语言描述 motion,模型会在保留 source image 细节和光线的前提下,生成 camera move、atmosphere 和 physics。这与一般重新生成一段视频不同,因为它更像是把既有视觉 asset 延伸成可控片段,而不是完全重新诠释画面。

xAI 也强调 shot direction。prompt 可以指定 camera move、节奏、声音设计、resolution 和 clip length,最高支持 720p clips。对 marketing、产品展示、游戏素材、社交短片和 prototype 内容来说,这代表团队可以先定 key visual,再逐段生成 movement,而不是每次由零开始。

另一个值得留意的能力,是 sequence workflow。xAI 表示可以先 stage 每一个 frame,再把它们逐段动画化,串成更长场景,同时保持整个 project 的一致 look。这对内容团队很重要,因为真正的 production bottleneck 往往不是单段生成,而是多段镜头之间的连贯性。

API sample 也显示 xAI 想把 Grok Imagine 放进程序化内容管线。开发者可以用 `xai_sdk` 调用 video.generate,传入 image_url、duration、resolution 和 prompt,然后取得 response URL。这种形态适合接入 DAM、CMS、广告素材生成、landing page variation 或内部 creative review 工具。

限制同样要看清楚。preview、720p、image-to-video 和短 clip,代表它更适合早期素材探索、hero motion、产品概念展示和社交片段,而不是完整长片制作。企业使用时仍要处理版权、品牌一致性、人物肖像、素材来源和审批流程。

Grok Imagine 1.5 的核心讯号,是 AI media workflow 正由互动式生成走向 API-first production。当图片、prompt、shot direction 和输出 URL 都可以被系统调度,AI marketing 不再只是「出图」,而是开始变成可编排、可审批、可批量化的内容流程。

MODULE.002 //

更多 Insights

分享网站、AI automation、数码营销、AI news 和 VMTS 公司新闻。