Grok Imagine 1.5 Preview:xAI 將 image-to-video 模型放入 API workflow

xAI 於 2026 年 6 月 3 日推出 grok-imagine-video-1.5-preview,讓開發者用單張起始圖片、自然語言 motion prompt 和 API 生成最高 720p 影片片段。

xAI 這次 Grok Imagine 1.5 Preview 的重點,不只是又一個 text-to-video 或 image-to-video demo,而是把影片生成放進 API workflow。`grok-imagine-video-1.5-preview` 於 2026 年 6 月 3 日開始以 preview 形式透過 xAI API 提供,開發者可以把單張 still image 變成 fluid, cinematic video。

產品定位很清楚:使用者提供 starting frame,再用自然語言描述 motion,模型會在保留 source image 細節和光線的前提下,生成 camera move、atmosphere 和 physics。這與一般重新生成一段影片不同,因為它更像是把既有視覺 asset 延伸成可控片段,而不是完全重新詮釋畫面。

xAI 也強調 shot direction。prompt 可以指定 camera move、節奏、聲音設計、resolution 和 clip length,最高支援 720p clips。對 marketing、產品展示、遊戲素材、社交短片和 prototype 內容來說,這代表團隊可以先定 key visual,再逐段生成 movement,而不是每次由零開始。

另一個值得留意的能力,是 sequence workflow。xAI 表示可以先 stage 每一個 frame,再把它們逐段動畫化,串成更長場景,同時保持整個 project 的一致 look。這對內容團隊很重要,因為真正的 production bottleneck 往往不是單段生成,而是多段鏡頭之間的連貫性。

API sample 亦顯示 xAI 想把 Grok Imagine 放進程式化內容管線。開發者可以用 `xai_sdk` 呼叫 video.generate,傳入 image_url、duration、resolution 和 prompt,然後取得 response URL。這種形態適合接入 DAM、CMS、廣告素材生成、landing page variation 或內部 creative review 工具。

限制同樣要看清楚。preview、720p、image-to-video 和短 clip,代表它更適合早期素材探索、hero motion、產品概念展示和社交片段,而不是完整長片製作。企業使用時仍要處理版權、品牌一致性、人物肖像、素材來源和審批流程。

Grok Imagine 1.5 的核心訊號,是 AI media workflow 正由互動式生成走向 API-first production。當圖片、prompt、shot direction 和輸出 URL 都可以被系統調度,AI marketing 不再只是「出圖」,而是開始變成可編排、可審批、可批量化的內容流程。

MODULE.002 //

更多 Insights

分享網站、AI automation、數碼營銷、AI news 和 VMTS 公司新聞。