Veo 视频模型在 AI Gateway 上
发布: (2026年2月19日 GMT+8 21:00)
3 分钟阅读
原文: Vercel Blog
Source: Vercel Blog
功能特性
- 原生音频生成: 自动生成逼真的音效、环境音,甚至与视频匹配的对白。
- 最高支持 4K 分辨率: 可生成 720p、1080p 或 4K 视频。
- 写实质量: 适用于自然、野生动物和电影级场景的真实感。
- 图像转视频: 为静态照片添加自然运动,实现动画化。
- 快速模式: 在需要快速迭代时提供更快的生成速度。
两种入门方式
视频生成仍处于测试阶段,当前仅对 Pro、Enterprise 计划以及付费 AI Gateway 用户开放。
- AI SDK 6 – 使用
generateVideo以编程方式生成视频:
import { experimental_generateVideo as generateVideo } from 'ai';
const { videos } = await generateVideo({
model: 'google/veo-3.1-generate-001',
prompt: 'Woman sipping coffee by a rain‑streaked window, cozy morning light.',
});
- Gateway Playground – 在可配置的 AI Gateway playground 中无需代码即可实验视频模型。比较供应商、微调提示词,并直接从模型列表下载结果。
可用模型
| 模型 | 描述 |
|---|---|
google/veo-3.1-generate-001 | 最新一代,最高质量 |
google/veo-3.1-fast-generate-001 | 快速模式,适合更快的迭代 |
google/veo-3.0-generate-001 | 完整质量生成 |
google/veo-3.0-fast-generate-001 | 快速模式生成 |
简单:文本转视频并配音
描述场景即可获得带同步音频的视频。以下示例使用 google/veo-3.1-generate-001 并开启 generateAudio: true:
import { experimental_generateVideo as generateVideo } from 'ai';
const { videos } = await generateVideo({
model: 'google/veo-3.1-generate-001',
prompt: `Close‑up of a great horned owl
turning its head slowly in a moonlit forest.`,
aspectRatio: '16:9',
providerOptions: {
vertex: { generateAudio: true },
},
});
高级:图像转视频并加入对白
常见工作流是先使用 Gemini 3 Pro Image(Nano Banana Pro)生成自定义图像,然后通过 Veo 为其添加运动和语音对白。
使用 Nano Banana Pro 生成的起始图像:

使用带图像输入的提示词可获得更精细的控制。以下示例使用支持图像转视频的 google/veo-3.1-generate-001:
import { experimental_generateVideo as generateVideo } from 'ai';
const { videos } = await generateVideo({
model: 'google/veo-3.1-generate-001',
prompt: {
image: imageUrl,
text: `The podcast host says "Welcome back to the show! Today we are diving
into something really exciting." with a friendly smile, rain falling on
window, cozy atmosphere.`,
},
aspectRatio: '16:9',
duration: 4,
providerOptions: {
vertex: { generateAudio: true },
},
});