Veo 视频模型在 AI Gateway 上

发布: 3天前 (2026年2月19日 GMT+8 21:00)

3 分钟阅读

原文: Vercel Blog

Source: Vercel Blog

功能特性

原生音频生成： 自动生成逼真的音效、环境音，甚至与视频匹配的对白。
最高支持 4K 分辨率： 可生成 720p、1080p 或 4K 视频。
写实质量： 适用于自然、野生动物和电影级场景的真实感。
图像转视频： 为静态照片添加自然运动，实现动画化。
快速模式： 在需要快速迭代时提供更快的生成速度。

两种入门方式

视频生成仍处于测试阶段，当前仅对 Pro、Enterprise 计划以及付费 AI Gateway 用户开放。

AI SDK 6 – 使用 generateVideo 以编程方式生成视频：

import { experimental_generateVideo as generateVideo } from 'ai';

const { videos } = await generateVideo({
  model: 'google/veo-3.1-generate-001',
  prompt: 'Woman sipping coffee by a rain‑streaked window, cozy morning light.',
});

Gateway Playground – 在可配置的 AI Gateway playground 中无需代码即可实验视频模型。比较供应商、微调提示词，并直接从模型列表下载结果。

可用模型

模型	描述
`google/veo-3.1-generate-001`	最新一代，最高质量
`google/veo-3.1-fast-generate-001`	快速模式，适合更快的迭代
`google/veo-3.0-generate-001`	完整质量生成
`google/veo-3.0-fast-generate-001`	快速模式生成

简单：文本转视频并配音

描述场景即可获得带同步音频的视频。以下示例使用 google/veo-3.1-generate-001 并开启 generateAudio: true：

import { experimental_generateVideo as generateVideo } from 'ai';

const { videos } = await generateVideo({
  model: 'google/veo-3.1-generate-001',
  prompt: `Close‑up of a great horned owl
           turning its head slowly in a moonlit forest.`,
  aspectRatio: '16:9',
  providerOptions: {
    vertex: { generateAudio: true },
  },
});

高级：图像转视频并加入对白

常见工作流是先使用 Gemini 3 Pro Image（Nano Banana Pro）生成自定义图像，然后通过 Veo 为其添加运动和语音对白。

使用 Nano Banana Pro 生成的起始图像：

播客主持人插图

使用带图像输入的提示词可获得更精细的控制。以下示例使用支持图像转视频的 google/veo-3.1-generate-001：

import { experimental_generateVideo as generateVideo } from 'ai';

const { videos } = await generateVideo({
  model: 'google/veo-3.1-generate-001',
  prompt: {
    image: imageUrl,
    text: `The podcast host says "Welcome back to the show! Today we are diving
           into something really exciting." with a friendly smile, rain falling on
           window, cozy atmosphere.`,
  },
  aspectRatio: '16:9',
  duration: 4,
  providerOptions: {
    vertex: { generateAudio: true },
  },
});

了解更多

视频生成文档 – 详细的配置选项和示例。
视频生成快速入门 – 简单的上手脚本。

Veo 视频模型在 AI Gateway 上

功能特性

两种入门方式

可用模型

简单：文本转视频并配音

高级：图像转视频并加入对白

了解更多

相关文章

技能之夜：69,000+ 种方式让代理变得更聪明

Streamdown 2.3 — 全新设计与交互式实验场

使用 AI 网关进行视频生成

WAN模型在AI网关上