字面上的动听：Gemini 现在创作并制作歌曲

发布: 3天前 (2026年2月19日 GMT+8 00:00)

5 分钟阅读

Source: Android Authority

Gemini 被想象成音乐作曲家和词曲作者。图片由 Gemini 创建。

TL;DR

Gemini 现在可以仅通过文本或图像提示创建完整的歌曲，包括歌词。
它还使用 Nano Banana 为曲目生成配套的专辑封面。
此功能对免费和付费用户均广泛可用。

Gemini 向音频的演进

近年来，Gemini 的表现大幅提升。最近的 Gemini 3 更新将其照片和视频质量提升到近乎不现实的高标准，而更近期的 deep thinking 升级进一步增强了其编码和研究能力。在文本、图像、视频和代码生成方面表现出色后，Gemini 现在将注意力转向音频——具体来说，是音乐。

随着今日的更新，Gemini 在 AI 驱动的音乐生成方面迈出了重要一步，允许用户仅通过简单的文本或图像提示创作音乐。此功能由 Google DeepMind 全新升级的 Lyria 3 文本转音频模型提供支持。虽然早期的 Lyria 版本仅限于实验性工具，如 MusicFX 或 PromptDJ，但 Google 现在通过 Gemini 移动应用和网页界面向更广泛的受众开放了该技术，正如我们上个月在Android Authority 文章中所指出的那样。

Google 表示，用户可以描述一个概念或上传一张图片，Gemini 将其转换为“一段高质量、朗朗上口的曲目”。新功能还能生成歌词，并制作出包含精心层叠乐器的复杂、悦耳的音乐混音。迄今为止，Suno 等应用在 AI 生成音乐领域占据主导地位，但 Gemini 现在提供了一个可比拟且完全集成的解决方案。

之前的 Lyria 模型只能生成有限的样本，需要人工专业知识进行层叠和编排才能形成完整作品。它们也能为 YouTube Shorts 或 Pixel 9 与 10 系列手机的 Recorder 应用生成短小的乐器片段，但这些主要充当填充或背景音乐。

通过此次更新，Gemini 能够创建 30 秒的曲目，并配以使用 Gemini Nano 生成的专辑封面。用户可以通过额外指令微调曲目的各种方面——节奏、音乐风格、演唱方式——甚至可以提供已有音乐作为灵感来源。

防止未经授权使用受版权保护的曲目

Google 对复制原创音乐持坚定立场。每段生成的曲目都包含一个隐藏的 SynthID，帮助平台区分 AI 生成的音乐与人类创作的作品。Google 说明，在训练新模型时已“关注版权和合作伙伴协议”，并声称不会模仿现有艺术家。输出的曲目会与现有音乐内容进行比对，以避免侵权，用户也可以举报任何看似被复制的音乐。

与其他 Gemini 实验不同，Google 正全力投入音乐创作。该功能正以 beta 形式在多种语言中推出，包括英语、法语、印地语、德语、日语、韩语、葡萄牙语和西班牙语。除了 Gemini 本身，这一能力还将在 YouTube Shorts 的 Dream Track 音频生成器中提供。

该功能对免费和付费的 Gemini 用户均可使用，但可用积分的多少取决于订阅状态。

字面上的动听：Gemini 现在创作并制作歌曲

TL;DR

Gemini 向音频的演进

防止未经授权使用受版权保护的曲目

相关文章

Record scratch——Google的 Lyria 3 AI 音乐模型今天将加入 Gemini

Google宣布Gemini 3.1 Pro用于“复杂问题解决”

YouTube 在电视应用上测试“对话式 AI”

2026年 AI Agent Simulation 的最佳平台