字面上的动听:Gemini 现在创作并制作歌曲
Source: Android Authority

Gemini 被想象成音乐作曲家和词曲作者。图片由 Gemini 创建。
TL;DR
- Gemini 现在可以仅通过文本或图像提示创建完整的歌曲,包括歌词。
- 它还使用 Nano Banana 为曲目生成配套的专辑封面。
- 此功能对免费和付费用户均广泛可用。
Gemini 向音频的演进
近年来,Gemini 的表现大幅提升。最近的 Gemini 3 更新 将其照片和视频质量提升到近乎不现实的高标准,而更近期的 deep thinking 升级进一步增强了其编码和研究能力。在文本、图像、视频和代码生成方面表现出色后,Gemini 现在将注意力转向音频——具体来说,是音乐。
随着今日的更新,Gemini 在 AI 驱动的音乐生成方面迈出了重要一步,允许用户仅通过简单的文本或图像提示创作音乐。此功能由 Google DeepMind 全新升级的 Lyria 3 文本转音频模型提供支持。虽然早期的 Lyria 版本仅限于实验性工具,如 MusicFX 或 PromptDJ,但 Google 现在通过 Gemini 移动应用和网页界面向更广泛的受众开放了该技术,正如我们上个月在Android Authority 文章中所指出的那样。
Google 表示,用户可以描述一个概念或上传一张图片,Gemini 将其转换为“一段高质量、朗朗上口的曲目”。新功能还能生成歌词,并制作出包含精心层叠乐器的复杂、悦耳的音乐混音。迄今为止,Suno 等应用在 AI 生成音乐领域占据主导地位,但 Gemini 现在提供了一个可比拟且完全集成的解决方案。
之前的 Lyria 模型只能生成有限的样本,需要人工专业知识进行层叠和编排才能形成完整作品。它们也能为 YouTube Shorts 或 Pixel 9 与 10 系列手机的 Recorder 应用 生成短小的乐器片段,但这些主要充当填充或背景音乐。
通过此次更新,Gemini 能够创建 30 秒的曲目,并配以使用 Gemini Nano 生成的专辑封面。用户可以通过额外指令微调曲目的各种方面——节奏、音乐风格、演唱方式——甚至可以提供已有音乐作为灵感来源。
防止未经授权使用受版权保护的曲目
Google 对复制原创音乐持坚定立场。每段生成的曲目都包含一个隐藏的 SynthID,帮助平台区分 AI 生成的音乐与人类创作的作品。Google 说明,在训练新模型时已“关注版权和合作伙伴协议”,并声称不会模仿现有艺术家。输出的曲目会与现有音乐内容进行比对,以避免侵权,用户也可以举报任何看似被复制的音乐。
与其他 Gemini 实验不同,Google 正全力投入音乐创作。该功能正以 beta 形式在多种语言中推出,包括英语、法语、印地语、德语、日语、韩语、葡萄牙语和西班牙语。除了 Gemini 本身,这一能力还将在 YouTube Shorts 的 Dream Track 音频生成器中提供。
该功能对免费和付费的 Gemini 用户均可使用,但可用积分的多少取决于订阅状态。