Kling AI 发布 VIDEO 2.6:首款具备原生音频的模型,提供增强的多媒体体验
Source: Dev.to
概览
Kling AI 正在生成式 AI 领域掀起波澜,推动视频创作的可能性边界。他们的最新创新 VIDEO 2.6 不仅是另一轮迭代;它代表了一次重大飞跃,尤其体现在其突破性的特性:原生音频。此版本标志着多媒体内容生成的关键时刻,使我们更接近真正沉浸式、逼真的 AI 生成体验。
什么是“原生音频”?
传统上,AI 视频模型通常只生成画面,音频则是单独的、往往需要手动后期处理的步骤,或由另一个模型生成后再进行同步。这种做法可能导致体验割裂,音画之间缺乏自然的关联。
VIDEO 2.6 通过将音频生成直接整合进核心视频创作流程来改变这一点。模型能够同时理解并生成视觉和听觉元素,从而产生更连贯、与情境高度相关的声场,并且天然同步于屏幕上的动作和叙事。想象一下,AI 生成的角色能够以完美对口型的声音说话,或环境拥有自然的背景音效,无需任何手动拼接。
对创作者的影响
原生音频在 VIDEO 2.6 中的意义广泛且具变革性:
- 简化工作流 – 减少大量音频后期制作需求,加快迭代速度。
- 营销 – 能够制作更具吸引力的广告。
- 电影制作 – 让场景草稿更具真实感。
- 教育 – 促进带有集成旁白和音效的动态学习材料。
此举不仅提升了 AI 生成视频的质量和真实感,也降低了高质量多媒体制作的门槛。Kling AI 的 VIDEO 2.6 搭配原生音频清晰表明,AI 驱动内容的未来将是整体化、集成化,并且日益难以与现实区分,为数字叙事和沉浸式体验开辟全新时代。