Nightingale – 开源卡拉OK应用,可在电脑上使用任意歌曲

发布: (2026年3月18日 GMT+8 16:06)
3 分钟阅读

Source: Hacker News

Nightingale

概览

将任何歌曲转换为卡拉OK。一个自包含的派对游戏,能够分离人声、转录歌词,并以单词级同步和音高评分的方式回放。

下载

功能

🎤 声部分离

使用 UVR Karaoke 模型或 Demucs 将人声从伴奏中分离。引导人声音量可调。

📝 单词级歌词

WhisperX 对每个单词进行转录并对齐音频。若已有 LRCLIB 的歌词,则直接使用。

🎯 音高评分

对着麦克风演唱,实时获得评分。星级评价和每首歌的排行榜记录你的进度。

👤 玩家档案

支持多个档案,各自拥有独立的得分历史。切换歌手时不会丢失记录。

🎬 视频文件支持

.mp4.mkv 文件拖入库中。人声被分离,原始视频作为背景播放。

🌌 动态背景

GPU 着色器特效(等离子、极光、星云…),Pixabay 视频循环,或视频文件本身作为背景。

🎮 手柄

使用手柄(方向键、摇杆、面键)即可导航菜单、选歌和控制播放。

📦 单一二进制文件

ffmpeg、Python、PyTorch 以及机器学习模型在首次启动时自动引导。无需额外安装。

工作原理

分离

UVR Karaoke 或 Demucs 将音轨拆分为人声和伴奏。视频文件会自动提取音频。

转录

首先在 LRCLIB 上查找同步歌词。若未找到,则使用 WhisperX 对人声进行单词级对齐转录。

播放

伴奏播放时同步显示高亮歌词、音高评分、动态背景,并支持手柄操作。

平台

支持 Linux、macOS 和 Windows。可在支持的情况下使用 CUDA 或 Metal 进行 GPU 加速,其他情况下回退到 CPU。

  • Linux: x86_64、aarch64
  • macOS: ARM、Intel
  • Windows: x86_64
0 浏览
Back to Blog

相关文章

阅读更多 »

我发现字体设计的那一天

五十年前的本月,1976年3月,我20岁时,对字体设计的兴趣由此萌生。!https://www.marksimonson.com/_astro/Mark_1976.CUI1PPRz_Z1hRTVk.webp

对独立 AI Grid 的需求

苦涩的教训告诉我们,要通过扩大计算规模来解锁前沿 AI 的进展。经验记录证实了这一点。专注的、独立的团队已经展示了……

Waymo 比人类司机安全13倍

出了点问题,但别担心——我们再试一次。!https://abs-0.twimg.com/emoji/v2/svg/26a0.svg 某些隐私相关的扩展可能导致问题…