Granite 4.0 1B Speech:紧凑、多语言、面向边缘

发布: (2026年3月10日 GMT+8 02:36)
3 分钟阅读

Source: Hugging Face Blog

概览

我们很高兴分享 Granite 4.0 1B Speech,这是 IBM 的 Granite Speech 系列 的最新成员。Granite 4.0 1B Speech 旨在资源受限设备上的企业应用,是一个紧凑的语音语言模型,支持多语言自动语音识别 (ASR) 和双向语音翻译 (AST)。

关键亮点

  • 规模: 参数量仅为前代模型 granite‑speech‑3.3‑2b 的一半。
  • 语言: 英语、法语、德语、西班牙语、葡萄牙语以及日语(新增日语 ASR 支持)。
  • 特性: 关键字列表偏置,可更好地识别人名和缩写。
  • 性能: 通过投机解码实现更高的英语转录准确率和更快的推理速度。
  • 认可度:OpenASR 排行榜 上排名第一。

性能

尽管体积小,Granite 4.0 1B Speech 在标准英语 ASR 基准上仍能取得极具竞争力的结果。性能采用 词错误率 (WER) 进行衡量——即转录错误的词占总词数的百分比,数值越低表示准确率越高。

基准结果

englishasr
图表 1:Granite 4.0 1B Speech 在众多基准上实现了竞争力极强的低 WER,同时保持模型小巧。

许可与使用

  • 许可证: Apache 2.0。
  • 框架支持:TransformersvLLM 原生集成。
  • 评估: 该模型已在一系列标准 ASR 与 AST 基准上进行评估——覆盖英语、多语言以及翻译任务,表现与更大模型持平或更佳。

完整的评估结果、架构细节、训练数据和使用示例,请参阅 模型卡片

生产建议

我们建议在需要额外风险检测的部署场景中,将 Granite 4.0 1B Speech 与 Granite Guardian 组合使用。

今天就试试看吧,并告诉我们你的使用感受!

0 浏览
Back to Blog

相关文章

阅读更多 »

AI会抢走我的工作吗?

AI 能做的事 - 自动驾驶汽车可以取代出租车司机。 - AI 生成的软件可以替代许多初级开发者。 - 配备 AI 的机器人系统可以…