Granite 4.0 1B Speech: 컴팩트, 다국어 지원, 엣지용

발행: (2026년 3월 10일 AM 03:36 GMT+9)
3 분 소요

Source: Hugging Face Blog

Overview

우리는 Granite 4.0 1B Speech, **IBM의 Granite Speech 컬렉션**에 최신으로 추가된 모델을 소개하게 되어 기쁩니다. 리소스가 제한된 디바이스에서 기업용 애플리케이션을 위해 설계된 Granite 4.0 1B Speech는 다국어 자동 음성 인식(ASR) 및 양방향 음성 번역(AST)을 위한 컴팩트한 음성‑언어 모델입니다.

주요 하이라이트

  • 크기: 이전 모델인 granite‑speech‑3.3‑2b보다 파라미터 수가 절반.
  • 언어: 영어, 프랑스어, 독일어, 스페인어, 포르투갈어, 그리고 일본어(새로운 일본어 ASR 지원).
  • 특징: 이름 및 약어 인식을 향상시키는 키워드‑리스트 바이어싱.
  • 성능: 더 높은 영어 전사 정확도와 추측 디코딩을 통한 빠른 추론.
  • 인정: **OpenASR leaderboard**에서 1위 차지.

Performance

작은 크기에도 불구하고 Granite 4.0 1B Speech는 표준 영어 ASR 벤치마크에서 매우 경쟁력 있는 결과를 달성합니다. 성능은 Word Error Rate (WER)—잘못 전사된 단어 비율—로 측정되며, 점수가 낮을수록 정확도가 높습니다.

Benchmark Results

englishasr
Chart 1: Granite 4.0 1B Speech는 작은 모델임에도 불구하고 많은 벤치마크에서 경쟁력 있는 낮은 WER을 보여줍니다.

Licensing and Usage

  • 라이선스: Apache 2.0.
  • 프레임워크 지원: TransformersvLLM과의 네이티브 통합.
  • 평가: 이 모델은 영어, 다국어, 번역 작업을 포함한 다양한 표준 ASR 및 AST 벤치마크에서 평가되었으며, 더 큰 모델과 동등하거나 더 나은 성능을 보입니다.

전체 평가 결과, 아키텍처 세부 사항, 학습 데이터 및 사용 예시는 **model card**를 참고하세요.

Production Recommendations

추가 위험 감지가 필요한 배포 환경에서는 **Granite Guardian**와 함께 Granite 4.0 1B Speech를 사용하는 것을 권장합니다.

오늘 바로 사용해 보시고 의견을 알려 주세요!

0 조회
Back to Blog

관련 글

더 보기 »