Speechify의 Windows 앱, 로컬 모델을 사용해 전사 및 받아쓰기
Source: TechCrunch
In Brief
Posted: 6:11 AM PDT · March 31, 2026

Image Credits: Speechify
음성‑AI 기업 Speechify가 로컬에 저장된 모델을 사용해 앱 전반에서 받아쓰기와 기사·문서·PDF를 읽어주는 기능을 제공하는 네이티브 Windows 앱을 출시했습니다.
이 앱은 Wispr Flow, Willow, Superwhisper와 같은 크로스‑플랫폼 받아쓰기·전사 솔루션과 경쟁합니다.
On‑device processing
Speechify에 따르면 Windows 앱은 Copilot+ PC(AMD, Intel, Qualcomm의 NPU 탑재)와 Intel 또는 AMD GPU가 장착된 기타 Windows 11 PC에서 음성 처리를 전적으로 디바이스 내에서 수행합니다.
세 가지 모델이 로컬에서 실행됩니다:
- Neural text‑to‑speech
- Real‑time voice activity detection (오픈소스 Silero VAD model 사용)
- Whisper‑powered transcription
사용자는 클라우드 기반 모델로 전환하거나 실시간으로 모델을 교체할 수 있습니다.
Features
- VITS Neural은 일곱 가지 속도 프리셋으로 오디오를 생성할 수 있어, 앱이 문서나 웹 페이지를 읽어줄 수 있습니다.
- 회사는 5천만 명 이상의 사용자를 보유하고 있다고 보고했습니다(LinkedIn source).
Company statement
“전 세계에 10억 명이 넘는 사람들이 Windows를 사용합니다. 이번 Windows 출시를 통해 어떤 디바이스를 사용하든, 어떤 방식으로 작업하든 읽기와 이제는 쓰기가 장벽이 되지 않도록 보장합니다. 특히 많은 전문가들이 PC용 Speechify를 요청한 만큼 기업 시장에서의 기회에 큰 기대를 가지고 있습니다.” — Cliff Weitzman, Speechify 창립자 겸 CEO
Recent developments
지난 달 Speechify는 브라우저 기반 회의를 위한 Granola‑like meeting transcription 기능을 도입했습니다(9to5Mac article). 이제 네이티브 앱이 여러 플랫폼에 제공되면서 이 기능을 데스크톱 애플리케이션에도 적용해 어떤 앱이나 브라우저에서도 회의 전사를 할 수 있을 것으로 기대됩니다.
Evolution of Speechify
최근까지 Speechify는 주로 text‑to‑speech 사용 사례—기사, 이메일 읽기, 문서에서 팟캐스트 생성—에 집중했습니다(TechCrunch 2024). 이제는 full‑stack voice platform으로 자리매김하며 받아쓰기, 회의 전사, 음성 비서 기능을 추가하고 있습니다(TechCrunch 2025).