Speechify의 Windows 앱, 로컬 모델을 사용해 전사 및 받아쓰기

발행: 6시간 전 (2026년 3월 31일 PM 10:11 GMT+9)

4 분 소요

원문: TechCrunch

Source: TechCrunch

In Brief

Posted: 6:11 AM PDT · March 31, 2026

Speechify app screenshot
Image Credits: Speechify

음성‑AI 기업 Speechify가 로컬에 저장된 모델을 사용해 앱 전반에서 받아쓰기와 기사·문서·PDF를 읽어주는 기능을 제공하는 네이티브 Windows 앱을 출시했습니다.

이 앱은 Wispr Flow, Willow, Superwhisper와 같은 크로스‑플랫폼 받아쓰기·전사 솔루션과 경쟁합니다.

On‑device processing

Speechify에 따르면 Windows 앱은 Copilot+ PC(AMD, Intel, Qualcomm의 NPU 탑재)와 Intel 또는 AMD GPU가 장착된 기타 Windows 11 PC에서 음성 처리를 전적으로 디바이스 내에서 수행합니다.

세 가지 모델이 로컬에서 실행됩니다:

Neural text‑to‑speech
Real‑time voice activity detection (오픈소스 Silero VAD model 사용)
Whisper‑powered transcription

사용자는 클라우드 기반 모델로 전환하거나 실시간으로 모델을 교체할 수 있습니다.

Features

VITS Neural은 일곱 가지 속도 프리셋으로 오디오를 생성할 수 있어, 앱이 문서나 웹 페이지를 읽어줄 수 있습니다.
회사는 5천만 명 이상의 사용자를 보유하고 있다고 보고했습니다(LinkedIn source).

Company statement

“전 세계에 10억 명이 넘는 사람들이 Windows를 사용합니다. 이번 Windows 출시를 통해 어떤 디바이스를 사용하든, 어떤 방식으로 작업하든 읽기와 이제는 쓰기가 장벽이 되지 않도록 보장합니다. 특히 많은 전문가들이 PC용 Speechify를 요청한 만큼 기업 시장에서의 기회에 큰 기대를 가지고 있습니다.” — Cliff Weitzman, Speechify 창립자 겸 CEO

Recent developments

지난 달 Speechify는 브라우저 기반 회의를 위한 Granola‑like meeting transcription 기능을 도입했습니다(9to5Mac article). 이제 네이티브 앱이 여러 플랫폼에 제공되면서 이 기능을 데스크톱 애플리케이션에도 적용해 어떤 앱이나 브라우저에서도 회의 전사를 할 수 있을 것으로 기대됩니다.

Evolution of Speechify

최근까지 Speechify는 주로 text‑to‑speech 사용 사례—기사, 이메일 읽기, 문서에서 팟캐스트 생성—에 집중했습니다(TechCrunch 2024). 이제는 full‑stack voice platform으로 자리매김하며 받아쓰기, 회의 전사, 음성 비서 기능을 추가하고 있습니다(TechCrunch 2025).

Speechify의 Windows 앱, 로컬 모델을 사용해 전사 및 받아쓰기

In Brief

On‑device processing

Features

Company statement

Recent developments

Evolution of Speechify

관련 글

우버, 두바이 로보택시 파트너십 확대에 따라 WeRide 지분 증가

Rivian 스핀오프, DoorDash를 위한 자율 배송 차량도 제작

Waymo, 샌안토니오 국제공항에서 robotaxi 서비스 시작

새로운 앱 스토어를 통해 Ring은 AI에 베팅해 홈 보안을 넘어선다