슬랙 메시지 입력을 멈추고 — 대신 음성으로 보내세요 (Windows)
Source: Dev.to
나는 빠르게 타이핑한다—좋은 날엔 약 90 WPM 정도—하지만 그 속도에도 슬랙에서는 계속 뒤처진다.
슬랙은 흐르는 산문이 아니다; 반응형이고, 빠른 속도로, 2분마다 컨텍스트가 전환된다. 내가 일관된 답변을 마칠 때쯤이면, 이미 세 개의 새로운 메시지가 도착했고 스레드는 계속 진행되고 있다.
그래서 나는 대신 목소리를 사용하기 시작했다. 내가 배운 점은 다음과 같다.
왜 음성은 Slack과 Teams에서 더 빠른가
평균적인 사람은 분당 130–150 단어 정도 말합니다. 가장 빠른 타자조차도 실제 상황(속도 테스트가 아닌)에서는 100 WPM을 거의 넘지 못합니다. 더 중요한 것은, 말하기는 소리 내어 생각하는 것이며—뇌와 손가락 사이의 번역 레이어를 건너뛰게 합니다.
- 짧은 반응 메시지 – 예: “응, 괜찮아, 2시에 통화하자” 혹은 “문서 다시 공유해줄래? 못 찾겠어” –는 음성으로 훨씬 빠릅니다. 말하면 바로 나타나고, 보내면 됩니다. 백스페이스도 없고, 자동 교정 재앙도 없고, 적절한 이모지를 찾는 시간도 없습니다.
- 긴 메시지 – 프로젝트 업데이트나 비동기 설명 –는 더욱 큰 혜택을 봅니다. 두 분 정도 걸리는 3단락 Slack 메시지는 약 40 초 정도면 받아쓰기 할 수 있습니다.
작동하지 않는 경우: 브라우저 확장 프로그램
대부분의 사람들이 가장 먼저 시도하는 것은 Chrome 확장 프로그램입니다. Chrome 웹 스토어에는 여러 음성‑텍스트 변환 확장 프로그램이 있으며 Gmail, Google Docs 및 기타 브라우저 기반 입력란에서는 잘 작동합니다.
하지만 Slack 데스크톱 앱은 자체 프로세스에서 실행되는 Electron 앱이므로 Chrome의 범위 밖에 있습니다. 브라우저 확장 프로그램은 Chrome 렌더러의 웹 페이지에만 주입될 수 있으며, 데스크톱 애플리케이션의 텍스트 입력 필드에는 접근할 수 없습니다. 같은 제한은 Electron 기반인 Teams에도 적용됩니다.
Windows에 기본 제공되는 음성 인식(설정 → 시간 및 언어 → 음성)은 기술적으로 모든 창에 입력할 수 있지만, 활성화가 느리고 훈련이 필요하며, 정확도가 최신 AI 전사에 비해 눈에 띄게 낮습니다—특히 기술 용어, 이름, 구두점 등에서는 더욱 그렇습니다.
실제로 Windows에서 작동하는 방법
OS 수준에서 작동하는 전용 Windows 받아쓰기 도구(브라우저 내부가 아니라)는 포커스된 모든 애플리케이션에 텍스트를 삽입할 수 있습니다.
설정
-
어디서든 핫키를 누르기
Slack, Teams, VS Code, Notepad 등 어디에 있든 전역 단축키를 누릅니다 (저는Ctrl+Shift+Space를 사용합니다). 작은 오버레이가 나타나며 마이크 표시가 보입니다. -
자연스럽게 말하기
메시지를 말합니다. 오디오는 Groq의 Whisper API로 전송되어 전사됩니다. 문장 하나는 약 1~2 초, 짧은 구절은 1초 미만이 소요됩니다. -
텍스트가 직접 삽입됨
전사된 텍스트는 핫키를 눌렀을 때 활성화된 창에 바로 입력됩니다. Slack에서는 메시지 입력란에 들어갑니다. 내용을 검토하고 Enter 키를 누르세요.
이 도구는 Windows 접근성 API(특히 UI Automation)를 사용해 활성 창과 상호 작용하므로 데스크톱 앱, 터미널 창, 채팅 앱 등 텍스트 입력이 가능한 모든 프로그램에 적용할 수 있습니다.
실제 사용에서의 정확도
Groq의 Whisper 모델은 정말 인상적입니다. 테스트에서:
- 일반적인 Slack 문구: ~99 % 정확도
- 기술 용어 (API, GitHub, Kubernetes): ~96 % 정확도
- 이름 및 고유 명사: ~92 % 정확도 (특이한 이름은 정확도가 떨어짐)
- 구두점: 말하기 패턴에 따라 자동으로 처리
가끔 단어 수정을 해야 하지만, 전체 메시지를 타이핑하는 것보다 여전히 빠릅니다.
이 작업을 수행하는 도구
앱은 Dictate for Windows 입니다. 가벼운 Electron 앱으로 시스템 트레이에 상주해 필요할 때만 눈에 띕니다. 핫키를 누르고 말하면 바로 완료됩니다.
내부적으로 Groq의 Whisper API를 사용하므로 전사 비용이 거의 없으며, 메시지당 몇 센트의 일부에 불과합니다. 구독이 필요하지 않습니다.
업무 시간의 30 % 이상을 Slack이나 Teams에서 보낸다면 시도해 볼 가치가 있습니다. 설정은 약 5분 정도 걸리며, 습관은 하루 이틀 안에 자리 잡습니다.
키보드가 감사할 것입니다.