브레인 덤프에서 Markdown으로: 말하는 대로 아이디어 구조화
Source: Dev.to

Overview
Written by Speech To Markdown
음성 입력은 타이핑보다 빠르지만—속도만이 문제는 아닙니다. 진짜 도전은 구조화입니다. 생각을 즉석에서 정리하고 일관된 말을 만드는 것이 놀라울 정도로 어렵습니다. Gemini와 같은 AI 어시스턴트가 음성 입력을 도입했지만, 전사된 내용 대부분이 구조화되지 않은 잡음이 되어 정리하는 데 걸리는 시간이 절약된 시간보다 더 많습니다.
이것이 제가 스스로 해결하고자 했던 문제였습니다.
Why I Built This
자유롭게—브레인 덤프 스타일로—말하고, AI가 실시간으로 깔끔하고 구조화된 Markdown으로 변환해 주는 방법이 필요했습니다. 편집도, 타이핑도, 컨텍스트 전환도 필요 없습니다. 생각을 크게 말하면 문서가 바로 만들어집니다.
그 결과가 바로 TaskSquad에 내장된 Speech‑to‑Markdown stmd 도구입니다.

How It Works
녹음을 시작하면 stmd가 Whisper 모델을 사용해 로컬에서 음성을 전사합니다(필요 시 자동 다운로드—저는 large 변형을 사용합니다). 전사는 버퍼링·집계된 뒤 청크 단위로 선택한 모델에 전송됩니다. 언제든 녹음을 일시 정지하고 생각할 수 있습니다.

연결 가능한 옵션:
- TaskSquad에서 제공하는 로컬 하니스(서브‑에이전트 기반)
- 커스텀 프롬프트를 이용한 직접 API 또는 로컬 모델(oMLX, Ollama 등)
Model Selection

Session Setup

Ready State

현재 저는 주요 하니스로 Claude Code를 사용하고 있으며, oMLX를 통해 Gemma 4도 광범위하게 테스트했습니다—두 모델 모두 비슷한 속도로 잘 동작합니다.
Two Modes
stmd는 두 가지 모드로 동작합니다: append와 edit.
- Append mode – 말한 각 청크가 정리된 뒤 기존 Markdown 문서에 추가됩니다. 초안을 브레인‑덤프할 때 유용합니다.
- Edit mode – 말한 내용이 편집 명령이 됩니다. 새로운 내용을 추가하는 대신, 에이전트가 기존 내용을 수정합니다. “소개 부분을 짧게 해줘” 혹은 “두 번째 항목을 교체해줘” 라고 말하면 키보드 입력 없이 수정이 이루어집니다.
Output
모든 원시 전사본과 생성된 Markdown 파일은 .tsq 폴더에 저장됩니다. 모델은 전적으로 사용자가 선택하므로 락인(lock‑in) 현상이 없습니다.
타이핑보다 생각이 빠른 개발자라면 한 번 시도해 보세요:
- TaskSquad 데몬을 다운로드합니다.
./tsq명령을 실행합니다.- Control Plane을 엽니다.
- Speech to MD 탭으로 전환합니다.
- 다운로드할 Whisper 모델을 선택합니다.
- 입력을 처리할 하니스 또는 모델을 선택합니다.
- 말하기 시작!