브레인 덤프에서 Markdown으로: 말하는 대로 아이디어 구조화

발행: 3일 전 (2026년 5월 8일 PM 07:24 GMT+9)

5 분 소요

Source: Dev.to

브레인 덤프에서 마크다운으로: 말하면서 아이디어 구조화

Overview

Written by Speech To Markdown

음성 입력은 타이핑보다 빠르지만—속도만이 문제는 아닙니다. 진짜 도전은 구조화입니다. 생각을 즉석에서 정리하고 일관된 말을 만드는 것이 놀라울 정도로 어렵습니다. Gemini와 같은 AI 어시스턴트가 음성 입력을 도입했지만, 전사된 내용 대부분이 구조화되지 않은 잡음이 되어 정리하는 데 걸리는 시간이 절약된 시간보다 더 많습니다.

이것이 제가 스스로 해결하고자 했던 문제였습니다.

Why I Built This

자유롭게—브레인 덤프 스타일로—말하고, AI가 실시간으로 깔끔하고 구조화된 Markdown으로 변환해 주는 방법이 필요했습니다. 편집도, 타이핑도, 컨텍스트 전환도 필요 없습니다. 생각을 크게 말하면 문서가 바로 만들어집니다.

그 결과가 바로 TaskSquad에 내장된 Speech‑to‑Markdown stmd 도구입니다.

TaskSquad UI

How It Works

녹음을 시작하면 stmd가 Whisper 모델을 사용해 로컬에서 음성을 전사합니다(필요 시 자동 다운로드—저는 large 변형을 사용합니다). 전사는 버퍼링·집계된 뒤 청크 단위로 선택한 모델에 전송됩니다. 언제든 녹음을 일시 정지하고 생각할 수 있습니다.

Recording UI

연결 가능한 옵션:

TaskSquad에서 제공하는 로컬 하니스(서브‑에이전트 기반)
커스텀 프롬프트를 이용한 직접 API 또는 로컬 모델(oMLX, Ollama 등)

Model Selection

Model Selection UI

Session Setup

Session Setup UI

Ready State

Ready State UI

현재 저는 주요 하니스로 Claude Code를 사용하고 있으며, oMLX를 통해 Gemma 4도 광범위하게 테스트했습니다—두 모델 모두 비슷한 속도로 잘 동작합니다.

Two Modes

stmd는 두 가지 모드로 동작합니다: append와 edit.

Append mode – 말한 각 청크가 정리된 뒤 기존 Markdown 문서에 추가됩니다. 초안을 브레인‑덤프할 때 유용합니다.
Edit mode – 말한 내용이 편집 명령이 됩니다. 새로운 내용을 추가하는 대신, 에이전트가 기존 내용을 수정합니다. “소개 부분을 짧게 해줘” 혹은 “두 번째 항목을 교체해줘” 라고 말하면 키보드 입력 없이 수정이 이루어집니다.

Output

모든 원시 전사본과 생성된 Markdown 파일은 .tsq 폴더에 저장됩니다. 모델은 전적으로 사용자가 선택하므로 락인(lock‑in) 현상이 없습니다.

타이핑보다 생각이 빠른 개발자라면 한 번 시도해 보세요:

TaskSquad 데몬을 다운로드합니다.
./tsq 명령을 실행합니다.
Control Plane을 엽니다.
Speech to MD 탭으로 전환합니다.
다운로드할 Whisper 모델을 선택합니다.
입력을 처리할 하니스 또는 모델을 선택합니다.
말하기 시작!

브레인 덤프에서 Markdown으로: 말하는 대로 아이디어 구조화

Overview

Why I Built This

How It Works

Model Selection

Session Setup

Ready State

Two Modes

Output

관련 글

아무도 이야기하지 않는 격차: 학생, 기업 및 테크놀로지 압박

데이터베이스 경고 신호를 식별하고 무중단 마이그레이션을 계획하는 방법

동시 10K 사용자에게 LLM 토큰 스트리밍

코더에서 아키텍트로: Claude와 MCP를 활용해 워크플로우를 재구성한 방법