5분 만에 Claude 에이전트에 비디오 트랜스코딩 추가 (MCP)
출처: Dev.to

5분 안에 Claude 에이전트에게 Zoom 녹화 처리와 오디오 추출을 가르치세요 (MCP)
IT 개발자로서 우리는 복잡하고 반복적인 워크플로를 자동화하는 내부 도구를 꾸준히 만들어야 합니다. AI 에이전트가 등장하면서 이제는 Claude 기반 봇을 만들어 티켓을 관리하거나 로그를 감사하거나 텍스트를 요약하는 작업을 아주 쉽게 할 수 있게 되었습니다.
하지만 사용자가 2GB짜리 원본 Zoom 녹화 파일, Microsoft Teams .webm 내보내기 파일, 혹은 화면 공유 비디오를 채팅에 올려 “위키에 올릴 수 있게 압축해줘” 혹은 “오디오만 추출해서 전사하고 싶어”라고 요청하는 순간 상황은 급변합니다.
갑자기 가벼운 AI 에이전트가 미디어 엔지니어링 마법사가 되어야 합니다. 선택지는? 로컬에 FFmpeg을 강제로 설치하고(플랫폼별 바이너리 의존성 문제에 시달리게 됨) 혹은 AWS MediaConvert 파이프라인, S3 버킷, IAM 역할, 웹훅 등을 며칠 동안 설정하는 것뿐입니다.
스포일러: 기업 회의 녹화를 다운샘플링하기 위해 클라우드 인프라를 직접 구축할 필요는 없습니다.
Anthropic의 Model Context Protocol (MCP) 과 개발자 친화적인 플랫폼 Botverse 덕분에, 인프라 코드를 한 줄도 작성하지 않고도 Claude 에이전트에 비디오 트랜스코딩 및 오디오 추출 슈퍼파워를 정확히 5분 만에 부여할 수 있습니다.
🛠️ 5분 설정
Claude Desktop 에이전트에 비디오 처리 기능을 부여하려면 Botverse 원격 MCP 서버를 클라이언트에 연결하기만 하면 됩니다.
-
botverse.cloud에 회원가입하고 대시보드에서 API 토큰을 복사합니다.
-
Claude Desktop 설정 파일을 엽니다.
- macOS:
~/Library/Application Support/Claude/claude_desktop_config.json - Windows:
%APPDATA%\Claude\claude_desktop_config.json
- macOS:
-
mcpServers객체 아래에botverse설정 블록을 추가합니다.
{
"mcpServers": {
"botverse": {
"command": "npx",
"args": [
"-y",
"mcp-remote",
"https://botverse.cloud/mcp?token=YOUR_BOTVERSE_TOKEN"
],
"env": {}
}
}
}
YOUR_BOTVERSE_TOKEN을 실제 토큰으로 바꾸고 파일을 저장한 뒤 Claude Desktop을 재시작합니다. 이제 Claude는 비디오와 오디오 파일을 다루는 방법을 기본적으로 이해합니다.
🔄 내부 IT 개발자 워크플로
연결이 완료되면 Claude는 새로운 미디어 도구를 자동으로 발견합니다. 비디오 파일을 처리하도록 요청하면 Claude는 다음과 같은 3단계 비동기 워크플로를 스스로 조율합니다.
-
transcode_from_url
Claude는 원본 비디오 URL(예: 클라우드에 저장된 회의 녹화 링크)을 Botverse에 바로 전달해 작업을 시작합니다. 거대한 파일을 LLM 프롬프트 컨텍스트에 업로드할 필요가 없습니다.- 비디오 압축: “거대한 원본 파일을 웹 친화적인
720p MP4로 변환해줘.” - 데이터/텍스트 추출: “비디오를 완전히 제거하고
MP3혹은WAV오디오만 추출해줘.” — Whisper 같은 전사 API에 바로 넘길 수 있습니다.
- 비디오 압축: “거대한 원본 파일을 웹 친화적인
-
get_job_status
미디어 처리에는 시간이 걸립니다. Claude는 LLM을 차단하거나 네트워크 타임아웃에 걸리지 않도록 백그라운드에서 작업 진행 상황을 스마트하게 폴링합니다. -
get_download_url
작업이 완료되면 Claude는 최종 도구를 호출해 새로 생성된 자산의 보안 서명 다운로드 URL을 받아옵니다.
📸 실제 사용 예시
예를 들어 사내 Slack 혹은 데스크톱 봇에서 개발자나 프로젝트 매니저가 타운홀 회의의 오디오를 추출하고 싶다고 가정해 보세요. 다음과 같이 자연어 명령을 입력합니다.
“이 원본 회의 녹화 링크에서 오디오를 MP3 로 추출해서 전사에 쓰고 싶어: https://storage.company.internal/meeting_10823.webm”
Claude는 도구 조정을 자동으로 수행합니다.
[Claude Desktop UI]
🤖 Calling tool: botverse.transcode_from_url...
↳ Parameters: { url: "...", outputs: [{ format: "mp3" }] }
↳ Status: Job created (ID: job_dev_7812)
🤖 Calling tool: botverse.get_job_status (job_dev_7812)...
↳ Status: Processing (Audio extraction in progress...)
🤖 Calling tool: botverse.get_job_status (job_dev_7812)...
↳ Status: Completed
🤖 Calling tool: botverse.get_download_url (job_dev_7812)...
↳ Signed URL retrieved!
"I have successfully extracted the audio from your meeting recording. You can download the MP3 file here to pass to your transcription pipeline: [Download Meeting Audio](https://botverse.cloud/d/xyz123...)"
💰 예측 가능한 가격, 유휴 서버 비용 제로
우리는 유휴 인프라 때문에 발생하는 깜짝 클라우드 요금이 싫습니다. Botverse는 투명한 종량제 모델을 사용해 비용을 완전히 예측 가능하게 합니다.
- 작업당 $0.25 (5분 이하 표준 비디오 파일 기준)
- 분당 $0.08 (30분 스탠드업이나 1시간 웨비나 같은 장시간 파일 초과분)
- 최소 $2.50 충전으로 개발자 지갑을 채우고 바로 시작할 수 있습니다.
고정 월 구독료도, 기본 요금도 없으며 크레딧은 절대 만료되지 않습니다. 에이전트가 실제로 미디어를 처리할 때만 비용이 청구됩니다.
🚀 다음 단계
보일러플레이트 인프라 코드를 작성하거나 Docker 컨테이너 안의 FFmpeg 레이어를 디버깅하거나, 간단한 내부 도구를 위해 복잡한 클라우드 파이프라인을 구축하는 데 시간을 낭비하지 마세요. MCP가 무거운 작업을 대신해 줍니다.
- 🌐 시작하기: botverse.cloud에 방문해 API 토큰을 받아보세요.
- 📚 문서 읽기: 더 많은 고급 파라미터, 문서 변환, 에이전트 자동화 청사진은 Botverse Documentation을 확인하세요.
