MCP와 Gemini를 사용한 자동 AI 이미지 파이프라인 구축
Source: Dev.to

뉴스레터를 운영하는 것은 콘텐츠 러닝머신과 같습니다. 기사에는 이미지가 필요하고, 이미지에는 프롬프트가 필요합니다. 프롬프트는 다듬어져야 합니다. 그리고 그 루프 안에서 시간은 사라집니다.
이 문제를 해결하기 위해 gemini-image-mcp를 만들었습니다 – 프롬프트부터 게시된 이미지까지 AI 이미지 생성을 자동화하는 오픈‑소스 MCP(Model Context Protocol) 서버입니다. 작동 방식과 제가 만들게 된 이유를 소개합니다.
문제
My workflow looked like this:
- Write an article
- Think of image concepts (or multiple)
- Manually prompt an image generator (including reference images)
- Download the image
- Convert to WebP for web performance
- Upload to WordPress
- Repeat for every article
Steps 2‑6 were eating my time. I needed automation that fit inside my existing Claude Desktop workflow without jumping between tools.
MCP 입력
MCP (Model Context Protocol)는 Anthropic이 AI 모델을 외부 도구와 연결하기 위해 만든 오픈 표준입니다. 앱 간에 복사‑붙여넣기를 하는 대신, MCP는 Claude가 대화를 떠나지 않고 이미지 생성기와 같은 도구를 직접 호출할 수 있게 합니다. 이 덕분에 저는 Claude가 직접 통신할 수 있는 서버를 구축할 수 있었습니다. 브라우저 전환도 없고, 수동 다운로드도 없습니다. 단지 대화만 있을 뿐입니다.
아키텍처

서버는 Python 기반이며 세 개의 핵심 모듈로 구성됩니다:
- gemini_image_server.py – 도구 호출을 처리하는 주요 MCP 서버
- batch_manager.py – 배치 작업을 위한 큐 관리
- batch_generate.py – 속도 제한이 적용된 배치 이미지 생성
두 품질 단계
모든 이미지가 4K일 필요는 없습니다. 두 가지 단계로 나누어 구현했습니다:
Pro Mode – Gemini 3 Pro 이미지 미리보기
- 최대 4K 해상도 (기본값은 2K)
- 최대 14개의 참조 이미지 지원
- 텍스트 렌더링 향상
- 최종 제작 이미지에 최적
Fast Mode – Gemini 2.5 Flash 이미지
- 1K 해상도
- 빠른 생성 속도
- 반복 작업 및 테스트에 적합
- 비용 크게 절감
이를 통해 Fast 모드에서 빠르게 프로토타입을 만들고, 최종 버전은 Pro 모드로 전환할 수 있습니다.
배치 시스템
- 여러 이미지 프롬프트를 큐에 넣습니다
- 생성하기 전에 큐를 검토할 수 있습니다
- 속도 제한을 적용해 한 번에 모든 이미지를 생성합니다
- API 비용을 대략 절반으로 줄입니다
# Queue images
add_to_batch("Newsletter header - abstract AI visualization")
add_to_batch("Feature image - quantum computing concept")
add_to_batch("Sidebar graphic - robotics innovation")
# Review queue
view_batch_queue()
# Generate all at once
run_batch()
WebP Conversion
웹 성능은 중요합니다. 서버는 Pillow를 사용하여 생성된 PNG를 자동으로 WebP 형식으로 변환하여 눈에 띄는 품질 손실 없이 파일 크기를 크게 줄입니다. 이는 서버 디스크 용량도 절감합니다.
WordPress 통합
최종 단계 – REST API를 통해 WordPress 미디어 라이브러리에 직접 업로드합니다. 수동 업로드, 리사이징, 파일 관리가 필요 없습니다. 하나의 워크플로우에서 생성, 변환 및 게시됩니다.
시작하기
git clone https://github.com/PeeperFrog/gemini-image-mcp.git
cd gemini-image-mcp
cp config.json.example config.json
cp .env.example .env
pip install -r requirements.txt
Gemini API 키를 .env에 추가하고, config.json의 경로를 업데이트한 뒤, 서버를 MCP 클라이언트에 추가하세요. 끝입니다.
실제 결과
두 개의 뉴스레터에 대해 이 작업을 실행한 결과, 기사당 이미지 제작 시간을 약 30분에서 5분 이하로 단축했습니다. 배치 시스템 덕분에 API 비용을 관리할 수 있고, WordPress 통합을 통해 게시된 이미지가 자동으로 미디어 라이브러리에 나타납니다.
다음 단계
- 워크플로를 위한 확장된 참조 이미지 라이브러리
- 추가 CMS 통합
- 보다 세분화된 품질 제어
마무리
MCP는 아직 초기 단계이지만, 이미 개발자들이 AI 워크플로를 구축하는 방식을 변화시키고 있습니다. gemini-image-mcp는 AI 모델과 실제 도구를 연결했을 때 가능한 것들의 한 예시입니다.
무료, 오픈소스, MIT 라이선스.