MCP와 Gemini를 사용한 자동 AI 이미지 파이프라인 구축

발행: 3개월 전 (2026년 2월 1일 오후 09:47 GMT+9)

7 분 소요

원문: Dev.to

Source: Dev.to

MCP와 Gemini를 사용한 자동 AI 이미지 파이프라인 구축 커버 이미지

뉴스레터를 운영하는 것은 콘텐츠 러닝머신과 같습니다. 기사에는 이미지가 필요하고, 이미지에는 프롬프트가 필요합니다. 프롬프트는 다듬어져야 합니다. 그리고 그 루프 안에서 시간은 사라집니다.

이 문제를 해결하기 위해 gemini-image-mcp를 만들었습니다 – 프롬프트부터 게시된 이미지까지 AI 이미지 생성을 자동화하는 오픈‑소스 MCP(Model Context Protocol) 서버입니다. 작동 방식과 제가 만들게 된 이유를 소개합니다.

문제

My workflow looked like this:

Write an article
Think of image concepts (or multiple)
Manually prompt an image generator (including reference images)
Download the image
Convert to WebP for web performance
Upload to WordPress
Repeat for every article

Steps 2‑6 were eating my time. I needed automation that fit inside my existing Claude Desktop workflow without jumping between tools.

MCP 입력

MCP (Model Context Protocol)는 Anthropic이 AI 모델을 외부 도구와 연결하기 위해 만든 오픈 표준입니다. 앱 간에 복사‑붙여넣기를 하는 대신, MCP는 Claude가 대화를 떠나지 않고 이미지 생성기와 같은 도구를 직접 호출할 수 있게 합니다. 이 덕분에 저는 Claude가 직접 통신할 수 있는 서버를 구축할 수 있었습니다. 브라우저 전환도 없고, 수동 다운로드도 없습니다. 단지 대화만 있을 뿐입니다.

아키텍처

Technical architecture diagram showing the gemini-image-mcp workflow: Claude Code connects via MCP protocol to the gemini-image-mcp server, which calls the Gemini API to generate images. Generated images then split into two paths – WebP Converter producing Optimized Images, and WordPress Upload delivering to the Media Library.

서버는 Python 기반이며 세 개의 핵심 모듈로 구성됩니다:

gemini_image_server.py – 도구 호출을 처리하는 주요 MCP 서버
batch_manager.py – 배치 작업을 위한 큐 관리
batch_generate.py – 속도 제한이 적용된 배치 이미지 생성

두 품질 단계

모든 이미지가 4K일 필요는 없습니다. 두 가지 단계로 나누어 구현했습니다:

Pro Mode – Gemini 3 Pro 이미지 미리보기

최대 4K 해상도 (기본값은 2K)
최대 14개의 참조 이미지 지원
텍스트 렌더링 향상
최종 제작 이미지에 최적

Fast Mode – Gemini 2.5 Flash 이미지

1K 해상도
빠른 생성 속도
반복 작업 및 테스트에 적합
비용 크게 절감

이를 통해 Fast 모드에서 빠르게 프로토타입을 만들고, 최종 버전은 Pro 모드로 전환할 수 있습니다.

배치 시스템

여러 이미지 프롬프트를 큐에 넣습니다
생성하기 전에 큐를 검토할 수 있습니다
속도 제한을 적용해 한 번에 모든 이미지를 생성합니다
API 비용을 대략 절반으로 줄입니다

# Queue images
add_to_batch("Newsletter header - abstract AI visualization")
add_to_batch("Feature image - quantum computing concept")
add_to_batch("Sidebar graphic - robotics innovation")

# Review queue
view_batch_queue()

# Generate all at once
run_batch()

WebP Conversion

웹 성능은 중요합니다. 서버는 Pillow를 사용하여 생성된 PNG를 자동으로 WebP 형식으로 변환하여 눈에 띄는 품질 손실 없이 파일 크기를 크게 줄입니다. 이는 서버 디스크 용량도 절감합니다.

WordPress 통합

최종 단계 – REST API를 통해 WordPress 미디어 라이브러리에 직접 업로드합니다. 수동 업로드, 리사이징, 파일 관리가 필요 없습니다. 하나의 워크플로우에서 생성, 변환 및 게시됩니다.

시작하기

git clone https://github.com/PeeperFrog/gemini-image-mcp.git
cd gemini-image-mcp
cp config.json.example config.json
cp .env.example .env
pip install -r requirements.txt

Gemini API 키를 .env에 추가하고, config.json의 경로를 업데이트한 뒤, 서버를 MCP 클라이언트에 추가하세요. 끝입니다.

실제 결과

두 개의 뉴스레터에 대해 이 작업을 실행한 결과, 기사당 이미지 제작 시간을 약 30분에서 5분 이하로 단축했습니다. 배치 시스템 덕분에 API 비용을 관리할 수 있고, WordPress 통합을 통해 게시된 이미지가 자동으로 미디어 라이브러리에 나타납니다.

다음 단계

워크플로를 위한 확장된 참조 이미지 라이브러리
추가 CMS 통합
보다 세분화된 품질 제어

마무리

MCP는 아직 초기 단계이지만, 이미 개발자들이 AI 워크플로를 구축하는 방식을 변화시키고 있습니다. gemini-image-mcp는 AI 모델과 실제 도구를 연결했을 때 가능한 것들의 한 예시입니다.

무료, 오픈소스, MIT 라이선스.

🔗 GitHub: PeeperFrog/gemini-image-mcp