[Paper] Mono2Sls: 자동 Monolith-to-Serverless 마이그레이션, Multi-Stage Pipeline 및 Static Analysis 기반

발행: 1일 전 (2026년 4월 27일 PM 11:44 GMT+9)

13 분 소요

원문: arXiv

Source: arXiv - 2604.24550v1

개요

Mono2Sls는 클라우드‑우선 팀에게 가장 고통스러운 작업 중 하나인 모놀리식 웹 백엔드를 AWS에서 실행되는 서버리스 애플리케이션으로 전환하는 문제를 해결합니다. 가벼운 정적 분석과 특화된 LLM 에이전트 체인을 연결하여, 저자들은 자동으로 배포 가능한 AWS SAM(Serverless Application Model) 프로젝트를 생성하는 엔드‑투‑엔드 파이프라인을 구축했습니다. 실제 코드베이스에 대한 평가 결과, 이 시스템은 수동 조정 없이도 작동하는 서버리스 서비스를 제공할 수 있어 서버리스 아키텍처 도입 장벽을 크게 낮춥니다.

주요 기여

완전 자동화된 모놀리식‑투‑서버리스 파이프라인 – 전통적인 코드베이스를 수동 개입 없이 바로 배포 가능한 SAM 애플리케이션으로 변환합니다.
정적 분석 + LLM 하이브리드 워크플로 – 호출 그래프와 비동기 동작 분석을 활용해 네 개의 특화된 LLM 에이전트(Architect, Code Developer, SAM Engineer, Consistency Validator)에 입력합니다.
명시적인 중간 산출물 – 각 에이전트는 구체적인 산출물(예: 서비스 분해 계획, 생성된 코드, SAM 템플릿)을 생성하고, 다음 단계로 넘어가기 전에 검증하여 신뢰성을 향상시킵니다.
정제된 SAM 지식 베이스 – 경량의 도메인 특화 프롬프트 라이브러리로 LLM이 올바른 AWS‑네이티브 패턴(IAM, API Gateway, Lambda 비동기)을 따르도록 유도합니다.
강력한 실증 결과 – 6개의 오픈소스 백엔드(10 K+ LOC, 76 엔드포인트)에서 Mono2Sls는 배포 성공률 100 %, 엔드‑투‑엔드 기능 정확도 66.1 %, API 커버리지 F1 98.7 %를 달성했으며, 상용 베이스라인보다 5–12 포인트 우수합니다.
정적 분석 영향력을 보여주는 절제 실험 – 정적 분석 기반 아키텍처 단계를 제거하면 정확도가 23.4 포인트 감소하여, 정적 분석이 핵심 역할을 함을 확인합니다.

방법론

Static Entry‑Point Discovery – 가벼운 분석기가 모놀리스를 스캔하여 HTTP 핸들러, 백그라운드 워커, 데이터베이스 접근 지점을 찾습니다. 호출 그래프를 구축하고 비동기 구조(async/await, 메시지 큐 등)를 표시합니다.
Service Decomposition (Architect Agent) – 호출 그래프 데이터를 LLM에 제공하여 마이크로서비스 스타일의 분할을 제안합니다. 각 진입점을 후보 Lambda 함수 또는 관련 Lambda 집합에 매핑합니다. 출력은 서비스 청사진(함수 경계, 필요한 IAM 권한, 이벤트 소스)입니다.
Code Generation (Code Developer Agent) – 청사진을 사용해 두 번째 LLM이 원본 소스를 Lambda 호환 모듈로 재작성합니다. 공유 유틸리티를 추출하고, 상태ful 코드를 stateless 핸들러로 리팩터링하며, 필요에 따라 AWS SDK 호출을 삽입합니다.
Infrastructure Synthesis (SAM Engineer Agent) – 세 번째 LLM이 생성된 코드를 받아 SAM 템플릿(YAML)을 생성합니다. 여기에는 함수, API Gateway 라우트, DynamoDB 테이블, S3 버킷, IAM 역할이 선언됩니다. 에이전트는 큐레이션된 SAM 지식 베이스를 참고해 베스트 프랙티스 구성(예: 프로비저닝된 동시성, 비동기 이벤트 브리지)을 보장합니다.
Consistency Validation (Validator Agent) – 배포 전에 최종 에이전트가 일련의 검사를 수행합니다: SAM 템플릿 스키마 검증, 생성된 코드에 대한 정적 타입 검사, 원본 API 표면과의 차이 비교를 통해 커버리지를 보장합니다. 불일치가 발견되면 이전 에이전트로 피드백 루프가 발생합니다.
Deployment & Test – 결과 SAM 패키지를 샌드박스 AWS 계정에 배포하고, 원본 모놀리스의 라우팅 테이블에서 파생된 자동 생성 API 테스트로 실행합니다.

모든 에이전트는 명시적 아티팩트(청사진, 코드 차이, SAM YAML, 검증 보고서)를 통해 통신하며, 숨겨진 프롬프트 상태를 사용하지 않으므로 파이프라인을 감사 가능하고 디버깅하기 쉬운 형태로 유지합니다.

결과 및 발견

지표	Mono2Sls	최고 상용 베이스라인
배포 성공률 (수동 수정 없음)	100 %	78–85 %
엔드‑투‑엔드 기능 정확도*	66.1 %	53.7–61.2 %
API‑커버리지 F1 (모든 원본 엔드포인트 탐지)	98.7 %	88.4 %
10 K‑LOC 앱 마이그레이션 평균 시간	~45 분 (AWS 배포 포함)	2–4시간 (수동 작업)

*정확도는 비즈니스 로직 및 데이터 스토어 상호작용을 수행하는 선별된 통합 테스트 스위트를 통과함으로써 측정되었습니다.

추가 관찰 사항

마이그레이션된 서비스는 커스텀 토큰 검증 대신 AWS‑네이티브 인증(Cognito, IAM)을 일관되게 사용하여 보안 버그의 공격 표면을 감소시켰습니다.
원본 코드가 백그라운드 스레드를 사용하던 부분에 비동기 패턴(SQS, EventBridge)이 자동으로 도입되어 확장성이 향상되었습니다.
소거 연구 결과, 정적 분석 기반 아키텍처 계획을 제거했을 때 정확도가 23.4 포인트 감소하여 사전 분해가 파이프라인의 핵심임을 확인했습니다.

Practical Implications

Speed up cloud migration projects – Teams can spin up a serverless version of an existing monolith in under an hour, freeing engineers to focus on business features rather than plumbing.
Lower the expertise barrier – Developers unfamiliar with SAM, IAM, or Lambda nuances can rely on the curated knowledge base, reducing the need for specialized cloud architects.
Cost‑effective scaling – By automatically refactoring long‑running background jobs into event‑driven Lambdas, organizations can benefit from pay‑per‑use pricing and avoid over‑provisioned VMs.
Security hardening out‑of‑the‑box – The pipeline’s validator enforces least‑privilege IAM roles and replaces ad‑hoc auth checks with managed services, helping compliance teams.
Blueprint for LLM‑augmented DevOps – The multi‑stage, artifact‑driven design can be adapted to other migration scenarios (e.g., monolith‑to‑Kubernetes, legacy‑to‑microservices) or to generate infrastructure‑as‑code for new projects.

실용적인 시사점

클라우드 마이그레이션 프로젝트 가속화 – 팀은 기존 모놀리스를 1시간 이내에 서버리스 버전으로 전환할 수 있어, 엔지니어가 인프라 설정보다 비즈니스 기능 구현에 집중할 수 있습니다.
전문성 장벽 낮추기 – SAM, IAM, Lambda와 같은 세부 사항에 익숙하지 않은 개발자도 큐레이션된 지식 베이스를 활용할 수 있어, 전문 클라우드 아키텍트에 대한 의존도가 감소합니다.
비용 효율적인 확장 – 장기 실행 백그라운드 작업을 자동으로 이벤트 기반 Lambda로 리팩터링함으로써, 사용량 기반 과금 모델을 활용하고 과다 프로비저닝된 VM을 피할 수 있습니다.
보안 강화 기본 제공 – 파이프라인 검증기가 최소 권한 IAM 역할을 강제하고, 임시 인증 검사를 관리형 서비스로 대체해 컴플라이언스 팀을 지원합니다.
LLM 기반 DevOps 청사진 – 다단계, 아티팩트 기반 설계는 다른 마이그레이션 시나리오(예: 모놀리쓰‑to‑Kubernetes, 레거시‑to‑마이크로서비스)나 새로운 프로젝트를 위한 인프라‑코드 생성에도 적용할 수 있습니다.

제한 사항 및 향후 작업

언어 및 프레임워크 범위 – 현재 프로토타입은 Python 기반 웹 백엔드(Flask/Django)를 대상으로 합니다. Java, Node.js, Go 등으로 확장하려면 추가적인 정적 분석 어댑터가 필요합니다.
기능적 정확도 한계 – 완전 자동 실행에서 66 %의 종단 간 정확도가 인상적이지만, 남은 차이는 LLM이 오해하는 복잡한 비즈니스 규칙에서 비롯됩니다; 인간이 참여하는 하이브리드 검토를 도입하면 정확도를 더욱 높일 수 있습니다.
런타임 성능 변동 – 서버리스 실행은 콜드 스타트 지연 및 다양한 동시성 제한을 초래합니다; 논문에서는 원래 모놀리식과 비교한 성능이나 비용 트레이드‑오프를 평가하지 않았습니다.
LLM 품질 의존성 – 파이프라인의 성공은 기본 LLM이 프롬프트를 정확히 따르는 능력에 달려 있습니다; 모델 업데이트나 환각 현상이 발생하면 아티팩트 체인이 깨질 수 있습니다.
보안 감사 깊이 – 검증자는 IAM 권한을 확인하지만 비밀 누출, 인젝션 위험 등 전체 정적 보안 분석을 수행하지 않습니다. 향후 작업에서는 전용 보안 스캐너를 통합할 수 있습니다.

이러한 점들을 해결함으로써 Mono2Sls는 연구 프로토타입에서 많은 클라우드‑우선 기업이 오늘날 채택할 수 있는 프로덕션 급 마이그레이션 서비스로 발전할 수 있습니다.

저자

Xingyan Chen
Yuxin Su
Zishan Su
Yang Yu
Zibin Zheng

논문 정보

arXiv ID: 2604.24550v1
Categories: cs.SE
Published: 2026년 4월 27일
PDF: PDF 다운로드

[Paper] Mono2Sls: 자동 Monolith-to-Serverless 마이그레이션, Multi-Stage Pipeline 및 Static Analysis 기반

개요

주요 기여

방법론

결과 및 발견

Practical Implications

실용적인 시사점

제한 사항 및 향후 작업

저자

논문 정보

관련 글

[Paper] 스레드에서 궤적으로: GitHub 이슈 토론에서 커뮤니티 지식 추출을 위한 멀티-LLM 파이프라인

[Paper] 마이크로서비스에서 핵심 개발자 역할 및 조직 결합: 종단 분석

[Paper] 시나리오 기반 분산 로봇 애플리케이션을 위한 시스템 테스트

[Paper] 프롬프트 과소 지정이 코드 정확성을 향상시킬 때: LLM 기반 코드 생성에 대한 프롬프트 문구 및 구조 효과에 대한 탐색적 연구