[Paper] Konflux: 서버리스 애플리케이션을 위한 최적화된 함수 융합
Source: arXiv - 2601.11156v1
Overview
논문 **“Konflux: Optimized Function Fusion for Serverless Applications”**은 Function‑as‑a‑Service(FaaS) 플랫폼에서 개발하는 모든 사람에게 실질적인 문제점, 즉 비용과 지연 시간을 줄이기 위해 어떤 함수들을 함께 묶을지 결정하는 문제를 다룹니다. 모든 가능한 함수 결합 레이아웃을 로컬에서 평가할 수 있는 가벼운 에뮬레이터를 도입함으로써, 저자들은 개발자들이 실시간 클라우드에서 비용이 많이 드는 시행착오를 피할 수 있음을 보여줍니다.
Key Contributions
- Full‑coverage fusion analysis – 주어진 서버리스 워크플로에 대한 모든 가능한 함수‑융합 구성의 체계적인 열거 및 평가.
- Konflux emulator – 플랫폼에 구애받지 않으며, 실제 FaaS 서비스의 성능 및 가격 행동을 모방하는 저오버헤드 로컬 런타임.
- Pareto‑optimal fusion set – 구성 중 소수만이 비용‑지연 트레이드오프를 지배한다는 실증적 증거로, 의사결정 공간을 크게 단순화함.
- Pricing‑model sensitivity study – 다양한 클라우드 제공자의 가격 체계(호출당, 메모리‑초, 콜드 스타트 페널티)가 최적 융합 선택을 어떻게 변화시키는지 보여줌.
Methodology
- Model the application graph – 서버리스 앱을 방향성 비순환 그래프(DAG)로 모델링합니다. 여기서 노드는 함수이고, 엣지는 데이터/제어 의존성을 나타냅니다.
- Generate fusion candidates – 조합적 열거를 통해 DAG의 순서를 유지하면서 인접 노드를 병합하는 모든 방법을 생성합니다(예:
f1+f2,f2+f3,f1+f2+f3등). - Emulate the FaaS platform – Konflux는 로컬 컨테이너에서 병합된 함수를 실행하여 다음을 재현합니다:
- Cold‑start latency (구성 가능한 이미지 크기 및 메모리)
- Execution time (원본 함수 코드에서 측정)
- Pricing semantics (메모리‑초, 요청 기반 요금, 네트워크 egress)
- Benchmark each configuration – 에뮬레이터는 전체 지연 시간(인-퓨전 오버헤드 포함)과 여러 가격 모델에 따른 추정 비용을 기록합니다.
- Pareto analysis – 비용과 지연 시간 모두에서 엄격히 열등하지 않은 구성을 최적 프론티어로 유지합니다.
전체 파이프라인은 개발자 노트북에서 몇 분 안에 실행되며, 실제 클라우드에서 테스트하는 데 걸리는 수시간 또는 수일에 비해 훨씬 빠릅니다.
결과 및 발견
| 애플리케이션 (예시) | 함수 수 | 퓨전 구성 수 | 최저 지연 구성 | 최저 비용 구성 | Pareto 크기 |
|---|---|---|---|---|---|
| 이미지 처리 파이프라인 | 5 | 52 | 모두 5개 결합 (단일 컨테이너) | 함수를 별도로 유지 | 3 |
| 이벤트 기반 ETL | 7 | 429 | 핫 경로 결합 (3개 함수) | 콜드 경로 결합 (2개 함수) | 4 |
| IoT 데이터 집계기 | 4 | 15 | 인접한 2개 함수 결합 | 결합 없음 | 2 |
주요 요점
- 각 애플리케이션당 2–5개의 구성만이 파레토 프런트에 위치하며, 가능한 조합이 기하급수적으로 많아도 마찬가지입니다.
- 가격 모델이 중요합니다: 호출당 과금 모델에서는 많은 함수를 결합하면 요청 비용이 감소해 최적이 되는 경우가 많습니다; 메모리‑초 과금 모델에서는 더 큰 번들의 메모리 오버헤드가 추가되어 작은 결합이 더 저렴해질 수 있습니다.
- 콜드 스타트 감소가 지연 개선의 핵심이며, 콜드 스타트 패널티를 공유하는 함수를 병합하면 가장 큰 속도 향상을 얻을 수 있습니다.
Practical Implications
- Rapid “what‑if” testing – 개발자는 클라우드 비용을 발생시키지 않고 로컬에서 퓨전 결정을 반복할 수 있어 CI 파이프라인에 자연스럽게 통합됩니다.
- Cost‑aware deployment tooling – Konflux의 에뮬레이터를 Serverless, SAM, Pulumi와 같은 서버리스 프레임워크에 통합하여 푸시하기 전에 최적의 퓨전 레이아웃을 자동으로 제안할 수 있습니다.
- Vendor‑agnostic optimization – 에뮬레이터가 가격 규칙을 추상화하기 때문에 팀은 AWS Lambda, Azure Functions, Google Cloud Run‑on‑GKE 등을 비교하고 특정 워크로드에 가장 적합한 제공자를 선택할 수 있습니다.
- Simplified architecture – 중요한 구성은 소수에 불과함을 알면 아키텍트가 광범위한 성능 테스트보다 코드 모듈성 및 가시성에 집중할 수 있습니다.
제한 사항 및 향후 작업
- 정적 분석만 – 결정론적 실행 시간을 가정합니다; 변동성이 큰 워크로드(예: ML 추론)는 런타임 프로파일링이 필요할 수 있습니다.
- 리소스 제약 무시 – 함수당 메모리/CPU 제한이 에뮬레이션 중에 적용되지 않으며, 이는 실제 플랫폼에서의 실행 가능성에 영향을 줄 수 있습니다.
- 네트워크 효과 단순화 – 함수 간 데이터 전송 비용이 근사치로 처리됩니다; 실제 VPC 또는 지역 간 트래픽은 최적 경계를 변경할 수 있습니다.
- 미래 방향(저자 제안): Konflux를 동적 스케일링 정책을 처리하도록 확장하고, 적응형 융합을 위한 실시간 텔레메트리를 통합하며, 공유 리소스가 콜드 스타트 동작에 영향을 미치는 멀티 테넌트 시나리오를 평가합니다.
저자
- Niklas Kowallik
- Trever Schirmer
- David Bermbach
논문 정보
- arXiv ID: 2601.11156v1
- Categories: cs.DC
- Published: 2026년 1월 16일
- PDF: Download PDF