[Paper] Konflux: 서버리스 애플리케이션을 위한 최적화된 함수 융합

발행: (2026년 1월 16일 오후 07:16 GMT+9)
8 min read
원문: arXiv

Source: arXiv - 2601.11156v1

Overview

논문 **“Konflux: Optimized Function Fusion for Serverless Applications”**은 Function‑as‑a‑Service(FaaS) 플랫폼에서 개발하는 모든 사람에게 실질적인 문제점, 즉 비용과 지연 시간을 줄이기 위해 어떤 함수들을 함께 묶을지 결정하는 문제를 다룹니다. 모든 가능한 함수 결합 레이아웃을 로컬에서 평가할 수 있는 가벼운 에뮬레이터를 도입함으로써, 저자들은 개발자들이 실시간 클라우드에서 비용이 많이 드는 시행착오를 피할 수 있음을 보여줍니다.

Key Contributions

  • Full‑coverage fusion analysis – 주어진 서버리스 워크플로에 대한 모든 가능한 함수‑융합 구성의 체계적인 열거 및 평가.
  • Konflux emulator – 플랫폼에 구애받지 않으며, 실제 FaaS 서비스의 성능 및 가격 행동을 모방하는 저오버헤드 로컬 런타임.
  • Pareto‑optimal fusion set – 구성 중 소수만이 비용‑지연 트레이드오프를 지배한다는 실증적 증거로, 의사결정 공간을 크게 단순화함.
  • Pricing‑model sensitivity study – 다양한 클라우드 제공자의 가격 체계(호출당, 메모리‑초, 콜드 스타트 페널티)가 최적 융합 선택을 어떻게 변화시키는지 보여줌.

Methodology

  1. Model the application graph – 서버리스 앱을 방향성 비순환 그래프(DAG)로 모델링합니다. 여기서 노드는 함수이고, 엣지는 데이터/제어 의존성을 나타냅니다.
  2. Generate fusion candidates – 조합적 열거를 통해 DAG의 순서를 유지하면서 인접 노드를 병합하는 모든 방법을 생성합니다(예: f1+f2, f2+f3, f1+f2+f3 등).
  3. Emulate the FaaS platform – Konflux는 로컬 컨테이너에서 병합된 함수를 실행하여 다음을 재현합니다:
    • Cold‑start latency (구성 가능한 이미지 크기 및 메모리)
    • Execution time (원본 함수 코드에서 측정)
    • Pricing semantics (메모리‑초, 요청 기반 요금, 네트워크 egress)
  4. Benchmark each configuration – 에뮬레이터는 전체 지연 시간(인-퓨전 오버헤드 포함)과 여러 가격 모델에 따른 추정 비용을 기록합니다.
  5. Pareto analysis – 비용과 지연 시간 모두에서 엄격히 열등하지 않은 구성을 최적 프론티어로 유지합니다.

전체 파이프라인은 개발자 노트북에서 몇 분 안에 실행되며, 실제 클라우드에서 테스트하는 데 걸리는 수시간 또는 수일에 비해 훨씬 빠릅니다.

결과 및 발견

애플리케이션 (예시)함수 수퓨전 구성 수최저 지연 구성최저 비용 구성Pareto 크기
이미지 처리 파이프라인552모두 5개 결합 (단일 컨테이너)함수를 별도로 유지3
이벤트 기반 ETL7429핫 경로 결합 (3개 함수)콜드 경로 결합 (2개 함수)4
IoT 데이터 집계기415인접한 2개 함수 결합결합 없음2

주요 요점

  • 각 애플리케이션당 2–5개의 구성만이 파레토 프런트에 위치하며, 가능한 조합이 기하급수적으로 많아도 마찬가지입니다.
  • 가격 모델이 중요합니다: 호출당 과금 모델에서는 많은 함수를 결합하면 요청 비용이 감소해 최적이 되는 경우가 많습니다; 메모리‑초 과금 모델에서는 더 큰 번들의 메모리 오버헤드가 추가되어 작은 결합이 더 저렴해질 수 있습니다.
  • 콜드 스타트 감소가 지연 개선의 핵심이며, 콜드 스타트 패널티를 공유하는 함수를 병합하면 가장 큰 속도 향상을 얻을 수 있습니다.

Practical Implications

  • Rapid “what‑if” testing – 개발자는 클라우드 비용을 발생시키지 않고 로컬에서 퓨전 결정을 반복할 수 있어 CI 파이프라인에 자연스럽게 통합됩니다.
  • Cost‑aware deployment tooling – Konflux의 에뮬레이터를 Serverless, SAM, Pulumi와 같은 서버리스 프레임워크에 통합하여 푸시하기 전에 최적의 퓨전 레이아웃을 자동으로 제안할 수 있습니다.
  • Vendor‑agnostic optimization – 에뮬레이터가 가격 규칙을 추상화하기 때문에 팀은 AWS Lambda, Azure Functions, Google Cloud Run‑on‑GKE 등을 비교하고 특정 워크로드에 가장 적합한 제공자를 선택할 수 있습니다.
  • Simplified architecture – 중요한 구성은 소수에 불과함을 알면 아키텍트가 광범위한 성능 테스트보다 코드 모듈성 및 가시성에 집중할 수 있습니다.

제한 사항 및 향후 작업

  • 정적 분석만 – 결정론적 실행 시간을 가정합니다; 변동성이 큰 워크로드(예: ML 추론)는 런타임 프로파일링이 필요할 수 있습니다.
  • 리소스 제약 무시 – 함수당 메모리/CPU 제한이 에뮬레이션 중에 적용되지 않으며, 이는 실제 플랫폼에서의 실행 가능성에 영향을 줄 수 있습니다.
  • 네트워크 효과 단순화 – 함수 간 데이터 전송 비용이 근사치로 처리됩니다; 실제 VPC 또는 지역 간 트래픽은 최적 경계를 변경할 수 있습니다.
  • 미래 방향(저자 제안): Konflux를 동적 스케일링 정책을 처리하도록 확장하고, 적응형 융합을 위한 실시간 텔레메트리를 통합하며, 공유 리소스가 콜드 스타트 동작에 영향을 미치는 멀티 테넌트 시나리오를 평가합니다.

저자

  • Niklas Kowallik
  • Trever Schirmer
  • David Bermbach

논문 정보

  • arXiv ID: 2601.11156v1
  • Categories: cs.DC
  • Published: 2026년 1월 16일
  • PDF: Download PDF
Back to Blog

관련 글

더 보기 »