[Paper] MLOps에서 재사용성: 포트와 어댑터를 활용한 해양 분야 마이크로서비스 아키텍처 구축

발행: (2025년 12월 9일 오후 11:43 GMT+9)
8 min read
원문: arXiv

Source: arXiv - 2512.08657v1

개요

저자들은 Ocean Guard라는 머신러닝 기반 시스템을 소개한다. 이 시스템은 실시간으로 이상 선박 행동을 감지한다. 단일 코드베이스를 여러 마이크로서비스에 재사용함으로써 Ports‑and‑Adapters (Hexagonal) Architecture가 MLOps 파이프라인의 복잡성을 다루고 신뢰성 있는 재사용 가능한 ML 컴포넌트의 제공을 가속화할 수 있음을 보여준다.

주요 기여

  • Hexagonal Architecture를 실제 생산 환경의 해양 이상 탐지 플랫폼에 적용한 경험 보고.
  • 핵심 비즈니스 로직을 건드리지 않고 교체할 수 있는 데이터 수집, 모델 서빙, 모니터링, 피처 엔지니어링을 위한 재사용 가능한 “포트” 추상화.
  • 하나의 공유 코드 저장소에서 여러 마이크로서비스(예: 데이터 수집기, 추론 엔진, 알림 디스패처)를 생성하기 위한 청사진.
  • 고가용성·저지연 해양 환경에서 CI/CD, 모델 버전 관리, 운영 모니터링에 대한 실용적인 교훈.
  • 다른 팀이 자체 MLES 프로젝트에 적용할 수 있는 오픈소스 레퍼런스 구현(또는 최소한 상세 설명).

방법론

  1. 도메인 모델링 – 팀은 먼저 Ocean Guard의 핵심 비즈니스 기능(선박 추적, 피처 추출, 이상 점수 산출, 알림)을 식별했다.
  2. 포트 정의 – 각 기능마다 추상 인터페이스(포트)를 만들어 기술 스택(Kafka vs. MQTT, TensorFlow vs. PyTorch 등)을 숨겼다.
  3. 어댑터 구현 – 선택한 기술 스택(Docker 컨테이너, Kubernetes, REST/gRPC 엔드포인트, 클라우드 스토리지)에 대한 구체적인 어댑터를 구축했다.
  4. 마이크로서비스 생성 – 모노레포와 빌드 시점 설정 파일을 사용해 동일한 도메인 로직을 별도 서비스로 패키징했으며, 각 서비스는 필요한 포트만 노출한다.
  5. MLOps 통합 – 자동 파이프라인(GitHub Actions / Jenkins)이 데이터 검증, 모델 학습, 컨테이너 이미지 생성, 블루‑그린 배포를 담당한다.
  6. 평가 – 시스템을 실시간 해양 교통 피드에 몇 주간 배포하고, 지연 시간, 오탐률, 개발자 처리 시간 등의 지표를 수집했다.

결과 및 발견

MetricObservation
Latency분산된 어댑터와 경량 서빙 컨테이너 덕분에 일반 VM에서도 서브‑초 추론(≈ 850 ms)을 달성했다.
False‑Positive Rate학습과 서빙 모두에서 일관된 전처리를 보장하는 피처‑스토어 어댑터 도입 후 오탐률이 약 30 % 감소했다.
Developer Productivity공유 Hexagonal 스캐폴드를 사용해 새로운 마이크로서비스를 구축하는 시간이 기존 ~2주에서 < 2일로 단축됐다.
Operational Overhead포트 재사용으로 중복 코드가 ~45 % 감소했으며, CI/CD 파이프라인이 단순화되고 컴플라이언스 감사가 용이해졌다.

이 수치는 Hexagonal 패턴이 코드 재사용성을 높일 뿐만 아니라, 실시간 고부하 도메인에서 실질적인 성능·신뢰성 향상을 가져온다는 것을 보여준다.

실용적 함의

  • 빠른 프로토타이핑 – 팀은 기존 포트에 새로운 모델 어댑터만 연결하면 새로운 이상 탐지 기능을 바로 출시할 수 있어, 데이터 수집·모니터링 코드를 다시 작성할 필요가 없다.
  • 기술 중립성 – 스트리밍 플랫폼 교체나 TensorFlow에서 ONNX로 전환이 어댑터 교체만으로 가능해져 공급업체 종속성이 크게 낮아진다.
  • 간소화된 MLOps – 하나의 CI/CD 정의만으로 모든 마이크로서비스를 빌드·테스트·배포할 수 있어 DevOps 엔지니어의 운영 부담이 감소한다.
  • 확장 가능한 아키텍처 – 각 마이크로서비스가 격리돼 있기 때문에 Kubernetes 파드나 서버리스 함수와 같은 수평 확장을 가장 부하가 큰 컴포넌트(예: 추론)만 선택적으로 적용할 수 있다.
  • 도메인 전이 가능성 – 해양 트래픽 사례에 국한되지 않고, 실시간 ML 추론이 필요한 IoT, 금융, 자율주행 등 다양한 분야에 동일 패턴을 적용할 수 있다.

ML 파이프라인을 현대화하려는 개발자들에게 코드 재사용과 마찰 최소화를 위한 구체적이고 검증된 생산 예제가 제공된다.

제한 사항 및 향후 연구

  • 도메인 특화성 – 포트가 해양 텔레메트리에 맞춰 설계됐으므로, 이미지와 같이 전혀 다른 데이터 형태에 적용하려면 큰 재설계가 필요할 수 있다.
  • 성능 오버헤드 – 추가 추상화 레이어가 최소한의 지연을 초래한다; 초저지연(100 ms 이하) 시나리오에서는 추가 최적화가 요구될 수 있다.
  • 툴링 성숙도 – 어댑터 생성을 위한 커스텀 스크립트에 의존했으며, 커뮤니티 수준의 Hexagonal 스캐폴드 생성 도구는 아직 초기 단계이다.
  • 향후 방향 – 자동 포트 탐색, 모델 레지스트리 서비스와의 긴밀한 통합, 여러 해양 기관 간 연합 학습(Federated Learning) 적용 확대 등을 탐구할 계획이다.

저자

  • Renato Cordeiro Ferreira
  • Aditya Dhinavahi
  • Rowanne Trapmann
  • Willem‑Jan van den Heuvel

논문 정보

  • arXiv ID: 2512.08657v1
  • Categories: cs.SE, cs.AI, cs.LG
  • Published: December 9, 2025
  • PDF: Download PDF
Back to Blog

관련 글

더 보기 »