Fannie Mae와 NRO를 활용한 대규모 마이그레이션 설계 (AWS re:Invent 2025 – WPS201)
Source: Dev.to
대규모 마이그레이션이 어려운 이유
세션은 익숙한 마이그레이션 동인들을 다시 살펴보면서 시작합니다: 온‑프레미스 환경에서 재호스팅, 재플랫폼, 클라우드‑네이티브 아키텍처로 이동하면서 컴퓨팅 비용을 낮추고 혁신 속도를 높이는 것.
연사는 마이그레이션 전략을 “7 Rs” 로 프레임하고, 대규모 프로그램은 거의 항상 단일 패턴이 아니라 이 접근 방식들을 혼합해서 사용한다고 강조합니다.
전략
| 전략 | 설명 | 가장 적합한 경우 |
|---|---|---|
| Rehost | “리프트 앤 시프트” 방식으로 클라우드로 이동 | 빠른 마이그레이션, 최소한의 변경 |
| Relocate | 다른 인프라스트럭처로 이동 | 하이퍼바이저‑레벨 마이그레이션 |
| Repurchase | SaaS 솔루션으로 전환 | 맞춤형 애플리케이션 교체 |
| Retain | 온‑프레미스 유지 | 규정 준수 또는 지연 시간 요구사항 |
| Retire | 사용되지 않는 애플리케이션 제거 | 기술 부채 감소 |
| Replatform | 소규모 클라우드 최적화 | 낮은 위험으로 중간 수준 이점 |
| Refactor | 클라우드‑네이티브로 재설계 | 최대 클라우드 이점 |
핵심 메시지: 도구만으로는 충분하지 않습니다. 특히 다양한 레거시 시스템, 복잡한 데이터베이스, 제한된 예산을 다룰 때는 더욱 그렇습니다. 클라우드 경험이 부족한 조직은 자동화, 거버넌스, 계정 관리용 반복 가능한 메커니즘에 초기 투자를 해야 합니다.
세션에서는 AWS Migration Readiness Assessment (MRA) 를 모든 대규모 프로그램의 진입점으로 사용할 것을 권장합니다. MRA 프로세스는 다음을 지원합니다:
- 애플리케이션 인벤토리 및 종속성 파악
- 워크로드별 적절한 마이그레이션 전략 결정
- 일회성, 비구조화된 결정 방지
마이그레이션 평가 단계
| 단계 | 초점 | 주요 AWS 도구 |
|---|---|---|
| Assess | 탐색 및 계획 | Application Discovery Service, Migration Readiness Assessment |
| Mobilize | 설정 및 준비 | Control Tower, Landing Zone, Account vending |
| Migrate/Modernize | 실행 및 최적화 | Migration tools, Well‑Architected reviews |
동시에 조직은 AWS Control Tower‑style landing zone 또는 “account vending machine” 을 구축해 새 계정을 빠르고 일관되게 프로비저닝하고, 보안·규정 준수·거버넌스를 위한 가드레일을 내장해야 합니다.
AWS Well‑Architected Framework
이 프레임워크는 설계와 검토의 백본 역할을 합니다. 여섯 개의 기둥은 각 워크로드에 대한 트레이드‑오프를 논의하기 위한 것이며, 마이그레이션 후 체크리스트를 만족시키기 위한 것이 아닙니다.
| 기둥 | 초점 영역 | 주요 고려 사항 |
|---|---|---|
| Operational Excellence | 시스템 운영·모니터링 | 자동화, 절차, 지속적인 개선 |
| Security | 정보·시스템 보호 | 정체성, 권한, 데이터 보호 |
| Reliability | 시스템 가용성·복구 | 내결함성, 백업, 재해 복구 |
| Performance Efficiency | 자원 효율적 사용 | 적정 규모, 모니터링, 기술 선택 |
| Cost Optimization | 최소 비용으로 가치 제공 | 자원 최적화, 가격 모델 |
| Sustainability | 환경 영향 최소화 | 효율 개선, 재생 에너지 |
실용 팁: 비즈니스 이해관계자에게 각 애플리케이션에 가장 중요한 기둥이 무엇인지 물어보세요. 일부 워크로드는 신뢰성과 운영 우수성을, 다른 워크로드는 비용이나 성능을 우선시할 수 있습니다. 이러한 결정이 아키텍처 선택, 용량 계획, 운영 매뉴얼을 이끌어야 합니다.
Cloud Center of Excellence (CCoE)
다음 영역을 아우르는 교차 기능 팀:
- ☁️ 클라우드 아키텍처
- 🖥️ 인프라스트럭처
- 🔒 보안
- ⚙️ 운영
- 💻 소프트웨어 엔지니어링
CCoE 책임
- ✅ 랜딩 존 및 네트워크 패턴 표준화
- 🔐 IAM 제어 및 보안 정책 정의
- 💰 비용 관리 관행 수립
- 📚 모범 사례 및 교훈 문서화
- 🚀 비즈니스 유닛 전반에 혁신 활성화
Fannie Mae와 NRO 모두 초기 마이그레이션을 마친 뒤 CCoE를 활용해 “혁신 속도”를 크게 높였습니다.
Fannie Mae Forecast Transformation
비즈니스 배경
- 구매: 대출기관으로부터 주택담보대출을 매입
- 패키징: 이를 모기지‑백드 증권으로 묶음
- 판매: 증권을 투자자에게 판매
포트폴리오 성과에 대한 정확하고 시기적절한 예측은 사명에 필수적입니다.
과제
| 과제 | 영향 |
|---|---|
| 스프레드시트 중심 프로세스 | 수동 오류, 확장성 제한 |
| 파편화된 시스템 | 데이터 사일로, 통합 복잡성 |
| 수명 종료 인프라 | 성능 병목, 유지보수 비용 |
| 얇게 퍼진 전문성 | 지식 사일로, 단일 실패 지점 |
| 과도한 커스터마이징 | 변화 주기 지연, 취약한 시스템 |
프로그램 목표 (Forecast Transformation Program – 2023년 9월 시작)
| 지표 | 이전 | 목표 | 개선률 |
|---|---|---|---|
| 예측 라이프사이클 | ~80 일 | ~10 일 | 87.5 % 감소 |
| 스트레스‑테스트 실행 | 순차적 | 병렬 | 동시 처리 |
| 시스템 통합 | ~80 시스템 | 1 플랫폼 | 98.75 % 감소 |
| 계산 통합 | ~2,000 | 단일 | 단일 진실 원천 |
| 대출 레코드 처리량 | 제한적 | 실행당 1.5 B | 대규모 확장 |
솔루션의 핵심 특성:
- ⚡ 수요에 따라 자동 확장되는 컴퓨팅
- 🔒 엄격한 규제 준수 (보안, 감사 가능성, 데이터 품질)
- 🎭 사람·프로세스·기술·거버넌스를 동시에 다루는 전체론적 접근
아키텍처 개요
| 구성 요소 | AWS 서비스 | 목적 | 주요 이점 |
|---|---|---|---|
| Data Backbone | Amazon S3 | 통합 데이터 도메인 | 입력 데이터, 모델 출력, 계산 결과, 분석 데이터를 저장 |
| Compute Engine | Amazon EMR | 대규모 데이터 처리 | 수십 개 클러스터에 걸쳐 수십억 건 대출 레코드 처리; 자동 확장 |
| Orchestration | AWS Step Functions | 엔드‑투‑엔드 워크플로 | 데이터 수집, 모델, 계산, 시스템 통합을 조정 |
| Metadata & Config | Aurora + DynamoDB | 구성 관리 | 시나리오, 모델 파라미터, 계산 규칙 저장 |
| User Interface | Angular on AWS Fargate | 비즈니스 사용자 경험 | 시나리오 정의, 입력 지정, 실행 트리거 제공 |
| Analytics | Amazon SageMaker + Tableau | 보고·분석 | 규제 보고와 내부 분석 지원 |
YAML 비즈니스 규칙
비즈니스 계산을 YAML에 인코딩한 설계는 다음을 가능하게 합니다:
- ✅ 비즈니스 로직을 애플리케이션 코드와 분리
- ✅ 코드 재배포 없이 비즈니스 주도 변경 가능
- ✅ 규칙 업데이트에 대한 개발 주기 단축
graph TD
A[Business User Input] --> B[Data Ingestion]
B --> C[S3 Data Backbone]
C --> D[Model Execution]
D --> E[EMR Calculations]
E --> F[Output Processing]
F --> G[Analytics & Reporting]
워크플로 단계
- User Input: 비즈니스 사용자가 UI를 통해 시나리오 유형을 선택하고 가정을 입력.
- Data Ingestion: 플랫폼이 다수의 레코드 시스템에서 데이터를 가져옴.
- Data Storage: 모든 데이터가 S3 데이터 백본에 저장됨.
- Model Execution: 기존 및 신규 플랫폼‑특정 모델을 호출.
- Rule Application: EMR이 수천 개의 YAML‑정의 비즈니스 규칙을 적용.
- Output Distribution: 결과가 API와 SNS를 통해 하위 시스템으로 전달.
- Analytics Preparation: 규제 및 관리 도구용 데이터 준비.
구현 시 도전 과제
| 도전 과제 | 규모 | 해결 접근법 |
|---|---|---|
| 팀 협업 | 100명 이상 엔지니어 | 표준화된 가드레일, 코딩 규칙, 통합 패턴 |
| 시스템 통합 | 76개의 상·하위 시스템 | 신중한 API 설계, 최소 중단 접근법 |
| 프로그램 기간 | 다년 프로젝트 | 일관된 거버넌스, 단계적 전달, 자동화 테스트 |
세션에서는 검증된 마이그레이션 패턴, 강력한 거버넌스 프레임워크, 전담 Cloud Center of Excellence 를 결합하면 Fannie Mae와 NRO와 같은 조직이 보안·규정 준수·운영 우수성을 유지하면서 대규모 마이그레이션을 성공적으로 수행할 수 있다고 강조했습니다.