AWS 주기율표의 Amazon Athena
Source: Dev.to

Service Overview
Amazon Athena는 SQL을 사용해 Amazon S3에 있는 데이터를 직접 분석할 수 있는 인터랙티브 쿼리 서비스입니다. 완전 서버리스 방식이라 서버를 프로비저닝하거나 구성·관리할 필요가 없습니다. Athena는 주로 ad‑hoc 쿼리, 로그 분석, 데이터 탐색에 활용됩니다.
Key Features
- 서버리스 – 관리할 인프라가 없음
- SQL 기반 쿼리(Presto / Trino 엔진)
- Amazon S3에 있는 데이터를 직접 조회
- CSV, JSON, Parquet, ORC, Avro 포맷 지원
- 병렬 처리로 빠른 쿼리 실행
- AWS Glue Data Catalog와 통합
- IAM을 활용한 내장 보안 및 접근 제어
AWS Category / Cloud Domain
- Category: Analytics
- Cloud Domain: 빅데이터, 데이터 분석, 데이터 웨어하우징
Where It Fits in Cloud / DevOps Lifecycle
Amazon Athena는 클라우드 및 DevOps 라이프사이클의 데이터 분석·모니터링 단계에 위치합니다. 주로 다음과 같은 용도로 사용됩니다:
- 로그 분석 및 문제 해결
- 보안 감사 및 규정 준수 보고
- CI/CD 파이프라인에서 데이터 검증
- 개발·운영 중 ad‑hoc 분석
DevOps 및 DevSecOps 워크플로우에서 Athena는 추가 도구를 배포하지 않고도 운영 및 보안 데이터에서 빠르게 인사이트를 얻을 수 있게 도와줍니다.
Programming Language / Access Methods
Query Language: SQL
Access Methods:
- AWS Management Console
- AWS CLI
- AWS SDKs (Java, Python, JavaScript 등)
- JDBC / ODBC 드라이버
- Amazon QuickSight와 같은 BI 도구와의 통합
Pricing Model
Amazon Athena는 쿼리당 요금제(pay‑per‑query)를 따릅니다:
- 각 쿼리가 스캔한 데이터 양에 따라 과금
- 초기 비용이나 최소 요금 없음
- Parquet, ORC와 같은 압축·컬럼형 포맷을 사용하면 비용 최적화 가능
Conclusion
Amazon Athena는 대규모 데이터셋을 손쉽게 쿼리할 수 있는 간단하면서도 강력한 분석 서비스입니다. 서버리스 특성, SQL 지원, 그리고 다른 AWS 서비스와의 원활한 연동 덕분에 현대 클라우드 기반 데이터 분석 및 DevOps 환경에서 필수적인 구성 요소가 됩니다.
I would like to sincerely thank my professor, @santhoshnc, for his guidance and encouragement in learning cloud technologies and AWS services like Amazon Athena.