AWS 주기율표의 Amazon Athena

발행: (2025년 12월 19일 오전 01:07 GMT+9)
3 분 소요
원문: Dev.to

Source: Dev.to

Cover image for Amazon Athena in the AWS Periodic Table

Service Overview

Amazon Athena는 SQL을 사용해 Amazon S3에 있는 데이터를 직접 분석할 수 있는 인터랙티브 쿼리 서비스입니다. 완전 서버리스 방식이라 서버를 프로비저닝하거나 구성·관리할 필요가 없습니다. Athena는 주로 ad‑hoc 쿼리, 로그 분석, 데이터 탐색에 활용됩니다.

Key Features

  • 서버리스 – 관리할 인프라가 없음
  • SQL 기반 쿼리(Presto / Trino 엔진)
  • Amazon S3에 있는 데이터를 직접 조회
  • CSV, JSON, Parquet, ORC, Avro 포맷 지원
  • 병렬 처리로 빠른 쿼리 실행
  • AWS Glue Data Catalog와 통합
  • IAM을 활용한 내장 보안 및 접근 제어

AWS Category / Cloud Domain

  • Category: Analytics
  • Cloud Domain: 빅데이터, 데이터 분석, 데이터 웨어하우징

Where It Fits in Cloud / DevOps Lifecycle

Amazon Athena는 클라우드 및 DevOps 라이프사이클의 데이터 분석·모니터링 단계에 위치합니다. 주로 다음과 같은 용도로 사용됩니다:

  • 로그 분석 및 문제 해결
  • 보안 감사 및 규정 준수 보고
  • CI/CD 파이프라인에서 데이터 검증
  • 개발·운영 중 ad‑hoc 분석

DevOps 및 DevSecOps 워크플로우에서 Athena는 추가 도구를 배포하지 않고도 운영 및 보안 데이터에서 빠르게 인사이트를 얻을 수 있게 도와줍니다.

Programming Language / Access Methods

Query Language: SQL

Access Methods:

  • AWS Management Console
  • AWS CLI
  • AWS SDKs (Java, Python, JavaScript 등)
  • JDBC / ODBC 드라이버
  • Amazon QuickSight와 같은 BI 도구와의 통합

Pricing Model

Amazon Athena는 쿼리당 요금제(pay‑per‑query)를 따릅니다:

  • 각 쿼리가 스캔한 데이터 양에 따라 과금
  • 초기 비용이나 최소 요금 없음
  • Parquet, ORC와 같은 압축·컬럼형 포맷을 사용하면 비용 최적화 가능

Conclusion

Amazon Athena는 대규모 데이터셋을 손쉽게 쿼리할 수 있는 간단하면서도 강력한 분석 서비스입니다. 서버리스 특성, SQL 지원, 그리고 다른 AWS 서비스와의 원활한 연동 덕분에 현대 클라우드 기반 데이터 분석 및 DevOps 환경에서 필수적인 구성 요소가 됩니다.

I would like to sincerely thank my professor, @santhoshnc, for his guidance and encouragement in learning cloud technologies and AWS services like Amazon Athena.

Back to Blog

관련 글

더 보기 »