자율 에이전트가 맞이한 최대 과제: 데이터베이스.

발행: (2026년 6월 5일 AM 03:53 GMT+9)
11 분 소요

출처: The New Stack

대형 언어 모델이 단순 챗봇에서 추론·계획·행동이 가능한 자율 에이전트로 진화하면서, 이제는 스스로 복잡한 애플리케이션 스택을 조율하기 시작하고 있습니다.

하지만 이러한 에이전트가 지금 마주하고 있는 가장 강력한 장애물은 바로 데이터베이스입니다.

Andy Pavlo. Credit: Carnegie-Mellon University

“데이터베이스는 그 무자비한 정확성 및 성능 요구사항 때문에 에이전트에게 가장 어렵고 중요한 과제입니다.”라고 카네기 멜론 대학 컴퓨터 과학 부교수 Andy Pavlo가 지난 주 캘리포니아 주 마운틴 뷰에 있는 Computer History Museum에서 열린 Percona Live 2026 컨퍼런스에 참석한 이들에게 말했습니다.

AI와 오픈소스 인프라스트럭처의 교차점에 대한 토론에서 Pavlo는 코딩 에이전트가 표준 자료구조를 쉽게 재현할 수 있는 반면, 데이터베이스는 자동화와 최적화가 가장 어려운 부분이라고 주장했습니다.

“예를 들어, 에이전트가 UI 컴포넌트를 착각해서 만들면 페이지가 약간 어색해 보이지만, 프로덕션 데이터베이스에서 쿼리나 설정 변경을 착각하면 전체 시스템이 사라질 수 있습니다.”라고 Pavlo는 말했습니다.

그것은 정말 경고 신호가 될 만합니다.

다중 에이전트 줄다리기

Pavlo는 AI가 데이터베이스 세계에 미치는 두 가지 주요 방식을 제시합니다: 튜닝 에이전트코딩 에이전트. 튜닝 에이전트는 데이터베이스 최적화라는 ‘블랙 매직’을 해결하려고 합니다—시스템 노브, 물리적 설계(예: 인덱스), 쿼리 실행 전략을 자동으로 조정하는 것이죠. 전통적으로는 인간 데이터베이스 관리자(DBA)가 수년간 직관을 키워 어떤 설정이 레이턴시나 처리량을 개선할지 판단해야 했습니다.

“에이전트가 UI 컴포넌트를 착각하면 페이지가 약간 어색해 보이고, 프로덕션 데이터베이스에서 쿼리나 설정 변경을 착각하면 전체 시스템이 사라질 수 있습니다.”

문제는 이러한 특화된 에이전트들이 종종 사일로에서 작동한다는 점입니다. 인덱스 튜닝 에이전트가 무엇을 하고 있는지 모르는 노브 튜닝 에이전트는 지역 최적점에 머물게 되고, 시스템은 기본값보다 나아지지만 최적에는 멀어집니다. CMU의 다중 라운드 및 순차 튜닝 연구는 이를 조정 프레임워크로 해결하려 하지만, 여기에도 “차원의 저주”가 존재한다고 Pavlo는 말합니다.

Carnegie Mellon’s Database Group자율 주행 데이터베이스머신러닝 기반 데이터베이스 최적화 개념을 선구적으로 제시했습니다. 순차 튜닝과 다중 라운드 튜닝은 그들의 자율 DBMS 프로젝트의 핵심 요소입니다.

AI 데이터베이스에서 다중 라운드·순차 튜닝은 AI 모델을 다단계 추론, 도구 활용, 복잡한 대화 히스토리에 맞게 정교화하는 고급 머신러닝·데이터 엔지니어링 방법을 의미합니다. 이러한 프레임워크는 AI가 단일 턴이 아닌 복합 상호작용 전반에 걸쳐 컨텍스트와 논리를 유지하도록 보장합니다.

가능한 설정 조합이 수조 개에 달하므로, 완벽한 데이터베이스를 찾는 탐색 공간은 사실상 지수적으로 커집니다.

코딩 에이전트의 장점과 옵티마이저 장벽

개발 측면에서 코딩 에이전트는 이미 초고생산성 협업자로 입증되고 있습니다. Pavlo는 CMU에서 데이터베이스 과제에 대한 학생 제출물이 LLM 사용이 허용된 이후 코드 라인 수가 급증했다고 관찰했습니다. “코딩 에이전트는 교과서와 오픈소스 레포에 있는 표준 구현을 재현할 수 있기 때문에 B+ 트리, 해시 테이블, 버퍼 매니저 등 데이터베이스 거의 모든 부분을 구축하는 데 매우 능숙합니다.”라고 그는 말했습니다.

하지만 Pavlo가 지적하듯 ‘이중 검은 다이아몬드’ 문제는 쿼리 옵티마이저에 남아 있습니다. 기본 자료구조와 달리, 쿼리 옵티마이저는 깔끔하고 모듈화된 오픈소스 레퍼런스로 제공되는 경우가 드뭅니다. 대부분은 해당 시스템에 깊게 얽혀 있기 때문이죠. 더 나아가, AI가 생성한 변환 규칙이 의미적으로 정확하다는 것을 증명하는 것—즉 원본 쿼리와 동일한 결과를 더 빠르게 산출한다는 것—은 아직 해결되지 않은 문제입니다.

위험 요소: 착각과 보안

에이전트 기반 데이터베이스 관리로의 전환은 큰 위험을 동반합니다. Pavlo와 Percona 공동 설립자 Peter Zaitsev 같은 업계 리더들은 에이전트에게 오케스트레이션을 맡기는 것이 안정성·보안 격차를 크게 확대할 수 있다고 경고합니다. 이미 에이전트가 데이터베이스를 대상으로 작동하면서 전체 시스템을 실수로 삭제하거나, 접근 제어의 미묘한 차이를 이해하지 못해 민감 정보를 유출한 사례가 문서화되어 있습니다.

또한 LLM은 이른바 AI 슬롭에 시달리는데, 이는 특정 쿼리에 과도하게 특화된 코드를 생성하지만 일반화에 실패한다는 현상입니다. 예를 들어, 개발자가 “Extract Year” 절을 최적화하도록 에이전트를 사용하면, 에이전트가 내부 데이터 구조를 만들어 두고는 개발자가 “Extract Month”를 적용하려는 순간 바로 깨지는 경우가 있습니다.

자동화는 대체가 아니라 협업자

이러한 난관에도 불구하고 Pavlo는 **Agent Operator 모델**에 대해 낙관적입니다. 이 모델은 에이전트가 “새벽 3시 화재”와 같은 즉각적인 성능 이상·안정성 문제를 처리하고, 인간은 더 높은 수준의 아키텍처 설계에 집중하도록 설계되었습니다. 기존에 튜닝된 데이터베이스에서 **Agent Boosting 기법**을 활용해 학습 데이터를 부트스트랩하면, 시스템 최적화에 걸리는 시간을 12시간에서 15분 이하로 단축할 수 있다고 Pavlo는 말했습니다.

새로운 AI 시대에 목표는 단순히 코드를 작성하는 AI가 아니라 자신의 성능과 정확성을 스스로 추론할 수 있는 시스템을 만드는 것입니다. Pavlo는 데이터베이스가 모든 에이전트에게 지식의 기반이라고 결론짓습니다.

“자율 시스템을 원한다면, 먼저 무자비한 자율 데이터베이스 기술을 마스터해야 합니다.”

“자율 시스템을 원한다면, 먼저 무자비한 자율 데이터베이스 기술을 마스터해야 합니다.”



YOUTUBE.COM/THENEWSTACK

Tech moves fast, don’t miss an episode. Subscribe to our YouTube
channel to stream all our podcasts, interviews, demos, and more.

SUBSCRIBE


Group
Created with Sketch.

0 조회
Back to Blog

관련 글

더 보기 »