에이전트형 AI가 기업 검색을 한계까지 확장하면서 컨텍스트 아키텍처가 RAG를 대체한다
Source: VentureBeat
Redis Iris: 에이전트 AI를 위한 컨텍스트 및 메모리 플랫폼
Redis는 웹 애플리케이션이 부하에 무너지지 않도록 해준 캐싱 레이어로 이름을 알렸습니다.
지금 목표로 하는 문제는 구조는 비슷하지만 해결이 더 어렵습니다: 프로덕션 AI 에이전트가 실패하는 이유는 모델이 틀렸기 때문이 아니라, 그 아래에 있는 데이터가 흩어져 있고, 오래됐으며, 인간을 위해 설계돼 있어 기계가 사용하기에 부적합하기 때문입니다. 단일 쿼리를 위해 만든 검색 파이프라인은 에이전트가 생성하는 방대한 양을 흡수하지 못합니다.
구조적 격차
Redis가 겨냥하고 있는 격차는 구조적입니다: 에이전트는 인간 사용자가 요구하는 것보다 몇 배에서 수십 배 더 많은 데이터 요청을 합니다. 하지만 대부분의 검색 레이어는 인간 규모의 문제를 해결하도록 설계되었습니다.
- Redis Iris는 월요일에 출시된 회사의 답변으로, 에이전트와 에이전트가 행동하는 데 필요한 데이터 사이에 위치하는 컨텍스트·메모리 플랫폼입니다.
- 이 플랫폼은 다음을 결합합니다:
- 실시간 데이터 수집.
- 비즈니스 데이터 모델에서 자동으로 MCP 도구를 생성하는 의미론적 인터페이스.
- Redis Flex 위에 구축된 에이전트 메모리 서버. Flex는 스토리지 엔진을 새로 고쳐 99 %의 데이터를 플래시(SSD)에서 실행하고, 순수 인‑메모리 스토리지 대비 1/10 비용으로 운영합니다.
이 발표는 엔터프라이즈 RAG 인프라가 활발히 전환 중인 시점에 이루어졌습니다.
VentureBeat의 2026년 1분기 VB Pulse RAG 인프라 시장 트래커에 따르면, 하이브리드 검색 도입 의향이 1월에서 3월 사이 10.3 %에서 33.3 %로 3배 증가했습니다. 검색 최적화는 처음으로 평가보다 기업 투자 우선순위 1위가 되었고, 맞춤형 사내 검색 스택은 24.1 %에서 35.6 %로 상승했습니다. 이는 기업들이 기성품 옵션을 넘어섰음을 의미합니다.
Redis만이 이 신호를 읽는 인프라 공급업체는 아닙니다—최근 몇 주간 여러 데이터 플랫폼 제공업체가 에이전트 컨텍스트 레이어를 중심으로 포지셔닝을 바꾸었습니다.
“기업은 인간보다 수십 배 이상 많은 에이전트를 보유하게 될 것입니다,” 라고 Redis CEO Rowan Trollope가 VentureBeat에 말했습니다.
“인간보다 수십 배 더 많은 에이전트는 백엔드 시스템에 수십 배 더 큰 부하를 의미합니다.”
캐시에서 컨텍스트로
Trollope는 이 유사점을 모바일 시대로 거슬러 올라갑니다. 지점 텔러용 레거시 백엔드가 갑자기 백만 명의 스마트폰 사용자를 지원해야 했을 때, Redis는 전체 재구축 없이 부하를 흡수하는 캐시 레이어가 되었습니다.
이번에 다른 점은 에이전트가 자체 미들웨어를 작성할 수 없다는 것입니다. 모바일 시대에는 개발자가 DB 관리자와 함께 애플리케이션이 필요로 하는 쿼리를 파악하고, 캐시 로직을 미들웨어에 하드코딩했습니다. 에이전트는 그럴 수 없습니다. 런타임에 올바른 데이터를 찾아야 하는데, 이를 위해 미리 준비된 인터페이스가 없으면 작업이 멈춥니다.
“이것은 냉장고에 있는 식료품점 비유와 같습니다,” 라고 그는 말했습니다.
“샌드위치를 만들 때마다 식료품점에 뛰어가야 한다면 비효율적이죠. 그래서 각 가정에 냉장고를 두고 조금씩 음식을 보관합니다. 현재 우리 인프라 스택도 비슷한 형태를 띠고 있습니다.”
Redis Iris에 포함된 내용
Iris는 다섯 가지 구성 요소를 제공해 데이터 수집, 의미론적 접근, 메모리, 캐시를 모두 포괄합니다.
| 구성 요소 | 제공 상태 | 설명 |
|---|---|---|
| Redis Data Integration (RDI) | 일반 제공 | CDC 파이프라인을 이용해 관계형 DB, 데이터 웨어하우스, 문서 저장소의 데이터를 지속적으로 Redis와 동기화합니다. Oracle, Snowflake, Databricks, Postgres용 커넥터 포함. |
| Context Retriever | 프리뷰 | 개발자는 pydantic 모델을 사용해 비즈니스 데이터의 의미론적 모델을 정의하고, Redis는 에이전트가 직접 쿼리할 수 있는 MCP 도구를 자동 생성합니다. 행 수준 접근 제어는 서버 측에서 적용됩니다. Trollope는 기존 RAG와의 변화를 “에이전트가 데이터를 끌어오는 방향 전환이라며, 파이프라인에 미리 채워 넣는 것이 아니라 에이전트가 스스로 데이터를 가져오게 하는 것”이라고 설명했습니다. |
| Agent Memory | 프리뷰 | 세션 간 단기·장기 상태를 저장해 에이전트가 매 턴마다 컨텍스트를 재구성할 필요 없이 유지합니다. |
| Redis Flex | — | 99 %의 데이터를 SSD에, 1 %를 RAM에 저장해 페타바이트 규모 검색을 서브밀리초 지연으로 제공합니다. |
| Redis Search and LangCache | — | 플랫폼 하부의 검색·의미론적 캐시 백본. LangCache는 프롬프트 응답을 캐시해 중복 모델 호출을 줄입니다. |
애널리스트 의견
데이터 산업 전반이 현재 같은 방향으로 움직이고 있습니다. 주요 데이터베이스 업체마다 컨텍스트 레이어를 강조하고 있습니다.
- 전통적인 데이터베이스 업체(예: Oracle)는 관계형 DB를 에이전트 AI 시대에 맞추기 위해 컨텍스트·메모리 레이어를 통합하고 있습니다.
- 전용 벡터 데이터베이스 업체(예: Pinecone)도 에이전트 AI 컨텍스트를 위한 새로운 지식 레이어를 구축 중입니다.
- 독립형 컨텍스트 레이어인 Hindsight도 떠오르는 생태계의 일원입니다.
Trollope는 Redis의 포지션을 경쟁사와 구조적으로 다르다고 강조합니다:
“우리가 승리하려면 다른 누군가가 질 필요는 없습니다,” 라고 그는 말했습니다. 많은 Redis 배포 환경에서는 이미 MongoDB나 Oracle이 백엔드 시스템으로 사용되고 있습니다. Iris는 이러한 시스템을 대체하기보다 그 시스템을 반영하고 캐시합니다. Redis는 Iris를 Snowflake Marketplace에 네이티브 커넥터와 함께 출시합니다.
HyperFRAME Research의 AI 스택 실무 책임자 Stephanie Walter는 시장 상황을 이렇게 요약했습니다: “시장은 같은 결론에 수렴하고 있습니다. 에이전트는 더 많은 토큰이나 더 좋은 모델이 아니라, 거버넌스가 적용된 최신, 저지연 컨텍스트가 필요합니다.”
그녀는 Redis의 차별성을 “런타임에 가깝고, 지연에 민감한 운영 상태와 실시간 데이터”에 이미 자리 잡고 있다는 점에 두었습니다.
“핵심 메시지는 ‘더 나은 RAG’가 아니라 ‘에이전트가 실제 작업 중에 실시간 컨텍스트, 메모리, 빠른 검색을 필요로 한다’는 것입니다,” 라고 그녀는 말했습니다.
Redis든 다른 벤더든, 모든 컨텍스트 레이어 기술은 거버넌스 문제를 해결해야 성공할 수 있습니다.
“에이전트 AI가 기업 환경에서 확장되지 못하는 이유는 각 에이전트가 새로운 비용 센터, 새로운 데이터 접근 위험, 새로운 거버넌스 예외가 되기 때문입니다,” 라고 Walter는 경고했습니다. “승리하는 컨텍스트 레이어는 에이전트를 더 빠르고, 더 저렴하게, 그리고 …” (생략)
정리된 마크다운 섹션 끝.
“그리고 더 안전하게 실행할 수 있다.”
실시간 임상 AI에서는 컨텍스트 오류가 허용되지 않는다
Mangoes.ai는 이미 프로덕션 환경에서 컨텍스트 오류가 환자 결과에 직접적인 영향을 미치는 상황을 경험한 기업입니다.
Amit Lamba(Mangoes.ai 설립자 겸 CEO)는 대형 의료 시설에 실시간 음성 AI 플랫폼을 배포하고 있습니다. 환자와 임상의가 치료, 일정, 케이스 히스토리 등에 대해 실시간으로 질문합니다. Mangoes.ai는 처음부터 Redis 위에 스택을 구축했습니다.
“검색, 메모리, 세션 상태 모두 Redis를 통해 동작하므로 별도 도구를 이어 붙여서 서로 통신하도록 기대할 필요가 없습니다,” 라고 Lamba는 말했습니다.
Iris의 동적 메모리 기능이 해결하려는 문제는 복잡한 세션 전반에 걸친 상황입니다.
“한 시간짜리 그룹 치료 세션을 생각해 보세요,” 라고 Lamba는 말했습니다. “누가 언제 무엇을 말했는지 파악하고, 치료사에게 적시에 올바른 정보를 제공해야 합니다. 이것은 단순 검색 문제가 아닙니다.”
플랫폼은 여러 특화된 에이전트를 병렬로 실행합니다:
- 엔터티 식별
- 관계 추론
- 케이스 히스토리 통합
“동적 메모리 기능은 우리가 해결하려는 문제와 거의 완벽하게 맞아떨어집니다,” 라