LLM 호출 없이 학습하는 AI 에이전트를 위한 인지 레이어를 만들었습니다
Source: Dev.to
문제점
에이전트가 대화를 시작할 때마다 처음부터 시작합니다.
요약을 시스템 프롬프트에 넣거나, RAG를 사용하거나, Mem0나 Zep을 호출할 수는 있죠.
하지만 이 모든 방법은 같은 문제를 가지고 있습니다: 학습에 LLM 호출이 필요하다는 점입니다. 사실을 추출하고, 사용자 프로필을 만들고, 중요한 것을 이해하려면 토큰당 비용을 지불하고, 지연 시간이 추가되며, 클라우드 서비스에 의존하게 됩니다.
학습이 로컬에서 자동으로, LLM 전혀 사용하지 않고 이루어진다면 어떨까요?
AuraSDK가 다르게 하는 일
AuraSDK는 어떤 LLM과도 함께 동작하는 인지 레이어입니다. 상호작용을 관찰하고—LLM 호출 없이—패턴, 원인, 행동 규칙에 대한 구조화된 이해를 구축합니다.
from aura import Aura, Level
brain = Aura("./agent_memory")
brain.enable_full_cognitive_stack()
# store what happens
brain.store(
"User always deploys to staging first",
level=Level.Domain,
tags=["workflow"]
)
brain.store(
"Staging deploy prevented 3 production incidents",
level=Level.Domain,
tags=["workflow"]
)
# sub-millisecond recall — inject into any LLM prompt
context = brain.recall("deployment decision")
# after enough interactions, the system derives this on its own:
hints = brain.get_surfaced_policy_hints()
# [{"action": "Prefer", "domain": "workflow", "description": "deploy to staging first"}]
아무도 그 정책 규칙을 작성하지 않았습니다; 시스템이 저장된 관찰 패턴으로부터 스스로 도출한 것입니다.
인지 파이프라인
AuraSDK는 저장된 각 레코드를 다섯 개의 결정론적 레이어를 통해 처리합니다:
Record → Belief → Concept → Causal → Policy
- Belief – 관련된 관찰을 그룹화하고 모순을 해결
- Concept – Belief 사이에서 안정적인 주제 클러스터를 발견
- Causal – 시간적·명시적 연결을 통해 원인‑결과 패턴을 찾음
- Policy – 인과 패턴으로부터 행동 힌트(Prefer / Avoid / Warn)를 도출
전체 파이프라인은 밀리초 단위로 실행됩니다—LLM도, 클라우드도, 임베딩도 필요 없습니다.
60초 안에 사용해 보기
pip install aura-memory
python examples/demo.py
샘플 출력
Phase 4 - Recall in action
Query: "deployment decision" [0.29ms]
1. Staging deploy prevented database migration failure
2. Direct prod deploy skipped staging -- caused data loss
Query: "code review" [0.18ms]
1. Code review caught SQL injection before merge
2. Code review found performance regression early
학습 사이클 5회가 16 ms에 완료되었습니다. 조회 시간은 0.29 ms였습니다.
비교
| Feature | AuraSDK | Mem0 | Zep | Letta |
|---|---|---|---|---|
| 학습에 LLM 필요 여부 | No | Yes | Yes | Yes |
| 오프라인 작동 여부 | Fully | Partial | No | With local LLM |
| 조회 지연 시간 |
- 설치:
pip install aura-memory - 웹: (원본에 링크가 제공되지 않음)
AI 에이전트를 구축하고 결정론적이며 설명 가능하고 오프라인에서도 사용할 수 있는 메모리가 필요하다면—한 번 사용해 보고 의견을 알려 주세요.