시스템, 스토리, 그리고 스킬: 2025년 회고
Source: Dev.to
소개
4년간의 공백 끝에, 2025년은 내가 드디어 꾸준히 블로그를 다시 시작한 해였습니다.
이 해는 산업 전반과 나의 경력 모두에 있어 전환점으로 정의되었습니다. 2024년 말, 나는 Enablement and Platform Engineering 분야에 발을 들여놓으며 대학을 졸업한 이후 보안 조직 밖에서 맡은 첫 번째 역할을 시작했습니다. 이 새로운 관점에서 나는 생성형 AI 풍경이 단순한 채팅 인터페이스에서 자율 에이전트, 표준화된 도구, 재사용 가능한 스킬로 변화하는 과정을 지켜보았습니다.
Source: …
과대광고를 넘어서: 유틸리티의 부상
ChatGPT가 처음 출시되었을 때 나는 별다른 인상을 받지 못했습니다. 매주 LLM이 환각을 일으킨다는 새로운 기사들이 쏟아졌습니다. 외부 데이터 소스와 상호작용하거나 외부 시스템에 변화를 일으킬 수 있는 능력이 없었기 때문에 그 가치는 제한적이라고 생각했습니다.
2025년에 들어서면서 업계는 Model Context Protocol (MCP) 기반 표준화된 툴 호출로 전환했습니다.
- 초단위 챗 응답이나 스마트 코드 완성을 넘어 초점이 이동했습니다.
- Agentic loops—bash 명령으로 구현을 검증하거나 브라우저를 제어할 수 있는 에이전트—는 코딩 에이전트의 힘을 보여주었습니다.
- “전지전능한” LLM이 되기보다 유용성과 툴 사용 능력(MCP를 통한)으로 강조점이 바뀌었습니다.
실험에서 실행으로
Claude Code는 올해 초 실용적인 코딩 에이전트로 등장했으며, 이 분야가 성장함에 따라 여러 도전자가 뒤따랐습니다. 이 에이전트들은 위에서 언급한 휴식기 이후 개인 프로젝트에 다시 뛰어들게 해 주었습니다. 실험 비용을 크게 줄이고, 끝없는 시행착오가 초래하는 함정에 빠지는 것을 방지해 주었습니다.
그 프로젝트 중 하나가 **Verifi**였으며, 이는 개발자가 프로그래밍 언어 생태계 전반에 걸쳐 인증서를 보다 쉽게 관리할 수 있게 해 주는 도구입니다. 문법에 얽매이지 않도록 에이전트와 함께 명확한 계획을 공동 개발했고, 내가 중요하게 생각하는 결과와 비기능적 요구사항을 향해 나아갔습니다. Verifi를 구축하면서 에이전트 채택이 확대될수록 계획을 명확히 제시하고 진화시키는 능력이 구현 메커니즘보다 더 중요해질 것임을 깨달았습니다.
새로운 프론티어: 컨텍스트 엔지니어링
초기에 나는 에이전트에 더 많은 MCP 서버 접근 권한을 부여하면 더 능력 있어질 것이라고 가정했다. 그러나 도구를 너무 많이 추가하면 성능이 저하되었으며, 이는 에이전트 실패가 모델 한계가 아니라 시스템 설계 때문이라는 점을 재확인시켜 주었다.
- 프롬프트 엔지니어링은 단일 턴 프롬프트에 잘 작동한다.
- 프롬프트 크기와 도구 풍부성 사이의 긴장은 컨텍스트 엔지니어링을 2025년에 전면에 내세우게 만들었다.
컨텍스트 엔지니어링은 컨텍스트 윈도우가 도구 정의, 시스템 프롬프트, 그리고 대화 위에 겹쳐지는 사용자 지정 지시문들에 의해 압도되지 않도록 하는 데 초점을 둔다.
평가 기준을 바꾼 방법
- 단일 상호작용의 최상의 출력으로 에이전트를 판단하던 방식을 버리고, 이제는 긴 워크플로우 전반에 걸쳐 행동이 이해 가능하고 예측 가능한지를 평가한다.
등장한 전략들
| 전략 | 수행 내용 |
|---|---|
| MCP 도구 정의 최적화 | 불필요한 메타데이터를 제거해 토큰을 절약한다. |
| 커스텀/서브‑에이전트 | 경량 에이전트에 특화된 작업을 위임한다. |
| 점진적 공개 | 현재 단계에 필요한 컨텍스트만 로드한다. |
원래 Anthropic이 만든 Agent Skills 표준은 코딩 에이전트 간 일관성을 보장하고, 적절한 시점에 올바른 컨텍스트를 끌어올 수 있게 도와준다. 나는 **dependency management**와 관련된 예시 스킬을 만들었다. 글에서 설명하듯이, 에이전트는 이제 패키지 파일이 변경될 때만 의존성 관리 스킬을 로드하고, 모든 명령에 대해 미리 로드하지 않는다.
앞으로: 2026년 스킬 관리
올해 MCP와 스케일링 툴셋에 대한 논의와 유사하게, 채택이 확대됨에 따라 스킬 관리에 대한 논의도 병행될 것으로 기대합니다. 연말을 맞아 휴일 사이의 여유 시간을 이용해 잠재적인 해결책을 프로토타입했습니다.
skset – “Skill Sets”
나는 skset (Skill Sets의 약자)를 구축하여 스킬 관리 생태계가 어떻게 보일지 탐색했습니다. 초기 초점은 다양한 에이전트 디렉터리에 흩어져 있는 스킬들의 기본 문제입니다.
2026년에는 오늘날 우리가 보는 벤더‑특정 생태계를 넘어 공개적으로 스킬을 공유하는 표준화된 마켓플레이스가 등장할지 흥미롭게 지켜볼 수 있을 것입니다. 코딩 에이전트가 소프트웨어 엔지니어링을 근본적으로 재구성하고, 그 변화가 엔지니어들의 경력 전반에 어떤 영향을 미칠지에 대한 논의가 이미 진행 중입니다.
최종 생각
- 2025년은 기본 모델 성능에 큰 향상을 가져왔지만, 그 능력은 단지 기반일 뿐입니다.
- 2026년으로 접어들면서, 자동 코드 리뷰, 소셜 코딩, 그리고 대규모 품질 거버넌스에 대한 “다운스트림” 영향이 더 명확해질 것입니다.
저에게 2025년은 AI의 결정적인 전환점이었습니다. 제가 **Cloudy With a Chance of Context**에서 쓴 바와 같이, 이 시기는 2018년에 제가 클라우드를 경험했을 때와 놀라울 정도로 비슷하게 느껴집니다—클라우드 컴퓨팅이 신흥 기술에서 일반적인 모범 사례로 전환되면서 거버넌스 팀이 따라잡기 어려워졌던 시기죠.
2026년은 이러한 자율 워크플로가 실제로 프로덕션 급 엔지니어링의 높은 기준을 충족할 수 있는지 확인하는 해가 될 것입니다. 제가 skset을 구축하고 컨텍스트 관리 작업을 하면서 관찰한 바에 따르면, 도전 과제는 단일 기능이 아니라 스킬, 서브 에이전트, MCP 서버 및 기타 기능들을 효과적으로 조율하는 것입니다. 팀은 다음을 필요로 합니다:
- 컨텍스트 예산을 초과하지 않으면서 탐색을 해결한다.
- 프로젝트별 논리적 그룹화를 구성한다.
- 이러한 기능들이 어떻게 상호 작용하는지 이해한다.
여정은 이제 시작에 불과합니다—계속 지켜봐 주세요.