예시를 통한 AI 에이전트 교육: 자동화의 새로운 패러다임
Source: Dev.to
Introduction
수십 년 동안 우리는 컴퓨터에게 명시적인 지시를 통해 가르쳐 왔습니다: 코드를 작성하고, 셀렉터를 정의하고, 모든 예외 상황을 처리하죠. 그런데 인간에게 가르치는 방식—무엇을 해야 하는지를 보여주는 방식으로 AI 에이전트를 가르칠 수 있다면 어떨까요?
전통적인 브라우저 자동화는 깨지기 쉬운 셀렉터와 경직된 스크립트에 의존합니다. 웹사이트가 CSS 클래스를 업데이트하면 자동화가 중단되고, 버튼이 이동하면 스크립트가 실패합니다. 여러분은 “무엇을 해야 하는가”를 설명하는 것이 아니라 “어떻게 해야 하는가”를 정확히 규정하고 있는 겁니다. 이 때문에 유지보수가 악몽이 됩니다: UI가 바뀔 때마다 코드를 수정해야 하고, 새로운 워크플로우마다 엔지니어링 시간이 필요합니다. 작업을 잘 아는 도메인 전문가도 개발자 도움 없이 자동화를 만들 수 없습니다.
The Idea: Teaching by Demonstration
작업을 수행하는 모습을 녹화하고, AI가 그 의도와 워크플로우, 의사결정 포인트를 추출한다면 어떨까요? 바로 SkillForge가 추구하는 아이디어입니다—스크린 녹화를 구조화된 스킬 파일로 변환해 어떤 AI 에이전트든 실행할 수 있게 하는 도구입니다.
How SkillForge Works
- Record – 웹 기반 작업을 수행하는 모습을 캡처합니다.
- Extract – AI가 녹화를 분석해 목표, 워크플로우, UI 요소를 식별합니다.
- Generate – 결과물은 컨텍스트를 고려한 명령이 담긴 사람이 읽을 수 있는
SKILL.md파일입니다. - Execute – 호환되는 에이전트라면 누구든 스킬을 실행해 UI 변화에 적응합니다.
Benefits
- Resilience – 스킬은 셀렉터가 아니라 의도를 기술하기 때문에 UI 업데이트에도 살아남습니다.
- Accessibility – 도메인 전문가가 코드를 작성하지 않고도 자동화를 만들 수 있습니다.
- Portability – 스킬은 다양한 에이전트 프레임워크에서 재사용할 수 있습니다.
- Transparency – 포맷이 사람이 읽을 수 있고 감사 가능하도록 설계되었습니다.
Skill File Format
생성된 SKILL.md는 간단한 마크다운 구조를 따릅니다:
- Goal – 에이전트가 달성해야 할 목표.
- Workflow – 단계별 실행 계획.
- Context – 요소를 의미론적으로 식별하는 방법.
- Error handling – 복구 전략.
Compatibility
이 포맷은 AutoGen, LangChain, CrewAI 혹은 구조화된 명령을 파싱할 수 있는 모든 프레임워크와 호환됩니다.
Looking Ahead
우리는 AI 에이전트가 인간처럼 관찰을 통해 학습하는 세상을 향해 나아가고 있습니다. 코딩이 아니라 시연을 통해 도메인 전문 지식을 캡처하면 자동화가 모든 사람에게 열릴 것입니다.
Links
- Product Hunt: https://www.producthunt.com/products/skillforge-2
- Website: https://skillforge.expert
What workflows would you teach an AI agent if you could just show it once?