작은 AI 에이전트가 재무팀처럼 일할 수 있을까? 직접 해봤다.

발행: 2개월 전 (2025년 12월 4일 오후 04:50 GMT+9)

9 분 소요

Source: Dev.to

번역할 텍스트를 제공해 주시면 한국어로 번역해 드리겠습니다. 현재는 소스 링크만 포함되어 있어 번역할 내용이 없습니다. 텍스트를 복사해서 알려 주세요.

인보이스 실드 개발

지루한 재무 작업에서 AI 워크플로우 만들기

인보이스 작업을 해본 적이 있다면 그 고통을 알 것입니다: 긴 작업 시간, 반복적인 검토, 그리고 사소한 실수가 큰 재정 손실로 이어질 수 있다는 지속적인 우려. 사람들을 지치게 하는 일종의 노동이지만, 어쩐지 기계에 딱 맞는 일처럼 보입니다.

“또 다른 챗봇”을 만드는 대신, 나는 그것에 대해 이야기하는 것 이상을 할 수 있는 무언가를 만들고 싶었습니다. 이렇게 해서 Invoice Shield가 시작되었습니다—작고 전문화된 AI 에이전트 팀이 사람과 같은 방식으로 재무 워크플로우의 일부를 관리할 수 있는지 탐구하는 실험으로. 완벽하진 않지만, 지능적으로.

인보이스 실드의 실제 기능

인보이스 실드라는 작은 다중 에이전트 시스템이 재무 팀을 모방합니다.
하나의 에이전트가 들어오는 청구서 데이터를 정리합니다.
또 다른 에이전트가 잠재적인 사기 추세를 조사합니다.
네 번째 에이전트는 각 청구서가 얼마나 의심스러운지 평가합니다.
다섯 번째 에이전트는 점수가 신뢰할 수 있는지 검증합니다.
여섯 번째 에이전트가 보고서를 작성합니다.
일곱 번째 에이전트가 요약을 전달합니다.
모든 단계는 순서대로 실행하는 “매니저 에이전트”에 의해 조정됩니다.
시스템은 이론이나 철학을 논의하지 않고 단순히 작업을 수행합니다.
작업이 복잡하거나 예측 불가능할 때도 작동합니다.

에이전트를 선택하는 이유 (하나의 큰 모델 대신)

“이 청구서를 분석해 주세요,” 라고 단일 모델에 말할 수 있지만, 종종 모호한 응답과 착각을 초래합니다. 실제 세계에서는 질문 하나와 답 하나가 드물고, 반복, 검증, 인계가 이루어집니다—팀과 비슷합니다.

그래서 저는 행동을 구체적이고 목표 지향적인 역할들로 나누었습니다:

Investigator – 사기 추세를 조사합니다.
Scorer – 청구서의 의심 정도를 평가합니다.
Validator – 점수의 신뢰성을 확인합니다.
Reporter – 최종 보고서를 작성합니다.

에이전트들이 서로 대화하면서, 이 과정은 “AI가 질문에 답한다”는 느낌보다는 AI가 절차를 수행하는 느낌을 줍니다.

가장 흥미로운 부분: 루프 학습하기

사기 탐지 컴포넌트가 가장 즐거웠습니다. 에이전트는 청구서를 여러 번 평가하며, 한 번의 평가가 아니라 각 반복마다 평가를 수정합니다. 다른 “체크어 에이전트”가 만족할 때까지 경보를 울리지 않습니다.

때때로 점수가 낮아 시스템이 조용히 다시 시도합니다.
가끔은 “뭔가 심각하게 잘못됐어.”라고 판단합니다.

컴퓨터가 스스로를 의심하고 다시 시도하며, 확신이 설 때만 에스컬레이션하는 모습에는 이상하게 인간적인 면이 있습니다. 통계적으로 정확하지는 않지만, 워크플로 측면에서는 그 접근법이 설득력을 가집니다.

내가 이것을 만들면서 배운 점

좋은 AI 시스템은 종종 단일 거대한 모델보다 여러 간단한 구성 요소가 함께 작동하여 구성됩니다.
즉각적인 명확성보다 반복이 더 바람직합니다, 특히 어려운 판단을 내릴 때는 더욱 그렇습니다.
에이전트가 전문화될 때 결과가 더 명확하고 이해하기 쉬워집니다.
외부 데이터(예: Google 검색)를 통해 결정을 근거로 삼을 때 자신감 있는 헛소리를 피하기가 더 쉽습니다.
복잡한 활동에는 복잡한 코드가 필요하지 않으며, 스마트한 구조가 필요합니다.

결과: 점수 이상의 의미

파이프라인이 끝나면 Invoice Shield는 발생한 일, 청구서가 의심스러운 이유, 그리고 다음에 취해야 할 조치에 대한 간결한 설명을 제공합니다. 완벽한 사기 탐지기라고 주장하지는 않습니다.

다음에 올 것

시스템은 현재 시뮬레이션 상태이며—은행도 없고, PDF도 없으며, 실제 돈도 없습니다. 하지만 프레임워크는 다음을 위해 준비되어 있습니다:

송장에 대한 OCR 스캔
실제 공급업체 데이터베이스와의 통합
SQL로 지원되는 조정
PDF 사례 보고서

누군가 이를 실제 운영 환경에 적용하고 싶다면, 아키텍처를 변경할 필요가 없습니다—입력만 바꾸면 됩니다. 이것이 멋진 점입니다.

왜 이것이 중요한가

우리는 “AI가 일자리를 대체한다”는 이야기를 많이 듣습니다. 흥미로운 미래는 AI가 팀에 합류해 지루하고 반복적인 작업을 처리함으로써 사람들이 전략적이고 창의적인 업무에 집중할 수 있게 하는 것입니다. Invoice Shield는 작고, 다듬어지지 않았으며, 실험적인 것이지만, 그 영역을 엿볼 수 있게 해줍니다. 이는 AI가 단순한 질문‑답변 도구가 아니라 협업 팀원으로서 작동할 때 효과적일 수 있음을 보여줍니다.

Code

전체 시스템은 여기에서 확인하실 수 있습니다: https://github.com/MilindGarge07/InvoiceShield

작은 AI 에이전트가 재무팀처럼 일할 수 있을까? 직접 해봤다.

인보이스 실드 개발

지루한 재무 작업에서 AI 워크플로우 만들기

인보이스 실드의 실제 기능

에이전트를 선택하는 이유 (하나의 큰 모델 대신)

가장 흥미로운 부분: 루프 학습하기

내가 이것을 만들면서 배운 점

결과: 점수 이상의 의미

다음에 올 것

왜 이것이 중요한가

Code

관련 글

생산을 위한 효율적인 컨텍스트 인식 멀티에이전트 프레임워크 설계

AI 에이전트에 대한 나의 5일간의 여정 🚀

공유 의미 루트를 통한 안정적인 AI 생태계 구축

🚀 5일 AI Agents 인텐시브 (Google x Kaggle)에서 얻은 핵심 배움