Gradient Labs는 모든 은행 고객에게 AI account manager를 제공합니다.
Source: OpenAI Blog
은행 업무에서 고객 문제를 해결하는 일은 드물게 단순합니다. 사기나 결제 차단과 같은 사례는 여러 팀에 걸친 복잡한 절차를 엄격히 준수해야 합니다. 시스템이 부족하면 고객은 팀 간에 넘겨지고, 대기열에 머무르며, 가장 중요한 순간에 지연을 겪게 됩니다.
Gradient Labs™ (opens in a new window)는 이러한 복잡성을 처리하도록 설계되었습니다. 런던에 기반을 둔 이 회사는 모든 은행 고객에게 전담 계정 관리자를 둔 것 같은 경험을 제공하는 AI 에이전트를 구축하고 있습니다. 이전에 Monzo에서 AI 및 데이터 업무를 이끌었던 팀이 설립했으며, 이 회사의 플랫폼은 OpenAI 모델을 기반으로 하며 현재 GPT‑5.4 mini와 nano로 프로덕션 트래픽을 전환하고 있습니다.
“우리는 GPT‑5.4 mini와 nano에서 500밀리초 지연 시간을 보고 있는데, 이는 자연스러운 음성 대화에 정확히 필요한 수준입니다.”라고 Gradient Labs의 공동 설립자이자 최고 과학자인 Danai Antoniou가 말합니다. “우리는 작업량의 상당 부분을 이전하고 있습니다.”
“우리는 동시에 세 가지가 필요했습니다: 명령 수행 정확도, 낮은 환각 비율, 그리고 기능 호출 신뢰성, 모두 음성 지연 제한 하에서. OpenAI만이 이 세 가지 모두를 만족시켰습니다.”
— Danai Antoniou, Gradient Labs 공동 설립자 및 최고 과학자
은행 상호작용 작동 방식
은행에서는 고객 상호작용이 **표준 운영 절차 (SOPs)**에 의해 관리되며, 각 단계에서 무엇을 해야 하는지 정의합니다. 일반적인 상호작용은 다음과 같습니다:
- 고객이 도난당한 카드를 신고하기 위해 전화합니다.
- 시스템이 실시간으로 신원을 확인하고, 수정 및 중단을 처리합니다.
- 확인이 완료되면 카드를 정지하고 교체 절차를 시작합니다.
- 후속 질문(예: 배송 시기)에 답변하고 다음 단계를 제안합니다.
각 단계는 정의된 절차를 따르며, 사용자 입력, 상황, 실행 중인 가드레일, 그리고 고객과 상담원의 응답을 기반으로 실시간으로 결정을 내려 규정 준수를 보장합니다.
“모델은 중단, 백채널, 주제 전환 전반에 걸쳐 절차 상태를 유지하면서도 응답 생성 속도를 빠르게 유지해야 한다”고 Antoniou는 말한다. “대부분의 제공업체는 이조차 시도조차 할 수 없었다.”
Source: …
궤적 정확도
Gradient Labs는 가장 까다로운 절차에서 제공업체를 벤치마크하고 궤적 정확도—시스템이 시작부터 끝까지 올바른 경로를 따르는지를 평가합니다.
- 초기 평가 중 하나에서 GPT‑4.1만이 97 % 궤적 정확도와 일관성을 달성했습니다.
- 그 다음으로 근접한 제공업체는 **88 %**에 머물렀습니다.
“금융 서비스에서는 이것이 전화를 해결하는 것과 컴플라이언스 사고를 일으키는 것 사이의 차이입니다,”라고 Antoniou는 덧붙였습니다.
이 결과는 Gradient Labs의 시스템 설계에 영향을 주었습니다. 팀은 하이브리드 아키텍처를 구축했으며, 이는 다음을 포함합니다:
- 추론이 많이 필요한 단계에 OpenAI 모델을 사용합니다.
- 더 빠르고 결정적인 작업에는 작은 모델을 배포합니다.
- 복잡도와 지연 제한에 따라 요청을 적응적으로 라우팅합니다.
내부적으로 시스템은 중앙 추론 에이전트에 의해 조정되는 전문화된 스킬들로 구성되어, 복잡한 사례가 컨텍스트를 잃지 않고 워크플로를 가로질러 이동할 수 있게 합니다. 모든 상호작용마다 15개 이상의 가드레일 시스템이 병렬로 실행되어 대화가 정의된 절차와 컴플라이언스 경계 내에 머물도록 합니다(예: 금융 조언 감지, 취약점 신호, 불만 처리, 인증 우회 시도, 민감 데이터 접근 등).
안전‑우선 평가
금융 기관은 이런 시스템을 믿음만으로 배포하지 않습니다. 실제 환경에서 AI가 올바르게 동작한다는 단계별 증거가 필요합니다.
- 재생 테스트: 실제 고객 대화를 재생하고 예상 절차와 비교합니다.
- 합성 테스트: 배포 전 실패 모드를 탐색하기 위해 엣지 케이스 및 희귀 시나리오 대화를 생성합니다.
Gradient Labs는 팀이 시스템 도입 방식을 제어할 수 있도록 합니다:
- 과거 지원 데이터를 분석하여 은행이 처리하는 이슈 유형과 빈도를 파악합니다.
- 팀은 AI가 처리할 카테고리를 선택하며, 낮은 위험도의 워크플로우부터 시작해 점차 확대합니다.
UI 미리보기

배포 및 영향
실제 서비스 시작 전에, 고객은 시뮬레이션 대화를 통해 다양한 시나리오에서 시스템 응답을 검토하여 기대대로 동작하는지 확인할 수 있습니다. 배포는 일반적으로 전체 트래픽의 작은 비율에서 시작되며, 지속적인 모니터링과 자동화된 검사를 통해 인간 검토가 필요할 수 있는 대화를 표시합니다. 시간이 지나면서 시스템이 일관된 성능을 입증함에 따라 적용 범위가 확대됩니다.
- CSAT 점수가 **98 %**에 달하며, 때때로 최고의 인간 상담원을 능가합니다.
- 해결률이 첫날에 **50 %**를 초과하며, 분쟁, 계정 인증, 사기와 같은 복잡한 워크플로우에서도 마찬가지입니다.
이러한 결과는 급속한 성장을 촉진했습니다: Gradient Labs는 지난 1년 동안 수익을 10배 이상 증가시켰으며, 인바운드 지원에서 아웃바운드 및 백오피스 프로세스로 확장했습니다.
앞으로의 전망
Gradient Labs는 상호작용 간에 컨텍스트를 전달할 수 있는 시스템에 집중하고 있습니다—고객의 이력을 이해하고, 진행 중인 문제를 추적하며, 이전 대화가 끝난 지점부터 이어가는 것 말이죠. 이 방향은 OpenAI와의 장기 파트너십과도 일치합니다.
“우리는 오늘을 위한 모델만 선택하는 것이 아닙니다. 우리 제품과 같은 방향으로 추론 모델의 궤적이 진행되는 것을 보고 있는 플랫폼 위에 구축하고 있습니다.”
— Danai Antoniou, 공동 설립자 겸 Gradient Labs 수석 과학자
모델이 계속 개선됨에 따라 안전하게 자동화할 수 있는 절차의 범위도 확대됩니다. Gradient Labs에게 이는 모든 고객 상호작용이 인간이 주도하는 경험과 동일한 일관성, 판단력, 연속성을 갖춘 시스템에 점점 더 가까워진다는 의미입니다.
최고 수준의 인간 에이전트.