AI 에이전트 스타트업, Anthropic 대신 DeepSeek으로 전환… 수백만 달러 절감

발행: 3일 전 (2026년 6월 10일 AM 01:17 GMT+9)

9 분 소요

출처: The New Stack

지속 가능한 AI 배포의 가장 큰 장애물은 추론 비용으로 떠올랐습니다. GitHub은 최근에 고정 요금제 Copilot 구독을 사용량 기반 청구로 전환했는데, 에이전트 기반 코딩 세션이 비용을 고정 월 요금이 감당할 수 있는 수준을 넘어섰기 때문입니다 — 일부 구독자는 이전보다 몇 배 높은 청구서를 받게 되었습니다. 한편 Uber는 2026년 전체 AI 예산을 단 4개월 만에 소진했으며, 대부분이 Claude Code에 사용돼 COO가 투자 대비 수익이 충분했는지 의문을 제기하고 있습니다.

이러한 광범위한 재평가에 대응해, Linux Foundation은 Tokenomics Foundation을 출범시켰습니다 — Google, Microsoft, IBM, Salesforce 등 다수 기업이 지원하며, AI 토큰 비용에 대한 개방형 표준을 구축하고 기업이 현재 비용을 측정하거나 통제할 일관된 방법이 없다는 점을 인정하는 움직임입니다.

스위치를 전환하다

대량으로 AI 에이전트를 운영하는 기업에게는 최첨단 모델의 경제성이 거의 존재론적 질문이 되었습니다.

Flo Crivello는 Uber에서 엔지니어와 제품 리더를 역임했으며, 현재는 일상 업무(이메일 분류, 회의 일정 잡기, CRM 관리 등)를 자동화하는 무코드 AI 에이전트 플랫폼 Lindy의 설립자 겸 CEO입니다. Crivello는 2023년에 Teamflow(가상 사무실 스타트업)에서 $52 million(5,200만 달러)을 모금한 뒤 전환점으로 Lindy를 설립했으며, 현재 그 자본이 Lindy의 개발을 지원하고 있습니다.

Lindy Lindy

Crivello는 지난 주 소셜 미디어에 Lindy가 전체 모델 인프라를 Anthropic에서 DeepSeek으로 전환했다는 소식을 발표했습니다.

“수백만 달러를 절감했으며, 핵심 사용 사례 대부분에서 성능이 오히려 상승했습니다.”
“오늘 트리거를 잡아 Lindy 트래픽 100 %를 DeepSeek v4로 전환했으며, Anthropic 모델을 차단했습니다.” Crivello는 X에 이렇게 적었습니다. “수백만 달러를 절감했으며, 핵심 사용 사례 대부분에서 성능이 상승했습니다. 비즈니스에 변혁을 가져옵니다.”

실제로 Crivello는 몇 달 전부터 그 의도를 암시했으며, 4월에 X에 “추론이 Lindy의 가장 큰 비용이며 급여를 초과한다”고 밝히고, 오픈소스 모델이 ‘아직은 멀었다’에서 ‘대부분의 사용 사례에 대해 최첨단 수준’으로 1년 만에 변했다고 전했습니다. 당시 그는 Lindy가 중국 AI 기업 Moonshot AI의 모델인 Kimi K2.5를 기본 모델로 채택하려다 베이징 기반 연구소 Zhipu AI의 GLM‑5.1으로 방향을 바꾼 적이 있다고 설명했습니다.

결국 회사는 중국 AI 연구 기업 DeepSeek의 대표 오픈소스 모델인 DeepSeek v4를 선택했습니다.

물론, 전체 프로덕션 규모에서 한 모델 공급자를 다른 공급자로 교체하는 일은 결코 사소한 작업이 아닙니다. Crivello는 The New Stack에 전환 완료 시점은 언제부터 계산하느냐에 따라 달라진다고 말했지만, 어쨌든 큰 과제였다고 전했습니다.

“우리는 69개월 동안 이 전환을 검토하고 새로운 OSS 모델을 평가해 왔습니다.”
“우리는 69개월 동안 이 전환을 검토하고 새로운 OSS 모델을 평가해 왔으며, DeepSeek는 출시된 지 약 2개월 전부터 살펴봤습니다.”라고 Crivello는 설명했습니다.

특히, 마이그레이션은 Crivello가 처음 예상한 것보다 훨씬 더 많은 작업을 요구했습니다 — “우리가 생각한 것보다 100배 더 많은 작업”이라고 그는 말했습니다. 평가, 즉 새로운 모델을 실제 업무에 적용해 Anthropic 모델이 제공하던 수준을 맞추거나 능가하는지를 체계적으로 검증하는 과정이 큰 비중을 차지했습니다.

Flo Crivello, Lindy 설립자 겸 CEO

“모델을 평가하기 위해 온라인 평가, 오프라인 평가, 그리고 수많은 ‘감성 평가’를 진행했습니다.” Crivello는 “그 후 온라인 평가와 유지율에 미치는 영향을 살펴보며 점진적으로 롤아웃했고, 새로운 모델에 맞게 프롬프트를 조정했습니다.”라고 덧붙였습니다.

비용 절감만으로는 정당화하기 어려운 노력였지만, 성능 결과가 Crivello에게 큰 확신을 주었습니다. 특히 이메일 인박스 분류와 사용자의 어조에 맞춰 답변 초안을 작성하는 핵심 사용 사례에서 그렇습니다.

“바로 그 부분에서 DeepSeek이 놀라운 성능 향상을 보여줬습니다.”라고 Crivello는 설명했으며, DeepSeek이 일부 복잡한 자동화 작업에서는 아직 Anthropic보다 뒤처진다고 덧붙였습니다.
“‘워크플로 자동화’에서는 아직 Sonnet보다 못하지만, 우리에게는 부차적인 영역입니다.”라고 그는 말했습니다.

DeepSeek 순간

Lindy의 전환이 왜 중요한지 이해하려면, DeepSeek이 AI 산업에서 어떤 의미를 갖게 되었는지 살펴볼 필요가 있습니다.

DeepSeek은 1월에 R1 모델이 미국 최첨단 모델들의 성능을 비용의 극히 일부로 매치하면서 실리콘밸리에 큰 충격을 주었습니다. 이는 투자자들이 AI의 컴퓨팅 요구량에 대한 기존 가정을 의심하게 만들며 Nvidia 주가가 일시적으로 급락하는 결과를 낳았습니다. 이후 DeepSeek은 지속적인 모델 출시를 통해 최첨단 영역과의 격차를 점점 좁혀 왔습니다.

2026년 4월에 프리뷰 형태로 공개된 DeepSeek V4는 가격 면뿐 아니라 또 다른 변화를 의미했습니다. 스위스 EPFL 교수이자 EPFL

AI 에이전트 스타트업, Anthropic 대신 DeepSeek으로 전환… 수백만 달러 절감

스위치를 전환하다

DeepSeek 순간

관련 글

‘인터넷에서 무작위로 가져오지 마세요’: 체인가드가 52,000개 오픈소스 패키지에서 발견한 내용

AI가 모든 것을 뒤흔든다: 이제 신입 기술 직업은 어디로 가는가?

‘수동 모델이 깨진다’: 에이전트가 운영 데이터에 쓰면 어떻게 될까

스택 트레이스를 넘어서: AI가 새로운 디버깅 패러다임을 요구하는 이유