Nemotron Labs: AI 에이전트가 문서를 실시간 비즈니스 인텔리전스로 전환하는 방법
Source: NVIDIA AI Blog
Editor’s note: 이 게시물은 Nemotron Labs 블로그 시리즈의 일부로, 최신 오픈 모델, 데이터셋 및 학습 기법이 기업이 NVIDIA 플랫폼에서 특화된 AI 시스템 및 애플리케이션을 구축하도록 돕는 방식을 탐구합니다. 각 게시물은 투명한 연구 코파일럿부터 확장 가능한 AI 에이전트에 이르기까지, 오픈 스택을 활용해 프로덕션에서 가치를 제공하는 실용적인 방법을 강조합니다.
인텔리전트 문서 처리란 무엇인가?
Intelligent document processing (IDP) is an AI‑powered workflow that automatically reads, understands, and extracts insights from documents. It interprets rich formats—including tables, charts, images, and text—using:
These techniques turn multimodal content into insights that other multi‑agent systems and people can easily use.
왜 NVIDIA Nemotron인가?
NVIDIA Nemotron 오픈 모델과 GPU 가속 라이브러리를 활용하면 조직은 다음과 같은 분야에서 AI 기반 문서 인텔리전스 시스템을 구축할 수 있습니다:
- 연구
- 금융 서비스
- 법률 워크플로우
- 그리고 많은 기타 도메인
이러한 오픈 모델, 데이터셋 및 학습 레시피는 다음과 같은 리더보드에서 강력한 결과를 달성했습니다:
팀은 검색 및 질문 답변과 같은 작업에 가장 적합한 모델을 선택할 수 있습니다.
문서 처리로 비즈니스 인텔리전스 효율화
복잡한 레이아웃에서 의미를 추출하고, 방대한 파일 라이브러리를 확장하며, 답변이 정확히 어디서 유래했는지 pinpoint 할 수 있는 문서‑인텔리전스 시스템은 고위험 환경에서 매우 귀중합니다. 이러한 시스템은:
- 풍부한 문서 내용 이해 – 단순 텍스트 스크래핑을 넘어 차트, 표, 그림 및 다국어 페이지에서 정보를 캡처합니다. 인간이 문서를 읽는 방식처럼 구조, 관계, 컨텍스트를 인식합니다.
- 대규모·변동 데이터 세트 처리 – 방대한 문서 컬렉션을 병렬로 수집·처리하여 지식 베이스를 지속적으로 최신 상태로 유지합니다.
- 사용자가 정확히 필요로 하는 것 찾기 – AI 에이전트가 쿼리에 가장 관련성 높은 구절, 표, 혹은 단락을 찾아내어 정밀하고 정확한 응답을 제공하도록 돕습니다.
- 답변 뒤의 근거 제시 – 특정 페이지나 차트에 대한 인용을 제공하여 팀에 투명성과 감사 가능성을 부여합니다. 이는 규제 산업에서 특히 중요합니다.

그 결과는 정적 문서 아카이브에서 실시간 지식 시스템으로의 전환이며, 이는 비즈니스 인텔리전스, 고객 경험 및 운영 워크플로우를 직접적으로 구동합니다.
Source: https://www.nvidia.com/en-us/use-cases/intelligent-document-processing/
작업 현장의 문서 인텔리전스
Intelligent document processing 시스템은 NVIDIA Nemotron RAG 모델, Nemotron Parse 및 가속 컴퓨팅을 기반으로 하여 산업 전반에 걸친 조직이 문서에서 인사이트를 얻는 방식을 재구성하고 있습니다.
Justt – AI‑네이티브 청구 취소 관리 및 분쟁 최적화
금융 서비스 분야에서 결제 분쟁은 매출 손실과 운영 복잡성을 크게 초래합니다. 필요한 증거가 비정형 형식에 존재하기 때문입니다. 거래 로그, 고객 커뮤니케이션, 정책 문서는 시스템 전반에 걸쳐 파편화되어 있어 분쟁 처리가 느리고 수동적이며 비용이 많이 듭니다.
솔루션
- AI‑구동 플랫폼으로 전체 청구 취소 라이프사이클을 대규모로 자동화합니다.
- 결제 서비스 제공업체 및 가맹점 데이터 소스와 직접 연결해 거래 데이터, 고객 상호작용 및 정책을 수집합니다.
- 카드 네트워크와 발급사 요구사항에 맞는 분쟁‑전용 증거를 자동으로 조합합니다.
핵심 기능
- 분쟁 최적화(Nemotron Parse 기반)는 예측 분석을 활용해 어떤 청구 취소를 싸울지, 받아들일지를 결정하고, 최대 순회복을 위한 응답을 설계합니다.
- 실제 효과: HEI Hotels & Resorts와 같은 환대 사업자는 여러 지점에서 분쟁 처리를 자동화해 매출을 회복하면서 고객 관계를 유지하고 있습니다.
비즈니스 결과
- 가맹점은 부당 청구 취소로 인한 매출 손실을 크게 회복합니다.
- 수동 검토 작업이 크게 감소합니다.
DocuSign – 계약 인텔리전스 확장
DocuSign은 전 세계적인 인텔리전트 계약 관리 리더로, 매일 수백만 건의 거래를 처리하며 1.8 백만 고객과 10 억 사용자에게 서비스를 제공합니다.
도전 과제
계약서에는 중요한 정보가 PDF 여러 페이지에 숨겨져 있습니다. 이러한 데이터를 추출하려면 복잡한 문서에서 표, 텍스트 및 메타데이터를 고정밀로 추출해야 했습니다.
솔루션
- 대규모 계약 이해를 위해 Nemotron Parse를 평가합니다.
- NVIDIA GPU에서 실행되는 이 모델은 고급 AI와 레이아웃 감지, OCR을 결합합니다.
- 복잡한 표를 신뢰성 있게 해석하고 필요한 정보를 재구성해 수동 수정 작업을 줄입니다.
영향
- 계약 저장소를 구조화된 데이터로 전환해 계약 검색, 분석 및 AI‑구동 워크플로우를 지원합니다.
- 계약을 비즈니스 자산으로 전환해 가시성을 높이고 위험을 감소시키며 의사결정을 가속화합니다.
Edison Scientific – 방대한 문헌 규모의 연구
Edison Scientific의 Kosmos AI Scientist는 연구자가 복잡한 과학적 환경을 탐색하고, 문헌을 종합하며, 연결 고리를 식별하고, 근거를 제시하도록 돕습니다.
문제점
대량의 PDF에서 구조화된 정보(수식, 표, 그림)를 추출하는 것은 기존 파서에겐 오류가 잦습니다.
솔루션
- NVIDIA Nemotron Parse를 PaperQA2 파이프라인에 통합했습니다.
- 연구 논문을 분해하고 핵심 개념을 색인화하며, 응답을 특정 구절에 근거하도록 합니다.
혜택
- 과학자의 처리량과 답변 품질을 향상시킵니다.
- 방대한 연구 코퍼스를 인터랙티브하고 질의 가능한 지식 엔진으로 전환해 가설 생성 및 문헌 검토를 가속화합니다.
- 높은 효율성으로 대규모 서비스 제공이 비용 효율적으로 가능해져 멀티모달 파이프라인 전체를 활용할 수 있게 됩니다.
세 가지 사례 모두 Nemotron Parse와 NVIDIA의 가속 AI 스택이 비정형 문서를 실행 가능한 구조화된 인텔리전스로 전환하여 금융, 법률 및 과학 분야 전반에 걸쳐 측정 가능한 비즈니스 가치를 제공한다는 점을 보여줍니다.
NVIDIA 기술을 활용한 지능형 문서 처리 애플리케이션 설계
강력하고 도메인 특화된 문서 인텔리전스 파이프라인은 데이터를 추출, 임베드, 재랭크, 파싱할 수 있는 구성 요소가 필요하며, 이를 안전하고 규정 준수하게 유지해야 합니다.
| 단계 | NVIDIA 솔루션 | 수행 역할 |
|---|---|---|
| Extraction | Nemotron extraction & OCR models | 멀티모달 PDF, 텍스트, 표, 그래프 및 이미지를 수집하고, 레이아웃과 의미를 보존하면서 구조화된 기계 판독 가능한 콘텐츠로 변환합니다. |
| Embedding | Nemotron embedding models | 패시지, 엔터티 및 시각 요소를 문서 검색에 최적화된 벡터 표현(임베딩)으로 변환하여 의미적으로 정확한 검색을 가능하게 합니다. |
| Reranking | Nemotron reranking models | 후보 패시지를 평가하여 가장 관련성 높은 콘텐츠를 대형 언어 모델(LLM)의 컨텍스트로 제공함으로써 답변 정확성을 높이고 환각을 감소시킵니다. |
| Parsing | Nemotron Parse models | 문서 의미를 해석하고, 정확한 공간 기반과 올바른 읽기 흐름으로 텍스트와 표를 추출하여 비구조화된 문서를 실행 가능한 데이터로 변환합니다. |
이러한 기능은 NVIDIA NIM 마이크로서비스와 기반 모델 형태로 제공되며, NVIDIA GPU에서 효율적으로 실행되어 팀이 개념 증명 단계에서 프로덕션까지 확장할 수 있게 하면서 민감한 데이터를 선택한 클라우드 또는 온프레미스 환경 내에 유지합니다.
혼합 모델 접근 방식이 효과적인 이유
- Frontier + 오픈소스: 최첨단 독점 모델과 오픈소스 Nemotron 모델을 결합합니다.
- LLM 라우터: 지능형 라우터가 각 요청을 평가하고 자동으로 가장 적합한 모델을 선택하여 성능, 비용 및 효율성을 균형 있게 유지합니다.
이 아키텍처를 활용하면 조직은 확장 가능하고 안전하며 비용 효율적인 문서 인텔리전스 파이프라인을 구축할 수 있으며, 하위 LLM 기반 애플리케이션에 고품질 결과를 제공할 수 있습니다.
Source:
NVIDIA Nemotron 시작하기
- **문서 처리 파이프라인 구축 방법**에 대한 단계별 튜토리얼을 확인하고 RAG 기능을 활용해 보세요.
- Nemotron RAG가 **산업별 특화 에이전트**에 어떻게 적용될 수 있는지 살펴보세요.
- Nemotron RAG 모델과 NVIDIA NeMo Retriever 오픈 라이브러리를 실험해 보세요. 이용 가능한 위치:
- Hugging Face에서 Nemotron Parse 사용해 보기.
NVIDIA Blueprint for Enterprise RAG에 참여하기
**NVIDIA Blueprint for Enterprise RAG**와 함께 구축해 보세요—수십 개의 업계 선도 **AI 데이터 플랫폼 제공업체**가 신뢰하고 현재 다음에서 이용 가능합니다:
최신 소식 받아보기
- NVIDIA AI 뉴스 구독
- NVIDIA 개발자 커뮤니티 참여
- NVIDIA AI를 팔로우하세요:
더 알아보기
**YouTube 재생목록**에서 셀프 페이스 비디오 튜토리얼 및 라이브스트림을 확인하세요.