스마트 멀티모달 인보이스 및 경비 분석기

발행: (2025년 12월 8일 오전 06:40 GMT+9)
2 min read
원문: Dev.to

Source: Dev.to

Cover image for Smart Multimodal Invoice & Expense Analyzer

Description

이 웹 앱은 Google Gemini 2.5 멀티모달 기능을 활용하여 이미지, 비디오 또는 오디오 녹음에서 청구서, 영수증 및 비용 기록을 분석합니다. 구조화된 데이터를 추출하고, 비용을 분류하며, 이상 징후를 감지하고, 사용자에게 인터랙티브한 보고서를 생성합니다.

Features

  • 영수증/청구서의 이미지, 비디오, 오디오 업로드
  • 자동 추출: 공급업체, 날짜, 항목, 총액, 세금, 통화
  • 비용 분류: 개인, 비즈니스, 세금 관련
  • 이상 감지: 중복, 누락 데이터, 잘못된 총액
  • 인터랙티브 요약 및 보고서 생성

Technology Stack

  • Google AI Studio (Gemini 2.5 Flash/Pro)
  • 배포: Cloud Run
  • 프론트엔드: HTML + JavaScript
  • 백엔드: Python Flask

How to Use

  1. 청구서, 영수증 또는 비용 비디오/오디오를 업로드합니다.
  2. AI가 파싱하여 구조화된 데이터를 표시합니다.
  3. 분류된 요약 및 이상 감지를 확인합니다.
  4. 보고서를 다운로드하거나 공유합니다.

Demo Video

[Insert YouTube or video link showing the app in action]

GitHub Repository

[Insert link to your code]

Back to Blog

관련 글

더 보기 »