스마트 멀티모달 인보이스 및 경비 분석기
발행: (2025년 12월 8일 오전 06:40 GMT+9)
2 min read
원문: Dev.to
Source: Dev.to

Description
이 웹 앱은 Google Gemini 2.5 멀티모달 기능을 활용하여 이미지, 비디오 또는 오디오 녹음에서 청구서, 영수증 및 비용 기록을 분석합니다. 구조화된 데이터를 추출하고, 비용을 분류하며, 이상 징후를 감지하고, 사용자에게 인터랙티브한 보고서를 생성합니다.
Features
- 영수증/청구서의 이미지, 비디오, 오디오 업로드
- 자동 추출: 공급업체, 날짜, 항목, 총액, 세금, 통화
- 비용 분류: 개인, 비즈니스, 세금 관련
- 이상 감지: 중복, 누락 데이터, 잘못된 총액
- 인터랙티브 요약 및 보고서 생성
Technology Stack
- Google AI Studio (Gemini 2.5 Flash/Pro)
- 배포: Cloud Run
- 프론트엔드: HTML + JavaScript
- 백엔드: Python Flask
How to Use
- 청구서, 영수증 또는 비용 비디오/오디오를 업로드합니다.
- AI가 파싱하여 구조화된 데이터를 표시합니다.
- 분류된 요약 및 이상 감지를 확인합니다.
- 보고서를 다운로드하거나 공유합니다.
Demo Video
[Insert YouTube or video link showing the app in action]
GitHub Repository
[Insert link to your code]