# 智能多模态发票与费用分析器
发布: (2025年12月8日 GMT+8 05:40)
2 min read
原文: Dev.to
Source: Dev.to

描述
此 Web 应用利用 Google Gemini 2.5 多模态能力,对来自图像、视频或音频录制的发票、收据和费用记录进行分析。它提取结构化数据、对费用进行分类、检测异常,并为用户生成交互式报告。
功能
- 上传收据/发票的图像、视频或音频
- 自动提取:供应商、日期、项目、总额、税费、货币
- 费用分类:个人、商务、税务相关
- 异常检测:重复、缺失数据、错误的总额
- 生成交互式摘要和报告
技术栈
- Google AI Studio(Gemini 2.5 Flash/Pro)
- Cloud Run 部署
- 前端:HTML + JavaScript
- 后端:Python Flask
使用方法
- 上传您的发票、收据或费用视频/音频。
- AI 解析并显示结构化数据。
- 查看分类摘要和异常检测结果。
- 下载或分享报告。
演示视频
[Insert YouTube or video link showing the app in action]
GitHub 仓库
[Insert link to your code]