# 智能多模态发票与费用分析器

发布: (2025年12月8日 GMT+8 05:40)
2 min read
原文: Dev.to

Source: Dev.to

Cover image for Smart Multimodal Invoice & Expense Analyzer

描述

此 Web 应用利用 Google Gemini 2.5 多模态能力,对来自图像、视频或音频录制的发票、收据和费用记录进行分析。它提取结构化数据、对费用进行分类、检测异常,并为用户生成交互式报告。

功能

  • 上传收据/发票的图像、视频或音频
  • 自动提取:供应商、日期、项目、总额、税费、货币
  • 费用分类:个人、商务、税务相关
  • 异常检测:重复、缺失数据、错误的总额
  • 生成交互式摘要和报告

技术栈

  • Google AI Studio(Gemini 2.5 Flash/Pro)
  • Cloud Run 部署
  • 前端:HTML + JavaScript
  • 后端:Python Flask

使用方法

  1. 上传您的发票、收据或费用视频/音频。
  2. AI 解析并显示结构化数据。
  3. 查看分类摘要和异常检测结果。
  4. 下载或分享报告。

演示视频

[Insert YouTube or video link showing the app in action]

GitHub 仓库

[Insert link to your code]

Back to Blog

相关文章

阅读更多 »