无状态 AI 应用背后的架构

发布: 2个月前 (2025年12月2日 GMT+8 07:39)

6 分钟阅读

Source: Dev.to

项目一开始就做了一个看似冒险的决定：没有后端数据库。
当时并不需要持久化用户数据——获取用户的响应是首要任务。大多数教程假设你会把账户、会话和数据存储在 PostgreSQL、MongoDB、DynamoDB 等数据库中，但这个应用根本不需要在设备之间持久化任何内容。

三层拆分

架构图

每一层只做一件事。混合职责（例如在后端存储历史记录或直接在前端调用 LLM）会增加不必要的复杂度。

数据流图

扫描流程可能包含五个潜在步骤：

传统的编号步骤会变得模糊，因为第 4 步的出现取决于运行时条件（单图还是多图）。

解决方案： 使用带有有意义状态名称的状态机（part、crop、media、mode、context、analyzing）。UI 根据当前状态渲染，进度指示器动态计算，保持用户体验的准确性，而无需硬编码步骤编号。

状态机问题示意图

存储层级图

深度缓存会增加存储体积，但实现了真正的离线访问——这对农村用户至关重要。一次典型扫描约 20–30 KB；最多约 50 次扫描总计约 1.5 MB，远低于浏览器 5 MB 的配额。旧的扫描会自动轮换出去。

后端仅暴露一个 API 端点：

POST /api/v1/analyze

单端点示意图

所有分析模式（单图、批量、视频）都通过 mode 参数来处理，该参数会调整提示词构造和响应处理。这避免了：

单一、文档完善的端点更易于测试和维护。

API 密钥 UI

权衡在于摩擦——用户必须先创建 Anthropic 账户并生成 API 密钥才能使用应用。这对技术受众来说可以接受，但若面向大众市场则需要重新考虑。

当上传多张图像时，系统必须判断它们是 不同植物（分别分析）还是 同一植物的不同角度（一起分析）。

（关于此决策逻辑实现的更多细节请参见原文。）