Gemini API 与本地 LLM 用于开发者工具 — 何时使用哪一个

发布: 2天前 (2026年5月3日 GMT+8 00:24)

4 分钟阅读

原文: Dev.to

Source: Dev.to

概览

所有测试均在一台 8 年旧的 MacBook Air 上进行。
我使用 Gemini API 和本地 LLM（通过 Ollama）构建了开发者工具。以下是两者在实际交付后的诚实对比。

数据不敏感且推理质量重于隐私的开发者工具。

处理敏感数据且隐私不可妥协的工具。

问题	推荐方案
数据是否包含敏感信息？	是 → 本地 LLM（或在使用 Gemini 前进行严格的 PII 过滤）否 → Gemini API
推理质量是否比速度更重要？	是 → Gemini（尤其是“思考”模型）否 → 本地 LLM（更快、更便宜）
用户是否接受安装 Ollama？	是 → 本地 LLM 可行否 → 仅使用 Gemini API

当前实现： Gemini API —— 利用对 Android 的深度了解进行 logcat 分析。思考模型能够追踪本地 7B 模型遗漏的因果链。可能存在一些 PII，但隐私过滤器可减轻最严重的情况。
未来路线图： 让用户在 Gemini 与本地模型之间切换，以适应敏感项目。架构已为此切换做好准备，但尚未发布。