我的实际 AI Stack 用于 2026 年构建应用 — 全部免费
发布: (2026年5月3日 GMT+8 23:02)
2 分钟阅读
原文: Dev.to
Source: Dev.to
介绍
如果这篇文章对你有帮助,请点一个 ❤️,帮助其他人发现它。
我在过去一年里发布了 7 款 Mac 应用,所有 AI 功能都使用免费工具。下面是我实际使用的完整技术栈、选择每个组件的原因以及其局限性。
Gemini 2.5 Flash 预览(REST API)
费用: 免费层 — 每天 500 次请求,无需信用卡
适用场景: 日志诊断、文档分析、文本分类,或任何需要强大推理的任务。
免费层对间歇性使用 AI 的开发者工具来说真的足够了;在正常使用中我从未触及每日上限。
获取密钥: (约 2 分钟)。
本地运行开源大语言模型(LLM)
费用: 免费,开源
适用场景: 隐私敏感处理、离线使用、大批量任务。
安装
brew install ollama
拉取模型
ollama pull gemma2
运行
ollama run gemma2
我实际使用的模型
| 模型 | 优势 | 典型内存需求 |
|---|---|---|
gemma2 | 良好的通用推理能力 | 8 GB |
qwen2.5-coder:1.5b | 快速代码自动补全,体积小 | — |