我厌倦了 Reddit 的 API 定价,于是我构建了一个本地爬虫(且免费)
Source: Dev.to
还记得 2023 年 Reddit 通过 API 定价变动把第三方应用砍掉的事吗?是的,那真是糟心事。
快进到 2025 年,我仍然感同身受。我是一个独立开发者,想在 Reddit 上为我的 SaaS 找到早期用户。官方 API 的费用是 每 1,000 次请求 $0.24,听起来很便宜,直到你意识到抓取 300 条帖子就需要 300+ 次 API 调用。每天做几次的话,仅基础数据访问就要 每月 $50–100。
“聪明”的做法是什么?付费使用像 Brand24 或 Hootsuite 这样的 SaaS 工具。它们的费用是 每月 $49–99,而且使用共享的云 IP,Reddit 的机器人检测系统很容易把它们标记为违规。
我陷入的循环
- 手动滚动 → 疲惫
- 云工具 → 账号被封
- 官方 API → 昂贵
于是我在一个周末怒砍代码,搞出了一个解决方案。
“本地优先”方案
我打造了 Reddit Toolbox —— 一个免费桌面应用,运行在你的机器上(Windows / Mac)。
核心洞察: 只要看起来像普通用户,Reddit 就不会封禁你。云爬虫使用数据中心 IP,容易被检测。你的家庭 Wi‑Fi 呢?完全没问题。把爬虫本地运行,就能规避 SaaS 费用和封禁风险。
功能
1. 无 API 的批量抓取
输入 subreddit 名称,点击 “scrape”,几秒钟即可抓取 300+ 条帖子。无需 API 密钥。没有配额。仅仅是原始 HTML 解析。
2. “低竞争”过滤器
设置 “最大评论数: 5”,即可立刻看到 OP 提出问题但还没人回答的帖子。非常适合营销——你的回复真的会被看到。
3. 用户提取
从这些帖子中,工具会抓取最活跃的用户、他们的 karma、账号年龄以及他们常去的其他 subreddit。帮助你在私信任何人之前先对受众进行画像。
4. Google 索引检查器
回复前,复制帖子标题并搜索 site:reddit.com "thread title"。如果还没被 Google 收录,就跳过——没有搜索流量的帖子没必要评论。
5. AI 辅助回复
如果你懒得动手,可以使用自己的 OpenAI/Claude API 密钥让它生成回复草稿。你仍然可以编辑输出,但总比面对空白文本框要好。
整个过程在本地运行,Reddit 看到的是家庭 IP 按正常人类速度发出的请求。自从我改用本地方式后零封禁。
定价 – 免费层 & 高级版
- 免费层: 每天 15 次抓取 —— 对大多数用户足够。
- 高级版: $9 /月,提供无限抓取 + CSV 导出。
我为自己做的工具,现在免费分享给所有厌倦 “一切都要订阅” 模式的人。
获取地址:https://www.wappkit.com/reddit-toolbox
“本地优先”运动
这个项目让我意识到,我在云工具上花了太多冤枉钱,而这些完全可以在本地运行。
| 云工具 | 本地替代方案 |
|---|---|
| Notion($10/月) | Obsidian(免费,本地 markdown) |
| Airtable($20/月) | SQLite(仅一个文件) |
| Brand24($99/月) | Reddit Toolbox(免费) |
我并不是说云工具不好,但对于数据收集和分析来说,在自己的机器上运行往往 更快、更便宜、更安全。
接下来有什么计划?
- 目前仅支持 Windows / Mac 桌面。
- 有用户要求做浏览器扩展版 —— 那会很酷,但风险更大(Reddit 更容易检测到)。
如果你在做 Reddit 营销或需要数据进行研究,试试看吧。发现 bug 或有功能想法?在评论里告诉我 —— 我正在积极开发中。
祝抓取愉快! 🚀