我厌倦了 Reddit 的 API 定价,于是我构建了一个本地爬虫(且免费)

发布: (2025年12月17日 GMT+8 14:57)
5 min read
原文: Dev.to

Source: Dev.to

还记得 2023 年 Reddit 通过 API 定价变动把第三方应用砍掉的事吗?是的,那真是糟心事。

快进到 2025 年,我仍然感同身受。我是一个独立开发者,想在 Reddit 上为我的 SaaS 找到早期用户。官方 API 的费用是 每 1,000 次请求 $0.24,听起来很便宜,直到你意识到抓取 300 条帖子就需要 300+ 次 API 调用。每天做几次的话,仅基础数据访问就要 每月 $50–100

“聪明”的做法是什么?付费使用像 Brand24 或 Hootsuite 这样的 SaaS 工具。它们的费用是 每月 $49–99,而且使用共享的云 IP,Reddit 的机器人检测系统很容易把它们标记为违规。

我陷入的循环

  • 手动滚动 → 疲惫
  • 云工具 → 账号被封
  • 官方 API → 昂贵

于是我在一个周末怒砍代码,搞出了一个解决方案。

“本地优先”方案

我打造了 Reddit Toolbox —— 一个免费桌面应用,运行在你的机器上(Windows / Mac)。

核心洞察: 只要看起来像普通用户,Reddit 就不会封禁你。云爬虫使用数据中心 IP,容易被检测。你的家庭 Wi‑Fi 呢?完全没问题。把爬虫本地运行,就能规避 SaaS 费用和封禁风险。

功能

1. 无 API 的批量抓取

输入 subreddit 名称,点击 “scrape”,几秒钟即可抓取 300+ 条帖子。无需 API 密钥。没有配额。仅仅是原始 HTML 解析。

2. “低竞争”过滤器

设置 “最大评论数: 5”,即可立刻看到 OP 提出问题但还没人回答的帖子。非常适合营销——你的回复真的会被看到。

3. 用户提取

从这些帖子中,工具会抓取最活跃的用户、他们的 karma、账号年龄以及他们常去的其他 subreddit。帮助你在私信任何人之前先对受众进行画像。

4. Google 索引检查器

回复前,复制帖子标题并搜索 site:reddit.com "thread title"。如果还没被 Google 收录,就跳过——没有搜索流量的帖子没必要评论。

5. AI 辅助回复

如果你懒得动手,可以使用自己的 OpenAI/Claude API 密钥让它生成回复草稿。你仍然可以编辑输出,但总比面对空白文本框要好。

整个过程在本地运行,Reddit 看到的是家庭 IP 按正常人类速度发出的请求。自从我改用本地方式后零封禁

定价 – 免费层 & 高级版

  • 免费层: 每天 15 次抓取 —— 对大多数用户足够。
  • 高级版: $9 /月,提供无限抓取 + CSV 导出。

我为自己做的工具,现在免费分享给所有厌倦 “一切都要订阅” 模式的人。

获取地址:https://www.wappkit.com/reddit-toolbox

“本地优先”运动

这个项目让我意识到,我在云工具上花了太多冤枉钱,而这些完全可以在本地运行。

云工具本地替代方案
Notion($10/月)Obsidian(免费,本地 markdown)
Airtable($20/月)SQLite(仅一个文件)
Brand24($99/月)Reddit Toolbox(免费)

我并不是说云工具不好,但对于数据收集和分析来说,在自己的机器上运行往往 更快、更便宜、更安全

接下来有什么计划?

  • 目前仅支持 Windows / Mac 桌面。
  • 有用户要求做浏览器扩展版 —— 那会很酷,但风险更大(Reddit 更容易检测到)。

如果你在做 Reddit 营销或需要数据进行研究,试试看吧。发现 bug 或有功能想法?在评论里告诉我 —— 我正在积极开发中。

祝抓取愉快! 🚀

Back to Blog

相关文章

阅读更多 »